Description
Day 1, 10:40 ~ 11:25
Abstract
聽眾可以透過本講題更了解: 如何以 Python 套件進行資料前處理與轉換、特徵篩選、建構 GBDT分類器、長短期記憶模型(LSTM) 架構。過程中使用套件將在有限時間內聚焦介紹 pandas, multiprocessing, GBDT(xgboost/lightgbm), tensorflow.Keras,並比較兩種模型成效數據。 本講題分享應用案例:透析用低血壓預測模型研究。透析用低血壓是末期腎臟病病患在進行血液透析時,最常見的併發症問題;若不即時處理,嚴重將導致各種心血管、大腦的合併症狀。而現況限制是血壓儀器的測量頻率最高只能每 30 分鐘一次,存在量測前就發生低血壓的風險;『因此提前預測下一次量測時是否發生低血壓,將有助於醫護人員提前注意該病患狀況。』 本研究目標為預測該病患下次量測是/否會出現低血壓,為二元分類問題,搭配特徵篩選找出較佳模型:lightGBM (AUC: 0.954)、LSTM (AUC: 0.966),最終使用 Blending Ensemble 得到最佳模型 (AUC: 0.975, Sensitivity: 0.942, Specificity: 0.88)。
Description
為什麼選擇 Python 為開發語言 Python 做為物件導向語言設計上的簡短、簡潔、易讀性 Python 無需重新編譯程式即可偵錯 內建資料處理函式庫,及大量的機器學習算法函式庫,從自然語言處理、影像處理、語音處理、深度學習/機器學習模型框架、科學運算、到視覺化 根據 IEEE Spectrum (電機電子工程師學會) 調查,Python 是 2020 年度工程師使用的語言中排名第一,在 Stack Overflow 的語言使用趨勢也顯示 Python 是近五年來上升幅度最高,且在 2018 超過 JavaScript 成為第一。
Slides not uploaded by the speaker. HackMD: https://hackmd.io/@pycontw/2021/%2F%40pycontw%2FByhqZgKfK
Speaker: JiunYi Yang
鈞宜於廣告科技新創 Tagtoo AD 服務逾2年,擔任資料分析師/資料科學家與廣告管理優化師,對電商數據分析、網站用戶行為建模、數位廣告運作概念及優化邏輯都有超過1年以上經驗。 執行專案「電商廣告新客成本優化:用戶路徑詞向量K-Means分群」曾獲 2019 數位奇點獎銅獎。擅長 Python, SQL, EXCEL, GA, GTM, Data Studio, Tableau。 將於2021/06取得政大資管碩士,成績前20% (GPA 4.2),論文與電商用戶行為分群分析相關,研究對象為阿里巴巴天貓用戶行為及菜鳥網絡物流運送流程對用戶滿意度影響。 其他專案則有與翔安生醫合作發表血液透析中低血壓預測模型,較目前醫學界論文提出模型成效提升10-15%以上。今年上半年的夢想為上一次PyCon TW分享!