章節錯誤,點此舉報(免註冊),舉報後維護人員會在兩分鐘內校正章節內容,請耐心等待,並刷新頁面。
與醫院的合作推進後,顧然的團隊開始正式整理真實世界數據(RWE),但很快遇到了數據不統一的問題。
“這些數據的格式太不标準了。”團隊的生物統計師王倩皺着眉,“不同醫院的記錄方式不同,有的患者數據缺失,有的測量指标不一緻,要整理成可用于模型分析的數據集,工作量比預期大得多。”
顧然翻閱着數據,發現确實缺失值過多,如果不經過嚴格篩選,模型的準确性會受到嚴重影響。
程向陽了解情況後,召開了内部會議:“科學研究從來不是一帆風順的,找到突破口才是關鍵。”
顧然思索片刻,說道:“我們可以先篩選高質量數據集,同時用機器學習的方法填補部分缺失值。至于嚴重缺失的部分,可以考慮重新随訪一部分患者。”
王倩點頭:“這個方法可行,雖然增加了一些工作量,但至少能保證數據質量。”
團隊重新調整方案,問題終于找到了解決的方向。
忙碌的研究讓顧然的作息更加不規律,蘇靜很快察覺到他的疲憊。
“你最近是不是又熬夜了?”蘇靜在微信上發來一條消息。
“沒辦法,數據整合遇到點問題。”顧然回複道。
蘇靜思考了一下,回了條消息:“周六有空嗎?我帶你去個地方。”