肯尼思‧凱爾 (Kenneth L. Kehl) 發表在最新一期權威期刊《美國臨床腫瘤學會》(ASCO) 的<樂觀地認為人工智慧將改善病人的治療效果,數據是否顯示它正在使臨床工作更有效率?>( With Optimism That AI Will Improve Patient Outcomes, Does Data Show It Is Making Clinical Work More Efficient?)質問AI真正兌現了減少臨床醫生時間負擔的承諾嗎?
大型語言模型無法識別潛在的緊急問題
人工智慧 (AI) 迅速發展,大型語言模型 (LLM) 的可用性不斷增加,讓醫療保健產業對人工智慧在簡化工作流程同時改善病人治療效果的潛力抱持樂觀態度。
大型語言模型產生的對病人的回覆提供了教育和自我管理內容,但臨床醫生仍然需要審查和編輯回覆,因為在某些情況下,大型語言模型無法識別潛在的緊急問題,這並不能減輕臨床醫生的行政負擔。
總體而言,人工智慧在臨床實踐中的效用將根據臨床醫生和病人實現的傳統效益指標來衡量,持續的研究和合作對於確保人工智慧減少臨床醫生的工作量並改善整體醫療保健體驗至關重要。
AI真正兌現了減少臨床醫生時間負擔的承諾?
人工智慧的快速發展,尤其是大型語言模型的不斷增加,點燃了包括醫療保健在內的各個行業的樂觀情緒。人工智慧在改善病人治療效果、簡化工作流程和減輕管理負擔方面的潛力激發了人們對更有效率、以病人為中心的未來的興奮和希望。儘管人工智慧協助臨床工作可能是一種很有前景的工具,但問題仍然存在:人工智慧是否真正兌現了減少臨床醫生時間負擔的承諾?
最近發表在《科學》雜誌上的一項題為「產生人工智慧對生產力影響的實驗證據」的研究揭示了大型語言模型對一般領域工人生產力的影響。1使用 ChatGPT 協助完成專業寫作任務,將花在任務上的時間減少了 40%,並提高了感知的輸出品質。有趣的是,技能較低的工人獲得了更大的好處,這說明了人工智慧影響高技能認知工作市場的潛力。
臨床醫生的手動審查和編輯仍然至關重要
在醫療保健領域,《柳葉刀數位健康》的另一項研究評估了應用大型語言模型起草對放射腫瘤科醫生病人資訊的回應、這些回應的內容以及臨床醫生對效率影響的看法之間的關聯。大型語言模型產生的回覆更長,更有可能包含教育和自我管理內容以及應急計劃,但不太可能包含對病人的直接指示。儘管如此,臨床醫生的手動審查和編輯仍然至關重要,因為 7.1% 的回覆被認為可能與嚴重病人傷害的風險有關,這主要是因為未能識別潛在的緊急臨床問題。另一項品質改進研究發現,使用大型語言模型來回應病患資訊減少了感知負擔和工作耗竭分數,但並沒有減少花在這項管理任務上的時間。
鑑於行政任務對腫瘤學界普遍存在的倦怠挑戰的貢獻,使用人工智慧抄寫員產生病人進展記錄也引起了相當大的關注。早期數據顯示在文件效率和準確性方面有潛在的好處。儘管如此,對臨床醫生工作量的整體影響仍不清楚。將人工智慧抄寫員整合到現有工作流程中,確保資料安全和隱私,並解決人工智慧演算法中的潛在偏見是可能影響其廣泛採用的關鍵考慮因素。可解釋的人工智慧技術提供給定輸出背後的推理,也可能更容易讓臨床醫生評估,促進實用性和吸收。
儘管對人工智慧提高臨床醫生滿意度和病人治療效果的樂觀態度是有道理的,但批判性評估現有數據並調整期望至關重要。最終,人工智慧在臨床實踐中的效用將根據臨床醫生和病人所實現的傳統效益指標來衡量。隨著人工智慧的不斷發展,技術人員、臨床醫生和醫療保健組織之間持續的研究和合作對於確保新型工具兌現減少臨床醫生工作量和改善整體醫療保健體驗的承諾至關重要。