
在冠狀病毒大流行的早期,一些研究人員、創業公司和機構開發了人工智能系統,他們聲稱可以從一個人的咳嗽聲中診斷出COVID-19。當時,我們自己對人工智能的前景充滿熱情,認為它可以作為對抗病毒的武器;在一個標題中,我們贊同咳嗽診斷人工智能是"有希望的"。
但是最近的一項研究表明,一些咳嗽分析算法沒有我們--以及公眾--所相信的那么準確。它是醫療領域機器學習技術的一個失敗案例,并且其缺陷并不總是立即顯現。
來自艾倫-圖靈研究所和皇家統計學會的研究人員受英國衛生服務機構委托,對基于音頻的人工智能技術作為COVID-19篩查工具進行了獨立審查。他們與來自牛津大學、倫敦國王學院、倫敦帝國學院和倫敦大學學院的成員一起發現,即使是最準確的咳嗽檢測模型,也比基于用戶報告系統和人口數據(如年齡和性別)的模型表現更差。
"其含義是,許多應用程序使用的人工智能模型在用戶報告的癥狀所提供的預測準確性之外,幾乎沒有增加任何價值,"該報告的共同作者在一次電子郵件采訪中表示。
在這項研究中,研究人員檢查了通過國家衛生服務機構的測試和跟蹤以及REACT-1項目招募的6.7萬多人的數據,該項目要求參與者將COVID-19的鼻咽拭子測試結果以及他們咳嗽、呼吸和說話的錄音寄回。利用這些錄音和測試結果,研究人員訓練了一個人工智能模型,試圖了解咳嗽是否可以作為一個準確的生物標志物。
最終,他們發現人工智能并不能做到這一點,在控制混雜因素的情況下,人工智能模型的診斷準確性并不比機會好多少。
部分原因是"測試與追蹤"系統的招募偏見,該系統要求參與者至少有一個COVID-19癥狀才能參加。但該研究的主要作者、艾倫-圖靈研究所健康和醫學科學項目主任克里斯-霍姆斯教授說,研究結果顯示,咳嗽在總體上對COVID-19的預測效果不佳。
"令人失望的是,這項技術對COVID-19不起作用,"他在一份電子郵件聲明中表示,"找到新的方法來快速和容易地診斷像COVID-19這樣的病毒對阻止它的傳播真的很重要"。
這項研究對富士通的"Cough in a Box"等商業努力是一個打擊,該應用由英國衛生和社會保健部資助,用于收集和分析COVID-19癥狀的音頻記錄,它的一些科學主張一開始就受到懷疑。麻省理工學院的研究人員共同撰寫的一篇論文將分析COVID-19咳嗽算法的準確率定為98.5%,回想起來,這個百分比似乎高得令人懷疑。
這并不是說圖靈研究所的研究是有關COVID-19的咳嗽檢測的最后結論,霍姆斯留下了一種可能性,即該技術在未來可能適用于其他呼吸道病毒。
但這并不是第一次醫療保健人工智能的過度承諾和交付不足。2018年,STAT報道說,IBM的Watson超級計算機吐出了錯誤的癌癥治療建議,這是對少數合成病例進行訓練的結果。在最近的一個例子中,2021年對醫療系統供應商Epic識別敗血癥患者的人工智能算法的審計被發現錯過了近70%的病例。







