對于少數基因變異,人們找出了它們與疾病的關聯。比如BRCA1和BRCA2基因上的一些突變與升高乳腺癌和卵巢癌的風險有關,于是人們可以根據基因測序結果采取預防和治療的手段。
然而,對于絕大部分已識別的基因變異——超過98%,我們還不清楚變異意味著什么:是會影響基因功能,導致疾病?還是不會對健康造成影響,無需擔心?
![]()
圖片來源:123RF
頂尖學術期刊《自然》今日在線發表的一篇研究論文中,來自哈佛醫學院和牛津大學的科研人員合作展示了他們開發的一款人工智能(AI)模型。對于人類的基因變異是否意味著疾病,這款AI具有非凡的判斷能力。
它不僅預測出了3200多個疾病相關基因中的3600萬個致病突變,并且為256000個至今意義不明的基因突變是“致病”還是“良性”做出歸類。研究人員希望,借助這款AI的預測,未來醫生將可以更準確地診斷和治療疾病。
![]()
這款AI使用一種復雜的機器學習,先檢測了數十萬來自其他物種的基因變異模式,然后根據自行學習歸納的結果,預測人類基因變異的含義。
研究人員解釋說,演化傾向于保留一些對于生存十分重要的特征,這些特征在不同物種中共享,因此重復出現在不同物種中的氨基酸序列是一個重要的生物學標志,表明這種高度保守的序列一旦改變可能與疾病有關。而這款AI通過對這些序列變異在不同物種中的分布進行建模,學會預測哪些序列可能導致疾病。
▲這款AI的建模策略:對于每種蛋白質,都會比較它在多個物種中的序列數據(圖片來源:參考資料[1])
由于綜合了進化上很多其他物種的線索,研究人員將這款AI命名為Evolutionary model of Variant Effect,簡稱EVE。
經過2.5億個蛋白質序列的訓練后,EVE開始預測單個氨基酸變異會帶來什么后果。為了確定EVE的預測是否準確,研究人員用意義明確的一些人類基因突變進行了檢驗,發現EVE給出的評分結果與臨床數據非常一致。
研究人員將EVE應用于3219個疾病相關的人類基因,這些基因上出現的不同突變有一些是致病性的,還有一些是良性的。在與其他一些依據不同模型的工具進行比較后,研究人員說,EVE有著明顯更高的預測準確性。
更嚴格的檢驗來自于實際臨床實驗,這是用于評估基因突變如何影響生理功能的金標準。研究團隊選擇了5個基因,包括BRCA1,TP53,PTEN,MSH2和SCN5A,這些基因經過充分的研究,已知其中一些變異與各種形式的癌癥、心律失常等疾病相關。而EVE通過計算得到的預測結果與臨床實驗中的疾病風險結果有很大的重疊。
![]()
▲對幾種疾病相關基因的不同變異是否具有致病性,EVE的計算預測結果(左側)與實際臨床實驗結果(右側)接近(圖片來源:參考資料[1])
研究人員指出,EVE的預測有一個顯著的優勢是,對于基因變異它并非給出一個非黑即白的判斷結果,而是會顯示一個連續的分數。“這種突變意味著我的小拇指會痛,還是明天就會死?連續評分對于預測致病性高低非常重要。“研究作者Debora Marks教授解釋說。
此外,這款AI在對每個基因變異給出預測分數時,還會提供一個置信度分數,告訴使用者——比如臨床醫生,在多大程度上可以相信EVE的判斷。
展望未來,研究人員希望把AI對遺傳變異的新認識轉化為對臨床醫生的幫助。他們強調,EVE本身不是一種診斷測試工具,但它的計算能力可以增強現有的臨床工具,幫助遺傳學家和醫生做出正確的診斷、預后和治療決策,根據某些致病基因突變的存在來選擇更精確的治療方法。
“我們相信我們的方法可以用作當前臨床評估的附加工具,并提供一種強大的新方法來減少不確定性和明確決策,尤其是在臨床環境中,”Marks教授認為。
參考資料:
[1] Jonathan Frazer et al., (2021) Disease variant prediction with deep generative models of evolutionary data. Nature Doi: https://doi.org/10.1038/s41586-021-04043-8
[2] All about Eve. Retrieved Oct. 27, 2021 from https://www.newswise.com/articles/all-about-eve?sc=rsla








