八月中旬的一個星期六早上,亞歷克斯·納卡(Alex Naka)在女友的廚房裡開始了他所說的“小型黑客馬拉松”。在他的筆記型電腦、一些咖啡以及大約 80 個基於雲端的人工智慧 (AI) 處理器的支持下,他生成了數十種電腦工程蛋白質,旨在阻斷在某些腫瘤中發生突變的細胞受體。埃文·卡拉威 Ewen Callaway發表在最新一期權威期刊《自然》(Nature)的<人工智慧發明了一系列新蛋白質。它們中的任何一個真的有效嗎?>( AI has dreamt up a blizzard of new proteins. Do any of them actually work?)指出,新興的蛋白質設計競賽旨在從幻想中篩選出功能性的東西。但研究人員希望真正的獎項將是該領域的革命。(Emerging protein-design competitions aim to sift out the functional from the fantastical. But researchers hope that the real prize will be a revolution for the field.)納卡(Naka)平日是加州阿拉米達一家醫療技術公司的蛋白質工程師,他將自己的十種最有前途的創作投入到一項新發起的蛋白質設計競賽中,並看著它們登上了排行榜的榜首。
化學諾貝爾獎頒給了預測蛋白質結構的 AlphaFold AI 的開發者
該競賽由瑞士洛桑一家名為 Adaptyv Bio 的生技新創公司舉辦,是過去一年左右至少舉辦的五場競賽之一。大多數參加比賽的人都使用人工智慧工具,例如 AlphaFold和受聊天機器人啟發的“蛋白質語言模型”,這些工具的受歡迎程度和影響力都呈爆炸式增長。其中一些工具背後的三名研究人員因其努力而獲得了今年的諾貝爾化學獎。這些榮譽部分來自於人們希望新創造的蛋白質可以用作更有效的藥物、工業酶或實驗室試劑。
但科學家表示,設計蛋白質的繁榮大多造成了混亂。人們生產它們的速度比在實驗室中製造和測試它們的速度要快,因此很難判斷哪些方法真正有效。
它將推動該領域向前發展,並更快地測試方法
競賽在過去推動了關鍵的科學進步,特別是在蛋白質結構預測領域。這項最新的競賽透過降低進入門檻吸引了世界各地的人們進入蛋白質設計的相關領域。它還可以加快驗證和標準開發的步伐,或許有助於培養社區。西班牙巴塞隆納基因組調控中心的計算生物學家 Noelia Ferruz Capapey 表示:“它將推動該領域向前發展,並更快地測試方法。”
但科學家表示,比賽必須克服一些障礙,例如確定要解決哪些問題以及如何客觀地選擇獲勝者。正確使用公式很重要。德國慕尼黑工業大學的計算生物學家 Burkhard Rost 表示,如果執行不當,「這些競賽可能會對某個領域造成傷害」。
設計具競爭力
蛋白質設計競賽的部分靈感來自於一項已有 30 年歷史的競賽,該競賽幫助開啟了生物人工智慧的革命。自 1994 年以來,結構預測關鍵評估 (CASP) 一直向科學家提出挑戰,要求他們根據胺基酸序列預測蛋白質的 3D 形狀。該競賽由馬裡蘭大學羅克維爾分校的計算生物學家 John Moult 和加州大學戴維斯分校的計算生物學家 Krzysztof Fidelis 創辦,透過將計算預測與未發表的結構模型進行比較來確定獲獎者。
2018 年,總部位於倫敦的 DeepMind(現為 Google DeepMind)憑藉其首個版本的蛋白質結構預測工具AlphaFold贏得了 CASP 。它的下一個迭代 AlphaFold 2在 2020 年表現非常出色,以至於 Moult 宣布預測簡單蛋白質結構的問題已基本解決。此後,競賽將重點轉向其他新興挑戰,例如預測複合物中多種相互作用蛋白質的結構。
人工智慧工具正在設計可以改變醫學的全新蛋白質
現在,許多人希望這些競賽能推動蛋白質設計領域向前發展,就像 CASP 幫助推動蛋白質結構預測的革命一樣。 「如果沒有 CASP,就不會有 AlphaFold,」Rost 說。 “我們需要這些競賽來做好工作並激勵人們。”
六月,羅斯特和他的幾位同事贏得了由國際開放科學非營利組織 Align to Innovate 舉辦的蛋白質工程錦標賽。此次活動包括兩個部分。首先,參與者試圖預測不同酵素變異體的特性。隨後,本輪表現最好的團隊重新設計了一種分解澱粉的酶,最佳設計由實驗室實驗確定。 2025 年的錦標賽目前正在進行中。
冬季蛋白質設計遊戲競賽由加拿大基奇納的一家生物技術公司 Liberum Bio 和 Rosetta Commons 舉辦,該競賽主要由維護蛋白質建模工具的學術科學家組成。該競賽要求參賽者重新設計現有的蛋白質(一種廣泛用於蛋白質純化的植物病毒酶),以提高該分子的效率。
另外兩項競賽則要求參與者提出全新的蛋白質。 Adaptyv 一直在尋找能夠附著在稱為 EGFR 的生長激素受體上的蛋白質,這種受體在許多癌症中過度活躍。 90 名參賽者提交了 700 多個設計。
在 Bits to Binders 計畫中,研究人員正在競相創造可用於 T 細胞癌症治療的小蛋白質。該計畫由德克薩斯大學奧斯汀分校研究生領導的 BioML 協會運營,吸引了來自 42 個國家(包括尼日利亞、哥倫比亞、伊朗和印度)的 64 支團隊。目前約有18,000 種設計正在接受測試,結果將於2025 年初公佈。 “我們對投票結果感到非常驚訝,”聯合組織者、該大學生物化學博士生剋萊頓·科索諾基(Clayton Kosonocky) 說。
自由蛋白質設計師將爭奪公司、學術實驗室的機構所設置的賞金
Adaptyv 執行長兼聯合創始人朱利安·恩格勒特 (Julian Englert) 表示,該競賽的許多參與者都從事蛋白質工程和設計工作。然而,該競賽也收到了來自沒有生物學專業經驗的人的有希望的參賽作品。一名來自伊朗的參賽者使用遊戲電腦做出了預測,因為他無法使用更強大的系統。
恩格勒特說,來自非知名研究人員的高品質條目讓他想起了蘋果、微軟和其他科技巨頭的車庫修補起源。 「他們需要兩年的學習和加入實驗室才能達到入門的程度。在這裡,他們只需一個週末就能完成。他想像了一個未來,自由蛋白質設計師將爭奪公司、學術實驗室和其他尋求客製化分子的機構所設置的賞金。
「整個蛋白質宇宙」:人工智慧預測幾乎所有已知蛋白質的形狀
比賽還可以透過其他方式節省時間。從競賽組織者那裡快速獲得實驗結果是慕尼黑工業大學機器學習科學家 Michael Heinzinger 的一大動力,他是羅斯特獲勝團隊的一員。 「否則我們就不得不花時間來寫一筆贈款,」他說。 “對我來說,獎勵就是節省時間。”
就實際獎勵而言,「調整創新」錦標賽沒有提供獎勵,但其他一些錦標賽提供了獎勵。 Bits to Binders 的獲勝者將獲得一個 3D 列印的設計獎杯,以及來自正在進行實驗的生物技術公司(位於明尼蘇達州伊根的 LEAH Laboratories)的一些商品。也會有合作的機會。
Adaptyv 銷售由蛋白質設計師創建的分子的自動化實驗室測試,提供了一些免費實驗和一些自己的贈品。羅塞塔冬季奧運會的獲勝者將瓜分 5,000 美元。
但最引人注目的是最近啟動的 Evolved 2024 競賽,其中第一名團隊將獲得 25,000 美元的 Amazon Web Services 積分,以及來自其他公司(包括 OpenAI)的價值數千美元的積分。其贊助商包括紐約市的創投公司 Lux Capital,已向科技公司投資了超過 15 億美元,以及同樣位於紐約市的生物人工智慧新創公司EvolutionaryScale ,已吸引了 1.42 億美元的投資。
選擇誰將獲得這些回報並不總是那麼簡單
選擇誰將獲得這些回報並不總是那麼簡單。 Evolved 2024 競賽更像是一場黑客馬拉松,參賽團隊致力於解決預測藥物功效和安全性等粗略問題,將由專家小組進行主觀評判。但即使對於具有更明確蛋白質設計目標的競賽,“找出誰獲勝也不是一件容易的事”,生物工程師兼 Align to Innovate 創始人 Erika DeBenedictis 表示。她的組織的錦標賽根據設計的活性、穩定性以及設計的好壞(甚至是否可以)來衡量設計。 「當你設計一種蛋白質時,它可能會以多種方式失敗,」她說。
科學家表示,如果競賽要推動蛋白質設計,就需要解決更廣泛領域正在應對的挑戰。與結構預測不同,蛋白質設計對於不同的任務可以有截然不同的標準。製造特定類型酵素的方法可能無法轉化為其他蛋白質,例如疫苗成分。
AlphaFold 和人工智慧蛋白質折疊革命的下一步是什麼
羅斯特警告說,如果比賽讓整個領域陷入困境,例如,對設計的評判過於狹隘,那麼比賽可能會適得其反。威斯康辛大學麥迪遜分校的計算生物學家 Anthony Gitter 表示,如果參賽者對自己的方法保持沉默,研究人員可能無法從蛋白質設計競賽中獲得全部好處。 “如果團隊不交流他們的方法,就沒有太多機會了解哪些有效,哪些失敗。”
到目前為止,這似乎還沒有發生。大多數競賽鼓勵甚至要求參與者描述他們的方法。吉特說,這些競賽也有助於將一些對蛋白質設計感興趣的不同領域聚集在一起——從開創蛋白質工程方法的生物化學實驗室到在自然語言處理領域嶄露頭角的機器學習科學家。 “組織比賽的人為了在這個領域產生最大的影響,應該認真思考如何創建一個社區。”
黑客馬拉松描述為「2 類樂趣」
當 Adaptyv 競賽結果在 9 月下旬公佈時,Naka 感到失望。儘管他的所有十件作品看起來都很強大,但他的設計沒有一個在實驗室中有效。在經過測試的 147 種設計中,只有 5 種實際上與目標分子結合。其中50多個甚至無法製造。
這其實還不錯:過去設計 EGFR 結合劑的努力的成功率要低得多。 「這是蛋白質工程課程的標準——你必須做好經常失敗的準備,」Naka 說。獲獎者是洛桑瑞士聯邦理工學院 (EPFL) 的結構生物學家 Martin Pacesa 和 Lennart Nickel,他們發布了一份預印本,描述了他們的方法,並將其代碼開源(M. Pacesa等人。
Naka 希望他早點開始創作他的作品。他將他的黑客馬拉松描述為「2 類樂趣」——當時很痛苦,但回想起來卻很愉快。透過比賽,他與志同道合的科學家建立了聯繫,其中包括吉特。 「感覺它降低了進入門檻,讓很多新人參與蛋白質設計,」他說。 “以後類似的活動我肯定還會參加。”