發(fā)展階段層面,《展望》指出,按照行業(yè)整體需要解決的問(wèn)題,可以把 AI for Science 的歷史和未來(lái)十年可預(yù)見(jiàn)的發(fā)展大致分為三個(gè)時(shí)期:以科學(xué)家為主導(dǎo)的“概念導(dǎo)入期”(2016-2021)、以科學(xué)家和工程師協(xié)作為標(biāo)志的“大規(guī)模基礎(chǔ)設(shè)施建設(shè)期”(2021-2026),和以工程師為主導(dǎo)的“成熟應(yīng)用期”(2026 年及以后),三個(gè)時(shí)期的演進(jìn)也是人們對(duì) AI for Science 開(kāi)發(fā)程度不斷加深、使用范圍不斷擴(kuò)大的過(guò)程。
AI for Science 的發(fā)展不僅取決于 AI 算法的應(yīng)用,還取決于大量經(jīng)典算法的改進(jìn)和提升。算法迭代層面會(huì)經(jīng)歷從“簡(jiǎn)單模擬”到“智能化搜索”3 個(gè)階段:1.0 階段的關(guān)鍵詞是“模仿”,即基于實(shí)驗(yàn)的思路,在實(shí)驗(yàn)基礎(chǔ)上進(jìn)行簡(jiǎn)單的外推和擴(kuò)大;2.0 階段的關(guān)鍵詞是“預(yù)測(cè)”,即有邊界地預(yù)測(cè),有明確、可驗(yàn)證的置信區(qū)間;3.0 階段的關(guān)鍵詞是“搜索”,即算法可以非常準(zhǔn)確的對(duì)真實(shí)場(chǎng)景進(jìn)行建模,并在此基礎(chǔ)上根據(jù)特定需求設(shè)計(jì)并返回所需結(jié)果。
《展望》指出,目前正處于 2.0 階段,未來(lái)幾年內(nèi) AI for Science 的相關(guān)領(lǐng)域都將會(huì)完成 2.0 階段的算法升級(jí),而后將逐漸進(jìn)入到智能化設(shè)計(jì)的 3.0 階段,最終實(shí)現(xiàn) AI for Science 廣泛普及。
圖|AI for Science 的相關(guān)要素(來(lái)源:2023 版《AI4S 全球發(fā)展觀察與展望》)
AI for Science 的發(fā)展既包含 AI 行業(yè)的要素,也包含科學(xué)領(lǐng)域的要素,更需要來(lái)自產(chǎn)業(yè)和公共管理側(cè)的發(fā)展要素,所有這些要素相互交織影響,共同促成 AI for Science 發(fā)展的正反饋。
近十年來(lái),AI 的強(qiáng)大之處大家有目共睹,但其“黑箱”屬性也向來(lái)被學(xué)界詬病,即能知其然卻不能知其所以然。《展望》指出,由于 Science 本身的客觀存在性,將 Science 與 AI 融合為 AI 提供了絕佳的“驗(yàn)證”步驟,讓 AI 在特定領(lǐng)域內(nèi)能產(chǎn)出“可解釋”的成果,而這不亞于為人類(lèi)發(fā)現(xiàn)新的科學(xué)原理。
而在科學(xué)領(lǐng)域,從“數(shù)據(jù)”中可以提煉出經(jīng)驗(yàn)性“原理”,亦可以使用“原理”來(lái)仿真模擬出“數(shù)據(jù)”,因此“數(shù)據(jù)”和“原理”在一定程度上能夠接近無(wú)損轉(zhuǎn)化。
圖|AI for Science 系統(tǒng)工程(來(lái)源:深勢(shì)科技)
AI for Science 在模型驅(qū)動(dòng)和數(shù)據(jù)驅(qū)動(dòng)深度融合的過(guò)程更像是一個(gè)系統(tǒng)化的工程,不僅需要原理層面的創(chuàng)新,也需要從基礎(chǔ)設(shè)施、產(chǎn)品、場(chǎng)景交互的全方面變革,各個(gè)場(chǎng)景可能都需要龐大的團(tuán)隊(duì)來(lái)支撐和完成,同時(shí)這也意味著巨大的空間和機(jī)會(huì)。
AI4S 在多個(gè)領(lǐng)域的產(chǎn)研實(shí)踐
新版《展望》著重介紹了 AI for Science 在生命科學(xué)、材料科學(xué)、能源、半導(dǎo)體、地球與環(huán)境等眾多領(lǐng)域及細(xì)分領(lǐng)域的產(chǎn)研實(shí)踐。整體而言,在具體的實(shí)踐中,如何更好地構(gòu)建 AI-Science 之間的紐帶是核心的創(chuàng)新點(diǎn),而這在不同的科學(xué)場(chǎng)景中其思路也不盡相同。
生命科學(xué)領(lǐng)域,在過(guò)去的十余年間,大量基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的理解基因調(diào)控的方法被開(kāi)發(fā)出來(lái),AI 在驅(qū)動(dòng)藥物研發(fā)和個(gè)性化醫(yī)療中取得新突破。如今,AI 正在藥物研發(fā)、疾病篩查、生物學(xué)機(jī)制研究等方面發(fā)揮著越來(lái)越重要的作用,未來(lái),隨著 AI 的滲透,很多疾病的通路和影響因素將不再神秘,最終有望介導(dǎo)人類(lèi)健康乃至整個(gè)生命科學(xué)領(lǐng)域的系統(tǒng)進(jìn)步和重大突破。
圖|藥物研發(fā)的主要環(huán)節(jié)(來(lái)源:2023 版《AI4S 全球發(fā)展觀察與展望》)
以藥物研發(fā)為例,新藥開(kāi)發(fā)過(guò)程是個(gè)多環(huán)節(jié)、漫長(zhǎng)且昂貴的流程,每個(gè)環(huán)節(jié)的效率提高都有巨大的商業(yè)價(jià)值。如今,將 AI 與底層生物機(jī)制結(jié)合的新范式(AI for Life Science),正在從底層技術(shù)的突破為整個(gè)行業(yè)注入嶄新活力,帶來(lái)更多機(jī)會(huì)。
在 AI for Life Science 范式下,藥物研發(fā)過(guò)程中的大部分實(shí)驗(yàn)可以像汽車(chē)、飛機(jī)等工業(yè)領(lǐng)域?qū)崿F(xiàn)仿真模擬,通過(guò)計(jì)算手段進(jìn)行測(cè)試和篩選,再通過(guò)真實(shí)實(shí)驗(yàn)進(jìn)一步的驗(yàn)證和篩選,能夠大幅減少真實(shí)實(shí)驗(yàn)帶來(lái)的時(shí)間和經(jīng)濟(jì)成本的消耗。
AI for Life Science 的其他應(yīng)用,比如,當(dāng)今比較熱門(mén)的 CAR-T 細(xì)胞療法,CAR 分子的胞外結(jié)構(gòu)域中識(shí)別抗原的單鏈抗體片段十分重要 ,AI 技術(shù)可被應(yīng)用于學(xué)習(xí)抗體片段規(guī)律,對(duì)抗體親和力或人源化性質(zhì)進(jìn)行預(yù)測(cè)和推薦;再比如,Cas9 是 CRISPR-Cas9 基因編輯技術(shù)的重要組成部分,AI 算法可用于尋找毒性更弱的 Cas9 酶,同時(shí)還可以借助 AI 在酶設(shè)計(jì)中的應(yīng)用,嘗試對(duì)已知的 Cas9 酶進(jìn)行優(yōu)化和改造。
合成生物學(xué)領(lǐng)域,AI for Science 的設(shè)計(jì)與合成生物學(xué)的工程模式相輔相成,共同打造“假設(shè)、構(gòu)建、測(cè)試、學(xué)習(xí)”的閉環(huán)(DBTL),并且還有可能基于自動(dòng)化實(shí)驗(yàn)室利用 AI 對(duì)于實(shí)驗(yàn)的定量設(shè)計(jì)來(lái)反向補(bǔ)充數(shù)據(jù)庫(kù),以及探索更多的規(guī)律,突破理性設(shè)計(jì)的瓶頸。