此前,曾獲戈登·貝爾獎的創新解決方案,其實是基於量子力學生產數據,AI學習這些數據,學完後大規模模擬。如今,這個範式已經普及,量子力學生產的數據越來越多,多到已經幾乎要覆蓋整個元素周期表。這使得這樣一個領域也具備了走向預訓練模型的數據基礎。
“3年前,我們就想做這件事情,但是時機不成熟,原因是數據基礎不到位,現在做其實是最合適的。從社區生態上,從模型和數據的發展上,乃至從整個技術趨勢上來看,這樣的一個預訓練模型也是呼之欲出的。”張林峰曾說,“應該用全新視角定義當下該做的事情”,在他看來,這件事很顯然也屬於當下該做的事情。
在其他領域,GPT的迭代周期都比較長,但張林峰認為在分子模擬這個領域也許走得會更快,應用落地的深度也更深,這是他和團隊今年格外要解決的重點問題。
目前,科學計算的瓶頸在於算法面臨“維度災難”的問題,即難以表示和難以有效地處理高位複雜的函數和大規模的複雜數據。幸運的是,AI有望助力解決科學計算中的“維度災難”,將不同尺度的物理模型有效連接起來。
AI向前發展有其自身規律。張林峰說,我們要做的就是借鑒AI的客觀發展規律,無論是技術側還是產業側的一系列發展特點,去反思我們的技術體系。
他舉例說,過去人們曾質疑AI落地的效果,其實把前人在不同應用場景的經驗整合起來,去“翻譯”好我們的場景,比如工業軟件這樣的場景,需要啟蒙。深勢科技兼具了翻譯者、啟蒙者以及最後從頂層創新到落地的角色。
|