研發服務平台亮點成果獎─佳作獎
亮點成果:結合量子化學與人工智能技術推動材料與化學設計的創新突破
使用平台:國家高速網路與計算中心「台灣杉三號超級電腦」
一張長長的黑色實驗桌,架上擺滿了各種化學藥劑,研究者身著實驗白袍,專注地將各種藥劑混合後,仔細觀察接下來的反應過程,記錄實驗結果並分析數據,接著修正實驗方式,不斷重複著以上的過程。這樣的傳統化學實驗場景,其實正在發生改變。
過去化學家為了找到具有特定性質的化學分子,往往需要鍥而不捨,進行漫長且昂貴的實驗,經歷種種的失敗與修改後,才有機會找出可能帶來變革的實驗成果。隨著人工智慧(AI)的崛起,機器學習已然成為化學家的重要研究工具,以前所未有的速度將原本耗時耗力的試誤過程,逐漸轉變為精準的「預測」。
從量子力學到機器學習
國立臺灣大學化學工程學系副教授李奕霈分享,傳統在研究化學反應時,通常是透過量子力學來描述並模擬化學反應系統,「化學反應牽涉到化學鍵的斷裂與生成,本質上是電子分佈的重新排列。量子力學透過波函數描述電子在空間與能量上的狀態,為理解反應過程提供理論基礎。」使用量子力學的好處,在於它能算出反應必須跨越的能量障礙,從而判斷反應進行的難易程度以及快慢。
然而在現實中,化學反應系統往往比想像中複雜得多,例如引擎中油料的燃燒過程,就可能會牽涉到上千種化學反應同時發生,且彼此容易互相影響。假使研究人員將這類化學反應簡化成僅有數種化學反應,模擬結果就很可能會產生誤差。除此之外,「精確的量子力學計算非常耗時,即使使用高速電腦,也難以直接模擬上千種的化學反應式。」
因此李奕霈選擇結合機器學習方式,透過數據庫來訓練模型學習分子性質及化學反應趨勢,進而能夠更有效率地描述化學系統。透過量子力學累積精確數據,用機器學習加快模擬過程,彼此相輔相成。最終目標是以模擬取代部分實驗步驟,確保在有限資源下能高效率地完成化學設計。
不過,李奕霈指出,在化學領域中運用機器學習並非易事,因為要訓練出一個優秀的機器學習模型,往往需要大量的數據,但高品質的化學數據卻極為珍貴。如此一來,數據量的不足,是應用機器學習的最大挑戰之一。
針對這項問題,李奕霈團隊發展出量子化學計算輔助的圖神經網路(QM-GNN),針對化學結構的重要特性進行計算,例如化學分子的電荷分佈、能階等性質。藉由計算出這些特性,將數據輸入機器學習模型,就能使模型在有限數據下更有效率地學習化學特性,「比如一個人學騎機車,從零開始學很辛苦,但要是他已經學會怎麼騎腳踏車,學習過程就會快很多。」透過這樣的研究成果,可望幫助科技業、化工業等產業,找出符合需求的特定材料。
李奕霈透過電腦模擬,精準設計出符合需求的化學分子
讓不確定性成為研究助力
另一項AI在化學領域遭遇到的挑戰,是不確定性量化。李奕霈希望讓AI不僅提供答案,甚至是在AI模型對於某些不確定的預測結果時,能夠確實坦承結果的不確定性。
當我們使用如ChatGPT、Gemini等大型語言模型時,常會遇見所謂的「AI幻覺」,意即AI的回饋結果中出現了看似合理,實則不符合事實、無關或假造的訊息,例如查詢某項科學描述是否有相關研究文獻可提供佐證時,AI會提供乍看可點擊的連結,實際點入後卻會顯示網頁不存在的情況;甚至在AI用於彙整新聞訊息時,會出現憑空捏造的細節等。這類AI幻覺可能會嚴重影響到AI模型的準確度與可靠度,造成後續研究的偏誤。
同樣地,在化學研究中,由於數據往往不足,機器學習模型也容易出現不可靠的預測。因此,如何讓模型在面臨高不確定性時「坦承」自己的信心不足,就像避免語言模型的幻覺一樣關鍵。李奕霈因此建構出可解釋的AI不確定性量化(XAI-UQ)模型,能指出在哪些條件下,模型預測的不確定性會較高,並提供誤差範圍等重要參考資訊,幫助研究團隊更有效評估實驗設計的方向。
運算資源造就AI模型高度
無論是從事量子力學計算或是AI模型訓練,高效能運算資源對李奕霈實驗室是不可或缺的要素。自2019年回到臺大任教後,李奕霈便開始與國家高速網路與計算中心(簡稱國網中心)合作,國網中心所提供的超級電腦,能夠有效支援李奕霈使用量子力學中的密度泛函理論(DFT),深入了解包括金屬有機框架(MOF)等材料中的化學反應機制,同時藉由充足的GPU運算資源,幫助研究團隊進行大量的機器學習建模,大大降低了研究成本。
除了運算資源外,李奕霈也感謝國網中心研究人員莊朝鈞、陳南佑等人的協助,對於團隊研究計畫的推展,不僅提供實驗室堅實的研究基礎,更在大型語言模型、量子運算等跨領域專業上給予支援,讓實驗室學生能夠彼此交流、成長,進而衍生出創新突破。
李奕霈表示,未來團隊會持續透過推陳出新的AI工具,探索新的研究方向。他非常榮幸能獲得本屆國家實驗研究院研發服務平台亮點成果獎的肯定,希望能夠藉此成果,讓更多社會大眾了解科學家的研究內容,並持續推動臺灣學術界發光發熱。
國網中心對於李奕霈團隊研究計畫的推展,不僅提供實驗室堅實的研究基礎,更在大型語言模型、量子運算、力學等跨領域專業上給予支援