Nature Communications:美科學家開發自適應性機器學習框架,有效加速新材料研發進程
據近期Nature Communications上的一篇文章所述,美國研究人員基于一種與實驗緊密耦合的信息科學適應性設計,加速了具有目標性能新材料的發現進程。換句話來說,就是利用一個可控性相對較好的實驗數據集,反復引導后續實驗,以發現所需目標性能的新材料。
為了解決新材料的發現逐漸依賴于反復試驗這個問題,他們開發了一個新的框架,即利用不確定性來迭代指導下一個實驗的進行。該項目的工作集中于生成和篩選由成千上萬的量子力學運算組成的數據庫。然而,材料結構的相互作用、化學自由度和微觀結構自由度引入了巨大的復雜性,尤其是涉及到了缺陷、固溶體、非整比化合物和多組分化合物時,就算當前最先進工具也無法設計解決。
該研究比較關注鎳鈦形狀記憶合金,但實際上可以用于任何材料(聚合物、陶瓷或納米材料)和目標屬性(如介電響應,壓電系數或帶隙)。不僅如此,它還可以廣義的優化多個屬性。以鎳鈦合金來說,不僅可以降低損耗,還能將相變溫度優化到只高于室溫幾度。總的來說,利用高性能超級計算資源,該團隊設計了建立在機器學習基礎和設計上的數據驅動框架,有效的加速發現具有目標屬性新材料的進程。
【圖文導讀】
圖一 適應性設計的環形圖
圖中的所指的相關領域知識,包括之前的實驗數據和物理模型,用以描述材料及其相關特性。這些信息應用于機器學習框架,進行包括誤差估計在內的多種預測(統計學推理)。預測的結果用于實驗設計工具(例如全局優化工具箱),以模型的改進和材料的發現為目標,然后建議繼續進行新實驗(材料合成與表征)。最后把結果反饋回數據庫,為下一次迭代循環提供輸入數據。綠色箭頭表示利用實驗或運算技術發展水平的步進式方法環形圖,該法目前鮮有研究證明及反饋。圖中的紅星表示相比于4號樣品,3號樣品即使不是最好的選擇,但由于巨大的不確定性,系統更期望3號樣品進行改進,從而繼續進行下面的實驗和反饋。
圖二 示例合金的設計及其實驗循環示意圖
圖中循環如下:(i)以有著已知熱耗散ΔT、材料特性或材料描述的初始合金數據集作為推理模型的輸入信息 。(ii)模型經多次訓練,并與初始合金數據進行交叉驗證(統計學推理)。(iii)建立一個未知的合金的數據集,定義為所有可能候選合金的全部搜索空間。將(ii)中的訓練模型應用于(iii)中的所有合金,并預測它們的熱耗散ΔT。(iv)選擇四個“最佳”候選合金進行合成和表征。(v)已測ΔT的新合金增加了初始數據集,并進一步優化推理和設計。四個合金的實驗部分采用迭代法,通過推理和設計,可以得到有著每種新預測ΔT的初始數據集,且每個循環后合金的初始數據集將擴大四倍。
圖三?推理和設計組合
本圖顯示了有關鎳鈦形狀記憶合金訓練數據集的回歸量:選擇器組合,以及各個回歸量:選擇器組合的相對性能。橫坐標繪制了從訓練集里初始隨機選擇的數量,以構建統計推斷模型。縱坐標是選擇的平均數量,以找到訓練集中最低熱滯后ΔT的合金。經回歸量:選擇器組合發現,最佳的合金出現在選擇盡可能少的時候。圖中可以看出,對于鎳鈦形狀記憶合金,SVRrbf:KG(連續紅線)是最好的回歸量:選擇器組合。
注:SVR:Support Vector Regression 支持向量回歸
GPM:Gaussian Process Model 高斯過程動態模型
KG:Knowledge Gradient ?知識梯度
EGO:Efficient Global Optimization 高效全局優化算法
brf:radial basis function 徑向基函數
lin: linear kernel 線性核函數
Min:minimum 最小值
圖三?推理及全局優化的結果與思考
圖3a 圖為實驗測量的熱滯后ΔT與循環迭代次數的函數曲線,插圖為其預測曲線。迭代0是22種合金的原始訓練集。從1開始的每一次迭代都會合成四個新預測的合金。迭代次數為1和2的ΔT預測值和測量值之間差別很大,到迭代3-6次時顯著降低,超過7次后又持續增加。這三個階段可以理解為,在早期迭代中進行舉例性探索,在中間迭代找到了一個合理的最小值,然后在后面的迭代中持續新的探索。
圖3b 熱滯后ΔT與價電子數的函數曲線說明:迭代3次后,在一個狹窄區域內有明顯的低值,這有利于立方體轉變為斜方六面體,且與立方體轉變為正交晶系或單斜晶系相比,該值為已知的最小ΔT(全局最低值)。例如,由于SVRrbf:KG型回歸量:選擇器組合探索到在6.95附近的局部最小值,最終發現了Ti50.0Ni46.7Cu0.8-Fe2.3Pd0.2合金。(插圖為價電子數6.9至7.00的區域放大圖)
圖3c 如圖所示,圖為四種合成合金的平均價電子數量與迭代數的函數,顯示了在該特征空間內自適應設計的探索性質(迭代1、2次和7次后的標準差/誤差線)。誤差線表示四個樣品的價電子數標準偏差。第十個迭代表明設計明顯偏離了全局最低值( 在y軸約6.96處)。
圖四 Ti50.0Ni46.7Cu0.8Fe2.3Pd0.2合金的實驗測量值
圖4a 圖為新合金Ti50.0Ni46.7Cu0.8Fe2.3Pd0.2的電阻率隨溫度變化曲線。與NiTi相比,新合金表現出非常小的遲滯現象。插圖為?Ni50Ti50的電阻率隨溫度變化曲線。
圖4b Ti50.0Ni46.7Cu0.8Fe2.3Pd0.2的DSC曲線中兩吸收峰之差ΔT為1.84 K,這是鎳鈦形狀記憶合金材料有關記錄中的最低值。同時熱循環后(60次加熱和冷卻循環)也只有非常小的偏移(如插圖所示,約為0.02 K),表明優良的抗熱疲勞性能。
新聞鏈接:Machine learning accelerates the discovery of new materials
文獻鏈接:Accelerated search for materials with targeted properties by adaptive design
材料人組建了材料人材料計算交流QQ群,歡迎從事材料計算的材料人們加入!QQ群號:562663183。
感謝材料人編輯部尉谷雨提供素材
文章評論(0)