Journal of Materials Informatics創刊綜述—北京工業大學宋曉艷研究團隊:計算材料學與材料信息學相融合研究合金的相穩定性


背景介紹

材料的性能在很大程度上取決于其物相組成和微觀組織結構,而主相的穩定性對于材料實現并保持優異的性能尤為重要。對相穩定性和相變行為的研究有助于我們深入理解物相組成與性能之間的構效關系、性能變化機理以及性能穩定化的控制要素,從而指導開發性能優異并保持長期穩定的材料。

從物理本質上來說,相穩定性取決于相的成分組成、結構特征和能量狀態。在傳統的計算材料學領域,已經發展了多種方法研究材料的相穩定性。隨著近年來大數據和人工智能技術的快速發展,材料信息學框架下的數據驅動研究方法發展成為材料科學研究和高效開發的新范式,大大加速了新材料研發和智能制造的進程。

最近,北京工業大學宋曉艷教授研究團隊關于合金相穩定性研究進展的綜述文章,以“Integrating computational materials science and materials informatics for the modeling of phase stability” (計算材料學與材料信息學相融合研究合金的相穩定性)為題,發表于最新創刊的《Journal of Materials Informatics》第一期,全文閱讀:https://doi.org/10.20517/jmi.2021.06

該綜述以物相種類極為豐富的兩大著名稀土永磁合金體系之一的Sm-Co合金為例,系統介紹了合金材料相穩定性計算研究的進展,特別關注了從傳統計算材料學到材料信息學研究模式的發展,闡述分析了第一性原理、熱力學和數值計算等方法研究相穩定性和相變行為的特點,進而介紹了以機器學習為代表的數據驅動相穩定性研究方法。本文提出,基于相穩定性物理基礎、材料科學認知的計算材料學模型和方法,與機器學習等數據驅動新方法相耦合,增強機器學習模型的物理可解釋性,可望大力推進相穩定性理論研究進展,并促進基于性能主導相穩定性的高性能新材料的準確高效設計與開發。這種相穩定性的研究模式可推廣應用于更多材料體系,在縮短材料研發周期、降低試驗過程中的錯誤率和研發成本、加速新材料開發等方面具有突出優勢和前景。

內容簡介

計算材料學研究方法

由材料科學與計算機科學與技術交叉形成的計算材料學,是一門利用計算、模擬技術研究材料組成、結構、性能的學科。自上個世紀80年代計算材料學研究手段興起以來,以第一性原理、分子動力學、蒙特卡洛模擬、相場模擬、CALPHAD相圖與熱力學計算、有限元方法等為代表,分別在微觀、介觀、宏觀不同尺度上的計算模擬方法,極大地推動了計算材料學與材料設計的發展。然而,傳統的計算材料學方法主要是針對單一尺度下材料科學技術問題的個體化計算,通常,隨著材料體系中元素種類增多、物相組成及某些特定物相的晶體結構復雜程度增加,計算的難度大幅增加、計算周期顯著延長,甚至某些計算任務受制于計算技術瓶頸和計算效率而無法完成。

針對相穩定性的研究,在傳統計算材料學方法中,通常利用第一性原理計算、熱力學計算和確定性數值模擬方法等,研究合金組成元素之間的交互作用、物相形成、分解或轉化相關的能量變化等,來判斷物相的存在形式、穩定的成分和溫度區間以及轉變的趨勢和臨界條件。作者團隊在應用計算材料學方法研究存在不同程度穩定性的多元多相合金體系時,提出了合金亞穩相穩定性的熱力學計算模型,引入“相活度”的概念,比較合金體系中相組元與其參考態的化學勢,從而定量描述亞穩相的穩定性隨溫度、成分和晶粒組織的變化規律。

對于一個多晶合金體系,其Gibbs自由能G是溫度T、壓力P和晶粒尺寸d,以及組分相摩爾數的函數,即

G=G(T, P, d, ni, nj, nk, …) ?????????????????????????????????(1)

其中,ni, nj, nk…為體系中組分相i, j, k, …的摩爾數。系統的能量狀態取決于式中的所有因素,且這些因素并不是彼此完全獨立的。對于特定的某一過程,當一個或者多個因素發生變化,體系的平衡就會相應發生改變。例如,當TPd恒定時,由于組分間相互作用導致不同組分相的摩爾數發生變化,系統將會向新的平衡態轉變,直到系統新的狀態的Gibbs自由能降到最低。

如果系統中各組分的摩爾數保持不變,對式(1)求解全微分,可得

? ? ? ? ?(2)

其中SV分別是合金體系的熵和體積,且都是溫度、壓力和晶粒尺寸的函數。上式中第三項Σ(?G/dni)T,P,d,nj,…dni即為體系中所有組分的偏摩爾Gibbs函數求和。可以將偏摩爾Gibbs函數(?G/dni)T,P,d,nj,…項定義為體系中組分i的化學勢,用符號μi表示,即

(?G/dni)T,P,d,nj,…=μi?????????????????????????????????????????(3)

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(4)

由于式(4)考慮了體系中各相物質的量和晶粒尺寸的變化對熱力學狀態函數的影響,因此該方程既適用于與環境有物質交換的開放性合金體系,也適用于有成分和晶粒尺寸變化的封閉性合金體系。

引入物相的活度來描述體系中某一組分與其處于參考態的狀態差異:

μi(d)=μio(d)+RTlnai(d)????????????????????????????????????????(5)

式中ai為組分i的活度。式(5)表明任何改變化學勢的因素都會對活度產生影響,這包括了溫度、壓力、化學環境和晶粒尺寸等。當晶粒尺寸一定時,如果以純物質在溫度為298K、壓力為1 atm條件下的狀態為參考狀態,那么ai≡1對應μi(d)=μio(d)(處于參考狀態的組分i的化學勢,或稱標準化學勢)。因納米晶合金體系中晶粒尺寸的變化對系統能量狀態的影響顯著大于粗晶體系,該式更適于納米晶合金體系。一方面,對于給定的納米晶體系中某個晶粒尺寸,ai=1代表納米晶體系中組分i處于熱力學亞穩平衡狀態,即組分i可以穩定存在于納米晶體系中;另一方面,隨著晶粒尺寸的變化,納米晶體系中的組分i的標準化學勢也發生變化,每一個晶粒尺寸都有一個μio(d)相對應。這樣,具有尺寸依賴關系的活度就可用來描述組分在納米晶體系中的化學勢,從而也就可以表征尺寸效應對系統能量狀態的影響。圖1示出上述熱力學模型的計算結果,相應的實驗驗證結果示于圖2。

圖1. 基于“相活度”計算的不同物相的穩定性:(a) 室溫下名義成分為SmCo7的合金體系中不同物相的活度隨晶粒尺寸的變化;(b) 室溫下該體系中不同相的摩爾分數。

圖2. 室溫下名義成分為SmCo7的合金體系中物相組成的實驗測定結果:(a) 單個晶粒的明場像,晶粒等面積圓直徑為166nm;(b) 該晶粒的電子衍射花樣;(c) 暗場像顯示物相組成為單相2:17R,不同顏色表示兩個變體。

材料信息學研究方法

目前不管是第一性原理計算還是熱力學計算,多是針對特定成分和結構的物相的個體化計算,缺乏對合金體系涵蓋各種成分、物相結構的高通量計算和預測分析,更難以對各種各樣的摻雜體系進行相組成和相穩定性的快速定量化研究。對Sm-Co體系來說,由于晶胞結構的復雜性、摻雜位點的多樣化,通常計算周期非常長。如果要得到較為準確的含摻雜元素的晶胞結構及相關電子結構和磁結構,需要采用非常耗時的全電子方法求解波函數,才可能解決其他方法在處理4f電子時的收斂性差的問題。因此目前Sm-Co合金體系的第一性計算只局限于某些特定體系,尚難以進行大范圍、考慮多種因素的規模化計算。

隨著材料研究領域數據的積累、數據庫技術的發展和計算機技術與數據應用技術的不斷融合,數據驅動的材料信息學已成為材料科學研究的重要途徑。在材料基因組計劃的推動下,高通量計算和大數據技術不斷在能源材料、生物醫用材料、稀土功能材料、催化材料、特種合金材料等材料體系上開展應用示范,并取得了系列重要突破。

作者團隊基于在稀土單質和Sm-Co合金體系十余年的計算和實驗研究工作,建立了Sm-Co基多元合金數據庫,集成了材料成分與物相組成、晶體結構、制備工藝、性能等多方面數據,建立了數據項之間的科學邏輯關聯,數據的規范性、可讀性和可重復利用性顯著提高。進而,開發了“材料知識信息解析、關聯與管理系統(MKI-AAM)”,圍繞數據驅動材料設計的目標,可實現傳統數據庫難以突破的材料深層次信息檢索、材料數據庫融合匯交、高質量材料設計數據集抽取等功能。圖3所示為面向數據驅動材料設計的合金類材料數據庫的建設方案,主要包括數據庫建模、信息管理系統開發和數據庫應用三個方面,信息管理系統劃分為數據源、數據集、材料三個層次,旨在提高數據收集的效率和數據質量,加速數據驅動材料設計用高質量數據集的生成。

圖3. “材料知識信息解析、關聯與管理系統(MKI-AAM)”的結構和功能

利用該系統,作者團隊結合特征工程和機器學習方法,對一定名義成分的Sm-Co類合金的相組成、相平衡和相穩定性進行了研究,提出合金相穩定性由成分特特征()、組織特征(晶粒尺寸d)、制備工藝特征(Cproc)和材料形態特征(Cform)決定,即:

? ? ? ? ? ? ? ? ? ?(6)

經過特征構建、特征篩選和模型優化等系列過程后,發現合金相組成與摻雜元素的熔點和摻雜元素與Co之間的電負性差密切相關,并依此對周期表中所有可能的摻雜元素進行了遍歷,對不同摻雜量和晶粒尺寸的名義成分為SmCo7的合金具有單相特征的相穩定性進行了定量化預報,如圖4所示。

圖4. 名義成分為SmCo7的合金體系中形成單相穩定性的機器學習預測結果:(a) 平均AUC值隨元素特征數的變化;(b) 數據集中SmCo7-xMx(M為摻雜元素)合金相組成基于摻雜元素的兩個選定特征的數據分布;(c) 不同摻雜元素、不同晶粒尺寸的SmCo7-xMx薄帶中單相穩定性的預測;(d) 不同摻雜元素、不同晶粒尺寸的SmCo7-xMx燒結塊體中單相穩定性的預測。

相穩定性計算研究展望

計算材料學方法和以數據驅動研究為主要手段的材料信息學方法,兩者并不能相互取代,而是可以相互融合、協同促進的。數據驅動建模是對傳統計算材料學模擬研究范式的重要補充和拓展。為了提高數據驅動建模的科學性、準確性和效率,需要將機器學習算法與領域知識緊密結合,交融匯聚材料科學知識和數據處理應用技術。

關于相穩定性計算研究的發展趨勢,從以下幾個方面進行了展望:

(1)數據庫建設與數據信息系統相結合

充足的材料數據是實施數據驅動模擬計算的基本前提,數據庫中的數據應遵循可發現、可訪問、可交互、可重復使用的FAIR原則。隨著數據質量的提高,數據共享將變得更加容易,社會總成本將降低。隨著計算模型和方法的發展,利用高通量計算可以快速獲得大量的計算數據補充完善數據庫。然而,實驗數據的多源異構性可能導致數據庫中數據質量的明顯下降,這會制約數據驅動相穩定性研究的建模和基于相穩定性的新材料設計。因此,伴隨數據庫建設,研究數據收集、存儲、傳輸、融合和數據應用的理論和技術是非常重要和必須持續開展的。同時,需要建立適用于數據驅動建模和材料設計的數據標準,將數據相關信息系統的建設納入數據應用技術開發和數據驅動相穩定性研究的協同發展之中。

(2)基于高質量小數據集的機器學習

目前已經公開發布的材料數據庫,已涵蓋高溫合金、粉末冶金材料、鋼鐵材料、有色金屬及合金、稀土永磁合金等多種典型基礎材料的系統數據,可以支撐這些材料體系中有關性能主導相的數據驅動相穩定性研究,并促進這些材料體系中新型高性能材料的快速設計開發。對于某些新型材料體系,因研究歷程短、數據量不足,其數據庫的建設還需要經歷相對較長時間的架構和檢驗的過程。在此情況下,基于高質量小數據集的機器學習值得重視。高質量的小數據集,數據主要來自于單一研究組或者相近的實驗制備和測試條件,可能最大限度減少實驗過程中的不確定因素和可控變量。高質量的數據集是獲得準確可信的機器學習結果的必要條件之一。面對數據量小的問題,數據的選擇和機器學習方法的選擇就很關鍵,同時,結合領域知識開展數據驅動的建模尤為重要。

(3)高通量計算模型與算法

隨著計算能力和集成計算軟件功能的提高,高通量計算必將以越來越快的速度發展。高吞吐量計算在多通道、多目標、多任務以及高并發計算和數據管理等方面具有先進性,能夠生成大量數據用于機器學習。利用高性能計算集群和已開發的高通量計算程序,已有高通量第一性原理計算數據并以之指導設計了多種新材料。然而,對于一些包含復雜結構和多組分的材料體系,即使是單任務計算也非常耗時,目前尚難實現高通量計算。因此,迫切需要開發和優化多目標、多任務的計算模型和算法,結合多尺度、多狀態的模擬計算,獲得高效的高通量計算結果。

(4)物理可解釋性機器學習建模

雖然目前已有大量材料的機器學習研究獲得了成功,但是機器學習的算法和結果仍普遍缺乏深入的理論基礎和可解釋性,這尤其限制穩定性敏感多變的合金體系的機器學習研究。隨著機器學習方法在材料組織結構模擬、性能預測和材料設計中越來越多的應用,機器學習模型的可解釋性越來越受到重視。最近報道了一些結合機器學習和第一性原理計算來揭示合金組成元素的作用并提出多組分材料設計方案的重要研究進展。對材料成分、相組成和相結構、制備工藝和材料性能之間的關系,進行數據驅動的建模計算,是研究物理可解釋性機器學習模型和方法的有效途徑。將機器學習方法與計算材料學模型和材料科學理論基礎緊密結合,可能是可解釋性機器學習的未來發展趨勢。

本文研究得到了國家重點研發計劃項目(2018YFB0703902)和國家杰出青年科學基金“金屬納米材料的穩定性”(51425101)的資助。

Journal of Materials Informatics?(www. jmijournal.com)是聚焦材料信息學領域的國際英文學術期刊。旨在通過緊密集成和智能化的方式將理論、實驗、計算和人工智能協同結合,以推進和加速材料發現、設計和部署的步伐。該刊綜合了物理,化學,數學,力學,計算機科學與工程,材料科學與工程以及新興的實驗,為研究人員提供了一個展示、發表和交流材料信息學相關研究的平臺,尋求打破材料科學與工程、數據科學與工程及人工智能之間的壁壘。

JMIOAE出版公司主導創辦,由中國科學院院士,香港工程科學院院士張統一教授擔任創刊主編

期刊主頁:www. jmijournal.com

投稿地址:https://oaemesas.com/jmi/

聯系編輯:editorialoffice@jmijournal.com

分享到