結晶学的知識を学習したAI ~結晶構造予測タスクで世界最高性能に到達~
・機械学習と第一原理計算を融合した結晶予測アルゴリズムShotgunCSPを開発
・結晶構造予測のベンチマークにおいて、世界最高性能(※)を達成
・結晶の対称性を予測する機械学習アルゴリズムにより、複雑で大規模な結晶系の構造予測の性能を飛躍的に向上
■概要
統計数理研究所とパナソニック ホールディングス株式会社の研究グループは、材料の組成からその結晶構造を高速かつ高精度に予測する機械学習アルゴリズムShotgunCSPを開発し、結晶構造予測のベンチマークにおいて世界最高性能(※)を達成しました。
結晶構造予測は、特定の条件下で材料や化合物がどのような結晶構造をとるかを予測する問題です。具体的には、第一原理計算に基づくエネルギー評価を繰り返し実行し、エネルギー最小化問題を解いて安定な原子配置を求めます。この問題は20世紀初頭から物質科学の基本問題として研究されてきました。近年は計算機技術や生成AIの進展と相まって新たな技術開発が進行しています。しかしながら、大規模な結晶系や複雑な分子系では広大な網羅的に相空間を探索するための計算資源が膨大になり、依然として物質科学の未解決問題となっています。
同グループは、機械学習アルゴリズムを導入することで安定な結晶構造が持つ対称性のパターンを高精度で予測できることを発見しました。さらに、この予測器を用いて探索空間を大幅に絞り込むことで、従来必要とされてきた第一原理計算の繰り返し実行を省略し、非常に単純なアプローチで大規模で複雑な系においても安定構造を高精度かつ効率的に予測できること実証しました。
本研究成果は、2024年12月20日にnpj Computational Materials誌にて発表されました。
※2024年12月20日時点、統計数理研究所、パナソニック ホールディングス調べ
■研究成果
結晶は、原子や分子が規則正しく並んで形成される固体であり、半導体、医薬品、電池などに使われています。結晶は、その構造が材料の物性を大きく左右します。しかし、材料開発の過程では、実際に合成してみないと結晶構造がわからず、これには多くの時間と労力がかかります。このため、結晶構造が不明なままでは材料の物性を理解することも困難です。したがって、化学組成からエネルギー的に安定または準安定な結晶構造を予測することは、物質科学における基本問題として長年に渡り研究されてきました。原理的には、原子配列空間内のエネルギー最小化問題を解くことで結晶構造を予測できます。エネルギー評価には、密度汎関数理論に基づく第一原理計算が一般的に用いられます。
結晶構造予測(CSP:crystal structure prediction)の問題は、第一原理計算と最適化アルゴリズムを組み合わせて解かれます。例えば、遺伝的アルゴリズムなどを適用し、原子配列をエネルギー勾配に沿って逐次的に変位させることで、エネルギー曲面上の大域解や局所解を探索します。しかしながら、これらの既存手法では、最適化の各ステップで生成された多数の候補構造を第一原理計算で緩和させる必要があり、その計算コストは非常に高くなります。特に、ユニットセル(結晶の繰り返し構造を定める基本単位)に30~40個以上の原子を含む複雑な構造では、計算コストの観点から既存手法で結晶構造を解くことは難しいとされています。近年のベンチマーク研究では、現在のCSPアルゴリズムが解ける結晶構造は全結晶系の50%にも満たないことが報告されています(1)(2)。
そこで同グループは、第一原理計算の繰り返し実行を必要としない非反復的なCSPアルゴリズムの構築に取り組みました(図1)。まず、機械学習で第一原理計算を近似するエネルギー予測器を構築しました。ここで、転移学習という手法を用いることで、ごく少数の学習データから高精度なエネルギー予測器を構築できることが分かりました。そして、新たに開発した結晶構造生成器を用いて多数の仮想結晶構造を生成し、エネルギー予測器を用いて安定構造に到達しそうな候補を絞り込みました。最後に、選抜された候補構造に対して第一原理計算によるエネルギー緩和を実行し、最小エネルギーに達した結晶構造を安定構造として予測しました。このアルゴリズムはShotgunCSPと命名されました。名前の由来は、ショットガンを広範囲に散弾し、的に命中したものを精査するというイメージに基づいています。
ShotgunCSPにおいて鍵となるのが結晶構造生成器です。大規模な系の構造空間は非常に広大であるため、探索空間を効率的に絞り込む必要があります。同グループは、任意の組成が与えられたとき、その安定構造が持つ結晶の対称性(空間群やワイコフ配置)を機械学習で高精度に予測できることを発見しました。これにより、探索空間の効率的な縮小が可能となり、計算コストを大幅に削減しつつ高精度な予測を実現しました。
空間群は、結晶の対称性を数学的に記述する枠組みで、結晶格子の原子配置を元の位置に一致させる幾何学的操作(平行移動、回転、反転、鏡映など)の集合を表します。すべての結晶は230種類の空間群に分類されます。同グループは、結晶構造データベースを用いて学習したモデルで安定構造が取りうる空間群を上位30個程度に絞り込むことが可能であり、これにより任意の組成に対する空間群のほぼ完全な同定が可能であることを示しました。
ワイコフ位置は、特定の空間群の対称操作において許容される原子配置の自由度を表します。各原子にはワイコフ記号が割り当てられ、そのルールに従い移動した原子位置は元の対称性を保ちます。同グループは、機械学習を活用し、任意の組成に対して各原子のワイコフ記号の割り当てを効率的に絞り込めることを明らかにしました。
これらの対称性予測器を用いることで、結晶系の探索空間を大幅に刈り込むことができます。これによりCSPの予測精度を飛躍的に向上させることに成功しました。本研究で実施した大規模な性能評価テストによれば、ShotgunCSPは全結晶系の約80%を正確に予測できる可能性があります。その性能は、近年のベンチマーク(1)で現在のトップランカーの座にある同グループが以前に開発した元素置換ベースのCSPアルゴリズムCSPML(2)を大きく上回りました。
■今後の展望
CSPアルゴリズムは、新材料開発や科学的発見を加速する基盤技術です。物質の安定構造を特定できれば、高温超伝導、電池材料、触媒、熱電材料、医薬品分子、さらには高温高圧など極限環境下における物質の探索が飛躍的に進展します。同グループは、従来の発想とは一線を画し、機械学習で安定相の結晶対称性を絞り込むという新たな切り口を発見することで、CSPアルゴリズムの予測性能を大幅に向上させることに成功しました。さらに、ShotgunCSPはそのシンプルなアルゴリズム設計により並列計算との親和性が高く、探索計算を大規模化することでさらなる性能向上が期待されます。
■発表論文
タイトル:Shotgun crystal structure prediction using machine-learned formation energies
著者:Liu Chang, Hiromasa Tamaki, Tomoyasu Yokoyama, Kensuke Wakasugi, Satoshi Yotsuhashi, Minoru Kusaba, Artem R. Oganov, Ryo Yoshida
掲載誌:npj Computational Materials 10, 298 (2024)
DOI:10.1038/s41524-024-01471-8
■謝辞
本研究の一部は、日本学術振興会科学研究費(19H05820、19H01132、23K16955)、科学技術振興機構CREST(JPMJCR19I3、JPMJCR22O3、JPMJCR2332)の助成を受けて実施されました。
■参考文献
1. Wei et al., CSPBench: a benchmark and critical evaluation of Crystal Structure Prediction. arXiv preprint. arXiv:2407.00733 (2024). DOI: 10.48550/arXiv.2407.00733
2. Kusaba et al., Crystal structure prediction with machine learning-based element substitution. Computational Materials Science 211, 111496 (2022). DOI: 10.1016/j.commatsci.2022.111496.


【お問い合わせ先】
パナソニック ホールディングス株式会社 コーポレートR&D戦略室 技術広報担当
Email:crdpress@ml.jp.panasonic.com
大学共同利用機関法人 情報・システム研究機構 統計数理研究所
運営企画本部 企画室URAステーション
〒190-8562 東京都立川市緑町10-3
TEL:050-5533-8500(代表)
Email:ask-ura@ism.ac.jp
すべての画像