高分子太陽電池、人工知能で性能予測
1,200個の実験データから有効性を実証
研究成果のポイント
・高分子太陽電池は安価で安全・軽量ながら、従来その材料開発は多種類の化学構造の組み合わせを実験で試さなければならず、多くの時間と労力を必要とした。
・手作業で収集した1,200個の実験データを基に、人工知能(AI)の機械学習で高分子構造を一瞬で選別し性能予測する手法を開発した。
・実際の合成と性能予測評価でAIによる分子設計の有効性を確認。実験データに基づくマテリアルズ・インフォマティクスの有効性を示した。
概要
JST戦略的創造研究推進事業において、大阪大学大学院工学研究科佐伯昭紀准教授と長澤慎司氏(当時、博士前期課程2年)は、次世代太陽電池として期待されている高分子太陽電池 の高分子材料設計において、人工知能(AI)アルゴリズムの1つであるランダムフォレスト(RF) を用いて性能予測・選別する手法を新たに開発しました (図1) 。
有機薄膜を用いる高分子太陽電池は、安価で安全・軽量なことから、実用化に向けて世界中で研究されています。高分子太陽電池の多くには、高分子とフラーレン誘導体 の混合膜が用いられています (図2) 。しかし、高分子の分子構造には無数の組み合わせが存在し、かつ混合膜の構造は計算で予測できないため、光電変換効率 などの品質向上を目指すうえで、人海戦術的な実験や計算化学では限界がありました。
本研究では、高分子フラーレン太陽電池の混合膜材料としてこれまで報告されている高分子の化学構造、および素子性能に関わる物性値を手作業で1,200個集め、このデータを基にランダムフォレストによる分類器(分類アルゴリズム)を構築しました。この分類器を使って新たな材料候補となる高分子の構造を抽出することに成功し、従来の計算化学では不可能であった溶解性を付与するアルキル鎖 の選別も可能になりました (図3) 。さらに、実際に選別した高分子を合成し、AIと実験スクリーニング法を融合させた迅速な材料開発法を確立しました。
本研究成果は、2018年5月8日(日本時間)に米国化学会誌「The Journal ofPhysical Chemistry Letters」のオンライン速報版で公開されました。
研究の背景と経緯
持続可能な社会の実現に向け、太陽光発電や風力発電といった再生可能エネルギーの普及が進められています。高分子太陽電池は、すでに実用化されているシリコン太陽電池や化合物太陽電池と比べ、軽量でデザイン性(色や形の自由度)に優れます。そのため、機械的強度が低い建物の屋上や、窓、壁などに設置でき、小規模施設向けの多様な活用が期待されます。また、材料によっては赤外光を吸収して可視光を透過させることで、透明な太陽電池を実現することも可能です。
高分子太陽電池の多くは、光を吸収して電子を受け渡し、正電荷を運ぶp型高分子半導体と、電子を受け取って負電荷を運ぶn型低分子半導体から構成されます。代表的なn型低分子半導体にはフラーレン誘導体が用いられており、高分子とフラーレン誘導体を溶液に溶かして基板に塗ることで混合膜を形成します。高分子フラーレン太陽電池はこの10年間で、主に高分子材料の開発によって、10%を超える比較的高い光電変換効率を達成しました (図2) 。また、フラーレン誘導体を他の低分子半導体に代えたものでは、13%程度まで向上しています。しかし、混合膜に用いる高分子材料の化学構造は、電子供与基・電子吸引基 およびアルキル鎖からなり、無限に近い組み合わせが存在します。さらに、混合膜の構造やその混合膜を用いた太陽電池の性能は予測できないため、人海戦術的にありとあらゆる材料を検討することは、合成実験上も、高分子部分構造の電子状態を精密に予測できる計算化学でも限界がありました (図1) 。
一方、近年の人工知能(AI)の発展は、人間の頭脳を超えるゲームソフト、画像・映像認識によるセキュリティの向上、効率的な社会システムの構築など、多くの分野に新たな革命を引き起こしています。材料科学の分野でも、実際の材料合成を省略することはもちろんのこと、コストがかかる精密な計算も部分的に省略した超効率的な材料探索の手法に期待が集まっています。
数値データを扱う情報データ科学と従来の材料科学が融合した分野は「マテリアルズ・インフォマティクス(MI) 」と呼ばれ、熱電変換材料やリチウムイオン電池の新規材料開発で成功を収めています。しかし、高分子太陽電池では化学構造など数多くの要因が素子性能に複雑に影響するため、これまでMIは有効に利用されてきませんでした。
研究の内容
そこで研究グループは、高分子太陽電池材料の選別に特化したMIの手法を開発するため、まずはこれまでに学術論文で報告されている高分子フラーレン太陽電池の混合膜材料の化学構造とその素子性能に関わる物性値(分子量、電子準位など)を集めることから始めました。
論文自体はキーワード検索で探し出せるものの、画像として記載されている化学構造は出版社や各論文によって解像度やレイアウトが異なり、さらに素子性能や物性値データも一定のフォーマットではないという問題があります。そこで、一つ一つの化学構造と物性値をデジタルデータとして手作業で打ち込み、最終的に1,200個の高分子の化学構造と物性値のデータセットを集めました。MIでは大量かつ精度の高い数値データが必要不可欠であり、このデータ収集は大変ではあるものの、避けては通れない作業でした。
次に、これらのデータセットを基に、ランダムフォレスト(RF)を用いた分類器の構築に取り組みました。分類器とは、ある入力パラメータに対して、それがどのグループに属するかを判定するモジュールです。例えば、ある犬の体長、体重、毛色、毛の長さなどを入力すると、どの犬種グループ(秋田犬、ゴールデン・レトリバーなど)に最も近いかを判定できることなどが考えられます。
今回の高分子材料では、化学構造を1,024個の指紋キー(数字の列)に変換し、加えて分子量や電子準位などの物性値を入力パラメータとし、光電変換効率のグループ(例えば4~5%のグループなど)を出力として与えるように機械学習を行いました。グループ数を調整して検討した結果、正答率を向上させることに成功しました。さらに、これまでの計算化学では不可能であった、溶解性を付与するアルキル鎖の選別も可能になりました (図3) 。
この分類器は、すでに学習した化学構造に対しては95%以上の正答率が得られるため、材料化学の専門家にも勝る材料選別が可能です。さらに本研究では、他の計算化学データベースで提供されている分子構造を分類器によって選別し、それらの素子性能を予測しました。続いて研究者自身による合成上の考慮(合成ルートや入手可能な試薬)を経て1つの高分子構造を決定し、実際に合成しました。合成した高分子を、佐伯准教授らがこれまでに開発した高速実験スクリーニング法(参考文献)を用いて性能予測すると、分類器による予測に近い性能が得られました。この実験スクリーニングでは、手間のかかる素子作製をすることなく、高分子フラーレン混合膜の光電気信号を評価することで素子性能や最適素子作製条件を予測できます。このように、MIによる分類器と実験スクリーニングを融合した一連の開発手法は、世界初で実用上も有効であり、今後の高効率な高分子太陽電池の開発を加速することが期待できます。
なお本研究は、JST戦略的創造研究推進事業に加え、科学研究費補助金基盤研究(A)「非鉛ペロブスカイト太陽電池の探究と基礎物性の包括的解明(16H02285)」の支援を受けて行われました。
今後の展開
MIの手法は触媒、電池、エネルギー変換などの機能材料の探索だけでなく、画像解析・データ解析・計測技術などにも展開されています。AIのアルゴリズムや基礎となる数学は難解ですが、画像認識や音声認識では今やだれでも簡単に使えるツールが提供されています。
本研究グループは実験物理化学が基盤であるため、当初はMIへの敷居を高く感じていました。しかし、人工ニューラルネットワーク(ANN) や今回のRFは、簡単なコマンド入力で実装することができます。今回は、画像認識で有効なANN法による分類器も検討しましたが、性能はRFには及びませんでした。高精度の機械学習では数万個以上のデータが必要と考えられていますが、本研究では1,000個程度のデータ数でもRFが有効であることを実証しました。これは、他分野でも「実験データに基づくMI」を展開する上で重要な知見です。
研究グループは今後、RFによる材料設計手法を、高分子だけでなく低分子や3種混合系材料にも展開し、より高効率な高分子太陽電池材料を探索していきたいと考えています。
参考図
図1 マテリアルズ・インフォマティクスによる高分子太陽電池の材料探索
(上部)電子供与基、電子吸引基、アルキル鎖から構成される高分子構造の例。その組み合わせは無数に存在する。(中部)化学構造を指紋キーに変換し、ランダムフォレストで変換効率を分類。(下部)機械学習、実験科学、研究者による判断の双方向の融合。
図2 高分子フラーレン太陽電池素子の発電イメージと化学構造
高分子とフラーレンの混合膜中で発生した正負の電荷が電極に運ばれることで発電する。
図3 RFで構築した分類器によるアルキル鎖の判定の例
アルキル鎖は直線型、分岐型の種類があり、さらに長さも異なる。これらの中から溶解性と薄膜構造(フラーレンとの混ざりやすさや高分子同士の集合体形成)の両者を両立する最適構造を選別するため、通常は全て合成して試す必要がある。
特記事項
本成果は、以下の事業・研究領域・研究課題によって得られました。
戦略的創造研究推進事業個人型研究(さきがけ)
研究領域:「理論・実験・計算科学とデータ科学が連携・融合した先進的マテリアルズ・インフォマティクスのための基盤技術の構築」(研究総括:常行真司東京大学大学院理学系研究科教授)
研究課題名:「超高速スクリーニング法を駆使したエネルギー変換材料の探索」
研究者:佐伯昭紀(大阪大学大学院工学研究科准教授)
研究実施場所:大阪大学大学院工学研究科
研究期間:平成27年12月~平成31年3月
本研究領域では、実験科学、理論科学、計算科学、データ科学の連携・融合によって、それぞれの手法の強みを生かしつつ相互に得られた知見を活用しながら新物質・材料設計に挑む先進的マテリアルズ・インフォマティクスの基盤構築と、それを牽引する将来の世界レベルの若手研究リーダーの輩出を目指します。
論文情報
タイトル:“Computer-aided Screening of Conjugated Polymers for Organic Solar Cell:Classification by Random Forest”(コンピュータを使った有機太陽電池の共役高分子のスクリーニング:ランダムフォレストによる分類)
雑誌名:The Journal of Physical Chemistry Letters
doi: 10.1021/acs.jpclett.8b00635
参考文献
“A Versatile Approach to Organic Photovoltaics Evaluation Using White Light Pulseand Microwave Conductivity”
雑誌名:J. Am. Chem. Soc. 134 (2012) 19035-19042.
doi:10.1021/ja309524f
参考URL
大阪大学 大学院工学研究科 応用化学専攻 物質機能化学コース 物性化学領域
http://www.chem.eng.osaka-u.ac.jp/~saeki/cmpc/
用語説明
- 高分子太陽電池
主に炭素や水素からなる有機高分子を使った太陽電池。従来のシリコンや化合物の無機太陽電池に比べて材料や製造コストが安く、安全かつ軽量で曲がるものも作れるため、次世代太陽電池として期待されている。
- ランダムフォレスト(RF)
分類、予測に用いる機械学習アルゴリズム。複数の入力パラメータ群からランダムにパラメータを選び、それらを使って分岐構造を有する決定木(けっていぎ)に従い結果を判定し、これを複数回繰り返したのちに結果を総合して判断を下す。
- フラーレン誘導体
フラーレンは、炭素が60個集まってできたサッカーボール状の直径1ナノメートル程度の大きさの分子(1ナノメートルは100万分の1ミリメートル)。フラーレンそのものは溶媒に溶けにくいため、置換基を付けた誘導体にすることで溶媒に溶けるようになる。
- 光電変換効率
(PCE):
太陽電池で光エネルギーを電力に変換する効率。光電変換効率は、太陽電池の陽極と陰極を電線でつないだ状態の電流値である「短絡電流(J sc )」と、電線を外した状態の電圧値である「開放電圧(V oc )」、および電力(電流×電圧)を最大にする電流・電圧値から計算される「フィルファクター(FF)」の掛け算を、入射太陽光エネルギー(P)で割って求められる(PCE=J sc ×V oc ×FF/P)。
- アルキル鎖
炭素―炭素結合が直線もしくは分岐状に連なり、残りの結合部に水素が付加した分子の部分構造。高分子骨格だけでは溶媒に溶けにくいため、アルキル鎖を導入することで溶媒に溶けるようにする。
- 電子供与基・電子吸引基
それぞれ、電子を供与する、あるいは電子を吸引する性質を持つ部分化学構造。高分子太陽電池の骨格は、電子供与基と電子吸引基を交互につなぐことで長波長の光まで吸収できるように設計される。
- マテリアルズ・インフォマティクス(MI)
計算科学・実験科学・データ科学を融合させ、帰納的あるいは演繹的な材料設計を通じて、求める機能・性能を満たす材料を効率的に探索する学問分野。
- 人工ニューラルネットワーク(ANN)
画像認識などに有効な機械学習アルゴリズムの一種で、脳のニューロンを模したシナプスの結合とノード、およびそれらの多層構造で構築される。学習を進めることでシナプスの結合の強弱が変化し、最適な出力を得るように調整される。