Case: 材料・素材メーカー

量子スタートアップがLLMを活用して研究開発現場の革新を目指す理由

~化学・材料開発現場に新たな計算科学の可能性を提供するQunaSysの挑戦~


研究開発の現場における計算科学導入の新たな基盤を構築することを目指して、QunaSysのCRS(Chemical Reserach Solution) チームが、「研究開発のためのLLM(大規模言語モデル)勉強会」を開催しました。第1回は130名を超える方に参加いただき、大盛況のうち終了いたしました。量子コンピュータアルゴリズムやソフトウェアの研究開発を行うQunaSysにおいても、ユニークな取り組みである「LLM勉強会」を主催したチームメンバーにインタビューを行いました。


QunaSysがLLMに取り組む理由とは】

Q: QunaSysは量子コンピュータの利活用に取り組む企業ですが、なぜ一見関りのなさそうなLLMに取り組むのですか?

量子コンピュータ利活用に向けて、まずは計算科学を活用する土台を作ることから

QunaSysがお客様と会話している中で、化学メーカーは実験中心で、量子コンピュータの利活用以前に、そもそも「計算科学」の力を活かす土台ができていないという課題を抱えていることが分かりました。量子コンピュータの潜在力を化学分野で最大限に引き出すためには、「実験」「計算」「データ」「理論」の4つの要素がバランスよく連携する環境が不可欠だと考えており、私たちはこれを「4つの科学のNew Mix」と呼んでいます。

4つの要素において、計算科学が益々その力を発揮できるようになれば、今後、量子コンピュータを活用できるフェーズで開発の現場に貢献できる可能性が広がります。そのためにもまず、現場で実験を行う方に、計算科学の重要性とその利活用の可能性に興味と理解を深めてもらう必要があるとQunaSysは考えております。

研究開発の現場で直面する「非構造データ」という壁

実際に研究開発の現場で計算科学を利活用しようとする際、「非構造データ」の壁に直面することがあります。グラフや図といった、研究分野でよく用いられるデータは「非構造」のままではコンピュータでは扱いにくいという課題があります。そのため、これまで計算科学を活用するためには、研究開発者自身が手作業でコンピュータが理解できる形に変換する必要がありました。そして、材料研究・開発において機械学習を用いる場合、これまでいくつかの課題があることから、非構造データの活用が進んでいませんでした。例えば、大量のデータをコンピュータが扱える形で均質的に集める必要があることや、機械学習モデルが特定のデータセットやパラメータに依存しており、その条件から逸脱すると性能が大幅に低下する、あるいはモデルが機能しなくなるという問題です。しかし昨今盛り上がりを見せているLLMを用いれば、自然言語を使って指示ができ、研究開発者の負担を軽減しつつ計算科学の利活用を大幅に進めることができると期待しています。また、特定の範囲での使用に限定的であった機械学習と比べ、LLMであれば推論が可能なため、さらに広い範囲で応用することも期待できます。

*LLMも厳密には機械学習の中の一つですが、ここでは通例に習い、過去用いられていた手法を「機械学習」と呼んでいます。

「4つの科学のNew Mix」を実現する道のりは決して容易ではありませんが、LLMを活用することで、実験と計算、理論とデータの間の架け橋となりうるのではないかという期待を持ち、LLM事業に取り組み始めました。

この取り組みは、ただの技術トレンドへの追随ではなく、「4つの科学のNew Mix」の実現、そしてひいてはQunaSysが目指す量子コンピュータが産業界で応用される世界に近づくための重要なステップであり、私たちのこれまでの挑戦の延長線上にあります。

【LLM×研究開発勉強会を開催する背景と目的】

Q: 今回のLLM×研究開発勉強会は何を目的に開催したのでしょうか?

LLM勉強会という第一歩

「4つの科学のNew Mix」を実現するための第一歩として「LLM勉強会」を開催しました。この勉強会の特徴は、研究開発分野に特化していることです。また、主な目的は以下の2つです。

  1. LLMの研究開発分野での可能性を探るために各社が協力すること(コンソーシアムの形成)
  2. そこで得られた成果を共有資産として構築し、業界全体の進歩に寄与すること

この取り組みは競争前の段階における企業間の協力を目指しており、各企業が連携して知見を持ち寄りながら、LLMへの理解を深め、研究開発分野でのその活用方法を模索することを目的としています。最終的には、各社の利益を超えて、研究開発を行う業界全体の発展に寄与することを目指しています。

Q: なぜ、勉強会をコンソーシアムという形で開催したのでしょうか?

研究開発に特化したLLM利活用のための「地図」が存在しない

LLMは活用事例が急速に増加しており、多くの業界ではその事例が「地図」となり利活用の道筋を描く助けとなってきています。しかし、研究開発においてはそのような「地図」がまだほとんど存在していません。そのため、LLMの利活用のハードルが高く、一社単独で取り組むには情報のキャッチアップだけでも大きな負担となってしまいます。

外部データを取り入れるには膨大なコストがかかる

さらに、LLMを効果的に活用するためには、単に自社内のデータを整備するだけでは不十分です。科学的な裏付けのある情報に導くためには、教科書や文献といった外部データを正しく参照する仕組みが不可欠です。しかし、これらのデータを取り込み、整備するには膨大なコストと時間がかかるため、一社単独で取り組むには限界があります。そこで、QunaSysは他の企業と連携し、業界全体でデータ整備を進めるために、コンソーシアムという形式で勉強会を主催することにしました。


このコンソーシアムを通じて、研究開発分野におけるLLM利活用の「地図」を描き、ひいては計算科学の普及を推進することができると期待しています。QunaSysの役割は、単なる技術教育にとどまらず、実際の現場で活用する際に直面する細かな課題に共に向き合い、業界の企業と伴走することだと考えています。


Q: 「LLM勉強会」には何名ほど参加されているのでしょうか?

第1期「LLM勉強会」の実績

第1期「LLM勉強会」には、8社、約100名の方にご参加いただきました。第1期の1回目の講義に関しては、講義パート(詳しくは下述)のみ無料公開を行い、130名以上の方に参加していただきました。

Q: 実際に「LLM勉強会」ではどのようなことを行ったのでしょうか?

第1期LLM勉強会では、参加者にLLMを実際に体験してもらい、導入における可能性や課題を具体的に把握してもらいました。勉強会は、講義とハンズオンの二部構成で行いました。

講義では、大学の先生方を招き、材料開発におけるLLMの具体的な活用事例についてご紹介いただきました。ハンズオンでは、ノーコードツール「Dify」を使用して、LLMを活用したエージェント開発のプロセスを体験しました。具体的には、融点推定を題材にしたプロンプトチューニングを行い、別のセッションではそれをエージェントに組み込むワークフローを構築することで、実践的なスキルを学んでいただきました。

Q: 参加者の反応はどうでしたか?

参加者の方からは「先生方のご講演を通して具体的なLLM×材料開発の事例を知ることで、LLMの活用可能性をイメージできた」というお声や、「実際に自ら手を動かすことで、LLM導入に伴う課題やその解決方法についても深く理解できた」との声が多く寄せられています。

参加者の声を基に構成されたプログラム

第2回講義後に行ったアンケート(下図)では、LLM活用時の課題として「LLMの活用フローが分からない」や「ユースケースがイメージできない」といった意見が多数見られました。

これらの課題の一因として従来の人間の思考フローをLLMでそのまま再現することが最適ではない場合があることが考えられます。人間は無意識に「これをしたら次はこれ」というパターン化された思考をしていますが、LLMがそのように自律的に推論できるようにするためには適切な手順で指示をする必要があります。

この結果を踏まえ、第3回と第4回では「LLMの活用フロー」と「ユースケースの探索」をテーマに、参加者が実際にLLMを操作する演習を行いました。具体的には、まずワークとして、人間が今まで何をしていたのか、無意識に行っていた暗黙知的な行動も含めて、自分のワークフローを言語化する練習を行いました。その上で、LLMに適用できるプロセスを特定しどの順序で指示を与えるのが最も効果的かを確認するような実践的な演習を実施しました。

*指示の仕方等、LLMの活用方法には正解がないため、社内でも日々技術検証を行い、より効果的な活用方法を模索しています。今後も検証を積み重ね、LLM勉強会でその知見を共有していきたいと考えています。

講義や演習の度にアンケートにご回答いただき、参加者の声を反映しながらコンテンツ作りができたため、第一期は大盛況にて終了することが出来ました。

【今後の展望:第2期LLM勉強会について】

Q: 今後はどのような取り組みを行っていくのでしょうか?

2024年10月から12月にかけて、第2期「LLM勉強会」を開催します。

第1期参加者の方には自ら手を動かしてLLMを体験することで、具体的な活用事例について理解を深めていただきました。第2期では、3つの検討テーマを策定し、より発展的にLLMを研究開発に実装するための検討を行っていきます(下図「検討テーマの例」参照)。

参加者はまずオンライン会議でテーマについての説明を受け、その後対面での実装に取り組み、最終的には成果報告会を行う予定です。このプログラムを通じて得られたアイデアは、QunaSysへの開発リクエストや実際の導入に向けたフィードバックとしても活用されます(詳細は勉強会規約をご覧ください)。

もし参加者から、共通するユースケースに関する要望があった場合は、4つ目の検討テーマとしてユースケース探索を行う予定です。例えば、スペクトル解析、製造プロセスの改善への利用などが考えられます。

研究開発でLLM利活用を本格的に検討したい研究員の方や、LLMの具体的な活用方法を探索したい企業様には特にお勧めできる内容です。

私たちQunaSysは「LLM勉強会」を通じて、研究開発に役立つ計算科学の利活用方法を確立していきたいと思っています。そして、量子コンピュータの産業応用が進む未来を見据え、「実験」「計算」「データ」「理論」という4つの要素がバランスよく連携でき、計算科学の力を最大限に引き出す研究開発基盤(=「4つの科学のNew Mix」)の構築を目指します。


LLM勉強会HP:https://llm.qunasys.com/

LLM勉強会についてのお問い合わせ:llmqparc@qunasys.com

*カジュアル相談も可能ですので、お気軽にお問い合わせください。

LLM techブログ>:

LLM勉強会では、より勉強会の内容を充実させるために技術調査を行っております。⇒ブログはこちら:https://note.com/qunasys/

2024/10/07

Category: データマネジメントシステム
Category: データマネジメントシステム
Year: 2024