03月05日(水) AndTech「自然言語処理、大規模言語モデルの活用による専門知識・データ収集への対応と化学および材料開発への応用の可能性」WEBオンライン Zoomセミナー講座を開講予定
物質・材料研究機構/MatQ-lab(個人事業主) 吉武 道子 氏、株式会社TDAI Lab 福馬 智生 氏、シュレーディンガー株式会社 石崎 貴志 氏にご講演をいただきます。
株式会社AndTech(本社:神奈川県川崎市、代表取締役社長:陶山 正夫、以下 AndTech)は、R&D開発支援向けZoom講座の一環として、昨今高まりを見せる自然言語処理・大規模言語モデル 材料開発での課題解決ニーズに応えるべく、第一人者の講師からなる「自然言語処理・大規模言語モデル 材料開発」講座を開講いたします。
材料科学分野における言語処理の応用、大規模言語モデルを活用した専門分野におけるQAシステムの開発、ゼロベースで機械学習などを社内展開するために不可欠な研究データの記録や活用について解説!
本講座は、2025年03月05日開講を予定いたします。
詳細:https://andtech.co.jp/seminars/1efdec3f-78cb-653c-af5a-064fb9a95405
Live配信・WEBセミナー講習会 概要
──────────────────
テーマ:自然言語処理、大規模言語モデルの活用による専門知識・データ収集への対応と化学および材料開発への応用の可能性
開催日時:2025年03月05日(水) 13:00-17:05
参 加 費:49,500円(税込) ※ 電子にて資料配布予定
U R L :https://andtech.co.jp/seminars/1efdec3f-78cb-653c-af5a-064fb9a95405
WEB配信形式:Zoom(お申し込み後、URLを送付)
セミナー講習会内容構成
────────────
ープログラム・講師ー
∽∽───────────────────────∽∽
第1部 材料科学分野における言語処理の応用展望:マテリアルズインフォマティクスの一部として
∽∽───────────────────────∽∽
講師 物質・材料研究機構/MatQ-lab(個人事業主) NIMS特別研究員 / 個人事業主 吉武 道子 氏
∽∽───────────────────────∽∽
第2部 大規模言語モデルを活用した専門分野におけるQAシステムの開発とファクトチェックの仕組み(仮題)
∽∽───────────────────────∽∽
講師 株式会社TDAI Lab 代表取締役社長 福馬 智生 氏
∽∽───────────────────────∽∽
第3部 自然言語処理、大規模言語モデルによる活用可能なデータの収集に向けた課題と商用パッケージソフトを活用したインフォマティクス基盤構築
∽∽───────────────────────∽∽
講師 シュレーディンガー株式会社 エンタープライズ・インフォマティクス部 / ストラテジック・デプロイメント兼ビジネス開発マネージャー 石崎 貴志 氏
本セミナーで学べる知識や解決できる技術課題
───────────────────────
・自然言語処理技術の種類による活用法の違い
・材料関連分野の文書の種類による言語処理技術活用の違い
・統計処理(深層学習を含む)言語処理の特徴と活用における注意点
・文法をベースにした言語処理の特徴と活用
・言語生成AIの発展形
・研究データの記録のベストプラクティス
・電子実験ノートの概要
・研究データの活用方法
・パッケージソフト導入と自社開発の利点・欠点
本セミナーの受講形式
─────────────
WEB会議ツール「Zoom」を使ったライブLive配信セミナーとなります。
詳細は、お申し込み後お伝えいたします。
株式会社AndTechについて
────────────
化学、素材、エレクトロニクス、自動車、エネルギー、医療機器、食品包装、建材など、
幅広い分野のR&Dを担うクライアントのために情報を提供する研究開発支援サービスを提供しております。
弊社は一流の講師陣をそろえ、「技術講習会・セミナー」に始まり「講師派遣」「出版」「コンサルタント派遣」
「市場動向調査」「ビジネスマッチング」「事業開発コンサル」といった様々なサービスを提供しております。
クライアントの声に耳を傾け、希望する新規事業領域・市場に進出するために効果的な支援を提供しております。
株式会社AndTech 技術講習会一覧
─────────────────
一流の講師のWEB講座セミナーを毎月多数開催しております。
https://andtech.co.jp/seminars/search
株式会社AndTech 書籍一覧
──────────────
選りすぐりのテーマから、ニーズの高いものを選び、書籍を発行しております。
株式会社AndTech コンサルティングサービス
─────────────────────
経験実績豊富な専門性の高い技術コンサルタントを派遣します。
https://andtech.co.jp/business-consulting
本件に関するお問い合わせ
─────────────
株式会社AndTech 広報PR担当 青木
メールアドレス:pr●andtech.co.jp(●を@に変更しご連絡ください)
下記プログラム全項目(詳細が気になる方は是非ご覧ください)
──────────────────────────────
∽∽───────────────────────∽∽
第1部 材料科学分野における言語処理の応用展望:マテリアルズインフォマティクスの一部として
【講演主旨】
以下のような事柄について、概要を理解していただき、自社で展開する際の参考にしていただく。
材料科学分野で自然言語処理技術を利用してどのようなことができるのか、やりたいことを実現するのにどの種類の技術を用いればよいのか、市販ツールがどのような技術を用いているのか、市販ツールを自社カスタマイズする発注の際に言語モデル的に注意すべき点、今後どのようなことができるようになると期待されるか。
【プログラム】
1.概観
1.1 マテリアルズインフォマティクス
物性値、分子構造、結晶構造、化学構造式、物性名、数式、自然言語
1.2 対象とする文書の種類と特徴
論文、特許、書籍、安全・規制に関わる法的文書、社内文書
1.3 求められる処理の種類と特徴
文書分類、検索(目的文書の抽出)、情報の抽出(文中の特定情報の抽出)
2.言語処理の種類と活用
2.1 統計処理ベース(深層学習を含む)
・TF-IDE、N-gramなど
・単語ベクトル:Word2Vec、Doc2Vec
・BERT:pre-trainingとfine-tuning
・ChatGPTなどの大規模言語生成モデル
2.2 文法ベース
・品詞解析
・構文解析/照応解析
2.3 材料関連分野に特化したモデル
a)様々なモデル
Word2Vec系:Mat2Vec
BERT系:SciBERT、BioBERT、BatteryBERT、MatSciBERT、MatBERT、MaterialBERT
b)モデル利用時の注意点
学習データ、単語辞書、モデル計算(初めからor代入)、学習条件、検証のデータ
c)言語生成AI時代のモデル評価指標
2.4 ChatGPTなどを自社知識や業界知識と組み合わせる
a) RAG(Retrieval-Augmented Generation):検索拡張生成
b) 知識グラフの利用
3.マルチモーダル化
画像などテキストとは種類の異なるデータとテキスト(自然言語)のデータとの組み合わせ
【質疑応答】
【講演のポイント】
最先端の大規模言語モデルの基礎となる様々な技術には、目的によってはそれぞれの技術単体あるいは組み合わせが文書処理に有効な場合がある。時と場合に応じて、材料科学へ応用するのにどの言語処理技術を用いたらよいかがわかる。
∽∽───────────────────────∽∽
第2部 大規模言語モデルを活用した専門分野におけるQAシステムの開発とファクトチェックの仕組み(仮題)
【講演主旨】
※現在、講師の先生に最新のご講演主旨をご考案いただいております。完成次第、本ページを更新いたします。
【プログラム】
※現在、講師の先生に最新のご講演プログラムをご考案いただいております。完成次第、本ページを更新いたします。
はじめに
1. 背景知識
1.1 どうやって言葉を覚えた?
1.2 さらにAIは進化する
2. 専門知識・最新知識への対応
2.1 知識の外挿
2.1.1 コンテキストを用いた応答の例
3. コンテキスト長さの限界
3.1 再帰的要約(Recursive Summarization)
3.2 検索との組み合わせ
3.3 ツールの紹介
4. ファクトチェック
4.1 Hallucination
4.2 ファクトチェックの仕組み
おわりに
【質疑応答】
∽∽───────────────────────∽∽
第3部 自然言語処理、大規模言語モデルによる活用可能なデータの収集に向けた課題と商用パッケージソフトを活用したインフォマティクス基盤構築
【講演主旨】
材料研究では、月報や報告書への文書としての記録が中心で、活用を前提としたデータの記録や蓄積、特に失敗データの記録は少ない。近年、自然言語処理やLLMによる報告書からのデータ抽出が実用化に近づいているが、Excel方眼紙のような自由なフォーマットからの抽出は正確ではない。本講演では、データ活用で先行する製薬研究を参考に、データ記録・蓄積、データ加工、付加価値計算、幅広いユーザによる活用を可能にする仕組みについて解説する。
【プログラム】
1.マテリアルズ・インフォマティクスの現在地
1.1 MI向けソフトウェアの歴史
1.2 企業研究における一般的なMIの課題
1.3 データ駆動型研究
2.データの記録
2.1 登録システム(付番管理)
2.2 電子実験ノート/ELN
2.3 アッセイデータ管理システム
3.データの活用
3.1 研究で生じるデータの種類
3.2 Pythonなどによるデータ処理
3.3 データ計算システム
4.データ駆動型研究の実現のために
4.1 商用パッケージソフトか自社開発か
4.2 製薬研究で使うソフト
4.3 ソフトウェアベンダーの事情
【質疑応答】
【講演のポイント】
ゼロベースで機械学習などを社内展開するために不可欠な、研究データの記録や活用について、先行する製薬会社での例を説明する。またパッケージソフトを使うメリット・デメリットについて知ることで、自社に適した手段を選択できるようになる。
* 本ニュースリリースに記載された商品・サービス名は各社の商標または登録商標です。
* 本ニュースリリースに記載された内容は発表日現在のものです。その後予告なしに変更されることがあります。
以 上
すべての画像