『次世代NLP(自然言語処理)と大規模言語モデル(LLM)白書 2023年版』 発刊のお知らせ

INGS

一般社団法人 次世代社会システム研究開発機構(INGS)は2023年10月16日、『次世代NLP(自然言語処理)と大規模言語モデル(LLM)白書 2023年版』の発刊ならびにその概要を発表した。

本白書は、次世代の自然言語処理(NLP)と大規模言語モデル、AIアシスタント、AIチャットボット、自然言語処理の生成を効率化・高速化する言語モデリング、多言語LLM、視覚言語モデル、生成系AIとの対話を支援する各種自然言語処理モデルに係る諸テーマを網羅的・重点的にとりあげ、その全容と実践的な課題を提示している。

人間はお互いに言語でコミュニケーションをとることで成立し、これはあらゆる活動を支えている。

従って自然言語処理技術(NLP)を活用したAIによるコミュニケーションは、人工知能がより人間に近づき、人間社会にとけ込んでいく上で必ず解決しなければならないテーマであり、最も大きな課題でもある。


すでに多くの大手 IT 企業が音声認識/デジタルアシスタント(チャットボット)/スマートスピーカーの開発に注力しており、今後、家庭向けAIアシスタント以外に、自動車、医療、金融、小売、顧客対応サービス、教育、流通、運送などの幅広い業界で、多様なソフトウェア/プラットフォームに統合されながら、広範に活用されることが予測されている。


今後、AIの実用の場を大きく広げていく過程において、自然言語処理技術(NLP)は、教育分野、メンタルケア、公共サービスなど、コミュニケーションが重要な要素となる分野における軸となり、さらなる高度なコミュニケーションを実現する上で鍵となる技術として期待されている。


AI/ディープラーニングやコグニティブシステムの成果が音声認識/デジタルアシスタント(チャットボット)/スマートスピーカーに取り入れられ、ほぼ実用レベルに達しつつある流れのなかで、コネクテッドホームはじめIoT指向のフレームワークにおいても、音声認識/AIアシスタントが中核的な存在として位置づけられている。


一方、大規模言語モデル(LLM)は、自然言語処理(NLP)において大きな進歩を遂げている。大規模言語モデルは、入力された自然言語の内容を予測するために開発されている。言語モデリングの課題だけでなく、これらのモデルの使用は自然言語のパフォーマンスを向上させている。LLMを利用したアプローチは、情報抽出、質問応答、要約などの医療タスクで効果を発揮している。


大規模言語モデルの成果は、トランスフォーマーモデルというアーキテクチャとプロンプトエンジニアリングというフレームワークに起因している。トランスフォーマー・モデルはニューラルネットワーク・アーキテクチャの一種で、自然言語処理(NLP)の分野で大きな人気を博し、革命をもたらした。


また、プロンプトは、LLMを搭載した技術で使用される自然言語の指示である。タスクの仕様、予測が遵守すべきルール、そしてオプションとしてタスクの入力と出力のサンプルが、すべてこの命令セットに含まれている。そして、プロンプトエンジニアリングとは、AI、特に大規模言語モデル(LLM)モデルが望ましい出力をするようにプロンプトを設計し、最適化することである。


自然言語処理の代表的なアプリケーションであるチャットボットは、非常に高いレベルで、自然言語理解(NLU)、自然言語生成(NLG)のエンジンにガイダンスするプロンプトエンジニアリングによってユーザーのクエリ(自然言語)に適応させ、正しいコンテキストやレスポンスを得る機会を最大化している。


こうした観点に立ち、本白書では。大規模言語モデル(LLM)を利用した機械学習モデル・自然言語処理AI、自然言語クエリを処理するLLM、LLMによる自然言語処理アプリケーション、自然言語処理の生成を効率化・高速化する言語モデリング、多言語LLM、視覚言語モデル、生成系AIとの対話を支援するビジュアルファウンデーションモデルなどのテーマを重点的に取り上げている。


その他、自然言語処理(NLP)とLLMに関連する以下のテーマを取り上げて解説している。


 ● 自然言語処理モデルの事前学習とT5(Text-To-Text Transfer Transformer)

 ● ChatGPTの推論・対話機能をNLPアプリケーションに活用する方法

 ● 文脈内学習を持つLLM・AIフレームワーク

 ● 対話型解決エージェントで大規模言語モデル補完を強化するAIフレームワーク

 ● コードドキュメントの取得による自然言語によるコード生成

 ● 転移学習を利用した機械学習モデル・自然言語処理AI

 ● 推論と演技を相乗させるためのAIモデル

 ● 有害・不快なコンテンツを生成させない安全ルールを備えたLLM

 ● ユーザーフィードバックに基づくリアルタイムに近いモデル更新

 ● 高品質なラベル付きデータを必要とする自然言語処理アプリケーション

 ● ゼロショットChatGPT分類

 ● マルチモーダル大規模言語モデル

 ● 生成系AIとの対話を支援するビジュアルファウンデーションモデル

 ● 生成を3倍高速化する信頼性適応言語モデリング

 ● 多言語LLMのオープンソース化

 ● 自然言語クエリを処理するLLM APIとAIフレームワーク

 ● モバイルUIで会話型インタラクションを可能にするLLM

 ● 自然言語で携帯端末を操作するための学習データセット

 ● 視覚言語モデルとその応用可能性

 ● 自然言語処理とLLMの課題


※ なお、「次世代NLP(自然言語処理)と大規模言語モデル(LLM)」というテーマは、複眼的、立体的な視点で解明し、アプローチすることで、より精確で深みのある理解が得られるものである。当団体でもそうしたコンセプトで本白書を編纂している。


そのため、以下の白書(ほぼ当団体よりほぼ同時期に発刊)がそれぞれ独立して編纂されながらも、4巻セットとしてシリーズ編成されている。まとめて全4巻を購入された場合、特別に半額の価格設定で提供している。


■ 生成AI白書2023年版

  (A4判/約3,200ページ)

https://www.x-sophia.com/?pid=177427870


■ 大規模言語モデル(LLM)白書2023年版

  (A4判/約1,400ページ)

https://www.x-sophia.com/?pid=177427957


■ 機械学習/ディープラーニング(DL)/生成AI・大規模言語モデルと機械学習・DL白書2023年版

  (A4判/約1,340ページ)

https://www.x-sophia.com/?pid=177428005


※※ 各白書とも、英語版について近刊を予定している。


┌┌┌┌┌┌┌┌┌┌┌┌┌┌┌┌┌┌┌┌┌┌┌┌┌┌┌┌┌┌┌┌┌┌┌┌┌


▼ 内容等の詳細は、下記(リンク先)をご参照ください。


次世代NLP(自然言語処理)と大規模言語モデル(LLM)白書 2023年版 製本版

https://www.x-sophia.com/?pid=177428046


次世代NLP(自然言語処理)と大規模言語モデル(LLM)白書 2023年版 PDF版

https://www.x-sophia.com/?pid=177428071


(※ 「PDF版」はeメール/ダウンロードでの納品方法にも対応しています。)


● 監修・発行:


発行:一般社団法人 次世代社会システム研究開発機構


● 発刊日


2023年10月16日


■ 法人案内Webサイト(メディア向けのお問い合わせ先)


法人概要

http://www.x-sophia.com/?mode=sk#info


当団体刊行物に関する告知・案内Webサイト

http://www.x-sophia.com/


■ 法人のご紹介


当団体は、前身会社を含め、二十数年に渡って、産業/先進先端技術/経済/IT分野のシンクタンク活動(受託調査/各種レポート刊行/コンサルティング/寄稿・啓蒙活動/講演・講義/カンファランス議長およびセミナー講演)を展開してきた。


このうち、当団体の各種刊行物については、日本・海外の政府系シンクタンク、国内の主要研究所、コンサルティングファーム、産学官連携団体、大学、研究所、大手企業、投資ファンド、ベンチャーなどに納め、多数のご高評をいただき、今日に至っている。延べ、数百巻の刊行実績を持つ。英語版、中国語版を刊行し、対象とする購読層の幅を広げている。


本店・連絡先(お問い合わせ先)

〒140-0004

東京都品川区南品川4丁目4番17号 品川サウスタワー

Tel:03-5843-4365

Fax:03-6856-2861

Mobile:080-8533-9249

すべての画像


ビジネスカテゴリ
その他
ダウンロード
プレスリリース素材

このプレスリリース内で使われている画像ファイルがダウンロードできます

会社概要

URL
http://www.x-sophia.com/
業種
財団法人・社団法人・宗教法人
本社所在地
東京都品川区南品川4丁目4番17号 品川サウスタワー
電話番号
03-5843-4365
代表者名
森田 進
上場
未上場
資本金
-
設立
2014年09月