生成AIの特許を徹底分析：圧倒的強さの米国！ TPA（特許資産）では韓国・日本が2位・3位競う～大規模言語モデルでスケールする未来～

アスタミューゼ株式会社

2023年7月27日 09時22分

アスタミューゼ株式会社（本社：東京都千代田区、代表取締役社長永井歩）は、人工知能（AI）技術のなかでも近年とくに注目される生成AIの技術領域において、弊社の所有するイノベーションデータベース（論文・特許・スタートアップ・グラントなどのイノベーション・研究開発情報）を網羅的に分析し、動向をレポートとしてまとめました。

1.はじめに

近年、AI（人工知能）が驚異的な進化をとげています。「ChatGPT」や「STABLE DIFFUSION」に代表される生成AIは、自然言語（日常的な文章や対話）でプロンプト（prompt：呪文）を入力するだけで、翻訳や文章要約などのtext-to-text変換はもとより、画像や音声、動画・アニメや歌唱入りの音楽、小説やドラマの台本、さらにはプログラミングなど多様なアウトプットをすばやく半自動で生成する魔法のような技術です。これにより、ビジネスやイノベーション、クリエイティブなどの分野に革新をもたらしています。

AIの進化により、文字だけでなく音声や画像、動画など、さまざまな感覚入力が可能となりました。これを「マルチモーダルAI」と呼ぶこともあります。例えば、GoogleのAIチャットボット「Bard (PaLM2搭載) 」は、画像認識や文章読み上げ機能を追加してマルチモーダル化しています。

さらに、アップロードした画像について質問できる「MiniGPT-4」や、論文などのPDFを読み込んで質問できる「ChatPDF」、WebページやYouTube動画の要約や全文書き起こしができる「ChatGPT Glarity」や「Glasp」など、さまざまな媒体を処理できるGPTベースのアプリやモジュールが次々と登場しています。

また、「HuggingGPT」は、自然文による簡単な指示だけで複数の機械学習モジュールを組み合わせてタスクを半自律的にこなすアプリです。「AutoGPT」や「BabyAGI」、「GODMODE」など、外部ツールやデータにアクセスしながらタスクを立案、実施するGPTベースのプラットフォームも登場しています。

一方で、生成AIへの過剰な期待や過信に慎重な意見も少なくありません。「記号接地問題」（シンボル・グラウンディング：言葉の意味を理解しているか）や、高度なAI技術の驚異的な到達点（例えば「AI-directed science」）など、その負の側面が抱えるリスクは、あまり知られていない状況です。私たちはまさに、プレ・シンギュラリティとよぶにふさわしい状況を目の当たりにしています。

図1と図2は、2022年前後の生成AIの群雄割拠の様子をしめすAlan D. Thompson氏によるマップです。この1年でも、GPT-4の公開をふくめ、さまざまなセクター間でひしめき合うような動きが如実に示されています。この状況を、古生代カンブリア紀（およそ5億4200万年前から5億3000万年前のあいだ）の生物種の急激な増加と多様化を意味する「カンブリア爆発」になぞらえて、「生成AIのカンブリア爆発」と呼ばれることもあります。

図1：大規模言語モデル・生成AIの「カンブリア爆発」が始まった！出典：Alan D. Thompson,‘Inside language models (from GPT-4 to PaLM)’

図2：大規模言語モデル・生成AIの言語モデルのサイズ出典：Alan D. Thompson,‘Inside language models (from GPT-4 to PaLM)’

こうした生成AIの隆盛は、2017年にGoogleが発表した自然言語処理の深層学習モデルである「トランスフォーマー（transformer）」（注1）の想定外の能力がきっかけでした。自己注意（Self-Attention）機構により、もともとは翻訳などの文章変換の高速高精度化を目指して作られたものでしたが、2018年には「文脈を読める」革新的な自然言語処理モデルである「BERT」を生み出し、その後、Vision Transformer（ViT）やTransGANなど、画像や音声を含めた幅広い処理に応用できるようになりました。これらが今日の生成AIの基盤となっています。

注1：Attention Is All You Need：arXiv.1706.03762 (Jun 12, 2017)

図3：主な生成AIの公開・サービス開始動向

2. 世界の生成AI関連情報解析

今回、弊社保有の「特許」、「グラント（公的研究費）」、「論文」、「ベンチャー企業」のデータベースを活用し、GoogleがTransformerを発表した2017年以降の全世界の生成AI関連の動向を調べました。生成AIの開発だけでなく、応用や生成AI開発のための基盤技術などを含みます。ここでは、とくに最近の特許と論文の動向を中心に紹介します。

2-1.母集団定義

今回の母集団は、以下の「（要素1）＋（要素2）×（要素3）」の検索式を用いて作成しました。キーワードの統計解析（TFiDF）および抽出リストの目視確認により、ノイズは10％未満と判断しました。

要素1：生成AIの定義語： generative ai, pre-trained transformer, chatgpt など
要素2：AI定義語： artificial intelligence, deep learning, ConvNet, gans, lstm など
要素3：生成AI特徴語： transforming text, transformer model, generator model, text-to-image, prompt engineering, few-shot learning など

2-2.作成した母集団の概観

4つの異なるデータソースから母集団を構築し、主な指標を図4に示します。

図4：生成AI関連の4つのデータソース（特許・グラント・論文・ベンチャー）の主な指標

4つのデータソースすべてにおいて、米国または中国が首位。とくに特許出願数では中国（11,975件）が、グラント件数では米国（981件）がそれぞれ2位の2倍近い件数で他国を引き離しています。論文数では米中がほぼ互角（中国11,875件、米国11,174件）で3位のインドを5倍近い件数で圧倒。日本は特許出願数とグラント件数のいずれも4位です。

国ごとの特許資産の総量を表すTPA（total patent asset）合計では、米国が圧倒的な首位で、2位の韓国、3位の日本の7～8倍の値を示しました。件数が首位だった中国は4位になりました。

グラントの総配賦額（各国の基礎研究投資額の指標）では、米国が首位、英国が2位で両国が3位以下を大きく引き離しています。ベンチャー・スタートアップの新規設立数と資金調達額では、米国が圧倒的な首位を獲得しています。

4つのデータソースすべてで出現する母集団特徴語（本領域の特徴的なキーワード）は、おおむね深層学習に関連するものであり、ベンチャー以外の3つのデータソースでも多く見られる研究テーマです。

2-3.世界の特許出願および論文発表動向

（1）主要国の生成AI関連特許出願数（年次推移）

特許母集団31,000件余のうち、出願人名寄せにより、帰属国があきらかになった60カ国3,600社余の特許25,000件余について、年次推移を示したものが図5です。

図5：生成AIに関する特許出願数の年次推移（出願人帰属国別）

中国からの出願数が圧倒的に多く、それにつぐ米国、韓国、日本を大きく引き離しています。また、米国は2020年、韓国と日本は2019年をピークに、以降は出願件数が減少しています。2022年以降は未公開が多いため、集計していません。

（2）主要国の生成AI関連論文発表数（年次推移）

論文母集団約75,000件について、主著者所属機関の帰属国別の年次推が図6です。

図6：生成AIに関する論文件数の年次推移（所属機関帰属国別）

米国（11,174件）と中国（11,875件）がほぼ互角です。2012年以降の直近まで、ほぼ並行した動きとなっています。3位以下のインド、英国、ドイツ、韓国などは論文件数で大きく劣後しています。日本は論文総数で7位（1,367件）となっています。

論文にくらべると、特許出願における米国の降下傾向は矛盾しているように見えます。しかし、中国の特許は国内出願が多く、有効特許の半数以上を国際出願している日・米・欧と単純比較することはできません。

AIに限らず、多くの分野で中国の特許が飛躍的に伸びている背景には、中国政府が2006年に策定した「国家中長期科学技術発展計画（2006-2020年）」（注2）があります。この政策により、中国は研究開発支出の対GDP比率を2020年までに2.5%以上に引き上げることをめざし、自国企業による自主的なイノベーションを推進してきたと考えられています。

注2：中国のイノベーション政策の効果推計-企業データを用いた分析（独立行政法人経済産業研究所）

https://www.rieti.go.jp/jp/publications/nts/14e056.html

（3）GAFAM等注目企業の論文発表

GAFAMを中心に、AI関連の注目企業の論文発表件数の推移をまとめたものが図7です。

図7：生成AIに関する注目各社の論文発表数の年次推移（共著・共研含む）

件数を見ると、Googleが818本、Microsoftが662本で、Facebook以下を大きく引き離していることがわかりました。

Googleの論文としては、冒頭でもふれた「トランスフォーマー」の論文「Attention Is All You Need」（注1）が圧倒的な引用数（76,000件以上）で有名です。

Microsoftは「Sparks of Artificial General Intelligence」という論文（注3）が要注目です。GPT-4がAGIの事実上の初期バージョンだということが語られています。

注3：Sparks of Artificial General Intelligence: Early experiments with GPT-4：arXiv:2303.12712 (Apr 13, 2023)

OpenAIは「自然言語モデルのサイズと計算予算が増加するにつれてなめらかに性能が向上し、べき乗法と定数スケーリング法則にしたがう」などの「Scaling Laws」に関する論文（注4）を発表しています。OpenAI自体の論文は少ないのですが「GPT-3 or 4」「ChatGPT」に言及する他者による論文は約2,700件におよび、研究者や投資家の関心の高さがうかがえます。

注4：Deep Learning Scaling is Predictable, Empirically：arXiv:1712.00409 (Dec 1, 2017) / Scaling Laws for Neural Language Models：arXiv:2001.08361 (Jan 23, 2020) / Scaling Laws for Autoregressive Generative Modeling：arXiv:2010.14701 (Oct 28, 2020)

（以降、アスタミューゼ独自の手法による国別および企業別の特許スコアリングのランキングと、企業別の注目特許、まとめとしての展望についてはアスタミューゼ株式会社のコーポレートサイトでご確認いただけます）

https://www.astamuse.co.jp/report/2023/230727-gai/

著者：アスタミューゼ株式会社　エグゼクティブチーフサイエンティスト　川口伸明（薬学博士）

【関連記事】

本稿の元データを利用した記事「Google一転、検索に生成AI導入　Microsoftを追う　攻防生成AI（上）」が、日本経済新聞 2023年7月3日電子版および4日紙面テック面トップに掲載されています。

https://www.nikkei.com/article/DGXZQOGN240HK0U3A620C2000000/

さらに詳しい分析は……

アスタミューゼは世界193ヵ国、39言語、7億件を超える世界最大級の無形資産可視化データベースを構築しています。同データベースでは、技術を中心とした無形資産や社会課題/ニーズを探索でき、それらデータを活用して136の「成長領域」とSDGsに対応した人類が解決すべき105の「社会課題」を定義。

それらを用いて、事業会社や投資家、公共機関等に対して、データ提供およびデータを活用したコンサルティング、技術調査・分析等のサービス提供を行っています。

本件に関するお問い合わせはこちらからお願いいたします。

https://www.astamuse.co.jp/contact/

すべての画像