新聞記事で学習した人工知能「見出し生成API」公開中

朝日新聞社が専用ページで

株式会社朝日新聞社(代表取締役社長: 渡辺雅隆)は、自然言語処理研究(注1)の成果の一つである「自動見出し生成」の機能を体験できるAPI(Application Programming Interface)を、評価用途に限って無償で公開しました。
下記のウェブページで利用者登録の上、どなたでもご利用・ご評価頂けます。
https://cl.asahi.com
 

このAPIは、記事本文を入力すると、見出しの候補を数秒のうちに出力します。過去30年分の朝日新聞記事のデータを活用し、学習データとしての処理効率を上げるためのフィルタリングなどをした上で、ディープラーニング(深層学習)により、記事本文に対する見出しをなるべく正しく出力できるよう事前に学習させています。

なかでも、出力する見出しの長さをコントロールでき、ユーザーが指示した文字数に合わせて見出しを生成できることが特徴です。これは、記事が掲載されるメディアやデバイスによって、見出しの長さに厳しい文字数制限がある場合が多いため、実用上必要な技術となります。同時に複数の見出しを出力することもできます。

もともと自動見出し生成の技術は、一つの記事に対し、複数のバリエーションの見出しを付与したり、見出しのついていない長文の内容をひと目で把握したりする用途で期待されています。今回のAPIは必ずしも毎回完璧な見出しを出力できるわけではありませんが、公開することによって利用者からの評価や、需要・用途のフィードバックをいただくことを期待しています。公開は8月末までを予定しています。公開したAPIのモデルは評価用のため、現在開発中のものより精度が低くなっています。

朝日新聞社は、自動見出し生成に関しては、複数の学会やシンポジウムで賞を受賞しています(注2、注3)。自動見出し生成の研究を通じて得られたノウハウをもとに、利用者のご要望に応じたAPIのカスタマイズやチューニングも有償でお受けします。

今回公開したwebサイトではこのAPIのほか、機械学習用にカスタマイズされた記事データや、以前から公開している朝日新聞単語ベクトルも合わせて公開しています。今後も、研究を通じて得られた成果は本サイトで継続的に公開していく予定です。

<注1> 「自然言語」は、人間が使う言葉の総称で、自然言語処理は人工知能(AI)を支える研究分野の一つです。
<注2> NLP若手の会 (YANS) 第13回シンポジウム デモ賞   http://yans.anlp.jp/entry/yans2018report
<注3> 言語処理学会 第25会年次大会 若手奨励賞  https://www.anlp.jp/award/nenji.html

■朝日新聞社内の担当部門
朝日新聞社の中で、新規事業の開発やAIをはじめとする先端メディア技術の研究にあたる社内組織であるメディアラボと、社内のシステム開発や業務イノベーションに向けたIT技術研究・開発、技術者の育成を担う情報技術本部が中心となり、AIを利用した新事業開発・業務改革を進めています。
●メディアラボ
メディア環境の激変に立ち向かい、自らの殻を突き破るための新組織として2013年6月に発足。5年、10年先を視野に事業刷新と成長をめざし、新たなメディアの創造を含む新商品・新事業の開発、最先端技術の研究に取り組む。
●情報技術本部
2015年、社内のIT技術者を統合して発足した組織。新聞製作や社内業務、「朝日新聞デジタル」のシステム開発、社内の業務革新を目的としたIT技術研究・開発、技術者育成などを担当する。

<このリリースの問い合わせ先>
朝日新聞社メディアラボ 研究開発チーム  media-lab-rndpr@asahi.com
  1. プレスリリース >
  2. 株式会社朝日新聞社 >
  3. 新聞記事で学習した人工知能「見出し生成API」公開中