長文を圧縮し要約する「長文要約生成API」を公開中

新聞社ならではのデータを活用

株式会社朝日新聞社

株式会社朝日新聞社(代表取締役社長: 中村史郎)は、自然言語処理研究(注1)の成果の一つである「長文要約生成」の機能を体験できるAPI(Application Programming Interface)(https://cl.asahi.com/api_data/longsum.html)を公開しました。
(注1)「自然言語」は、人間が使う言葉の総称で、自然言語処理は人工知能(AI)を支える研究分野の一つです。


本APIは、長い文章を入力すると要約された文章を返します。文字数や割合を指定する事ができるので、用途に応じた文章を生成できます。過去30年分の朝日新聞記事のデータおよび、記事を生み出すフローで生み出される内部データを活用し、学習データとしての処理効率を上げるためのフィルタリングなどをした上で、ディープラーニング(深層学習)により可能となった技術です。

朝日新聞社はすでに、自動で見出しや要約を生成する「自動要約生成API TSUNA」(https://cl.asahi.com/api_data/headlinegeneration.html)をリリースしています。TSUNAで培ってきた技術をもとに研究を進め、文章を圧縮する技術を開発。今回は評価用途に限って無償で利用いただけるAPIを公開しました。

本APIでは下記の5つの機能を提供しています。
(1)入力された文章を、指定した長さごとに区切ってTSUNAにより要約する
(2)文ごとの長さが揃うように圧縮する
(3)文ごとに指定した割合まで圧縮する
(4)重要な文を抽出する
(5)抽出した重要文を圧縮し、文書全体を指定した長さにする
これらの機能を単独で使用したり、あるいは連結して組み合わせたりすることで、長文の内容を把握しやすく要約することが可能です。
Web上の文章やビジネス文章、議事録、エントリーシートの内容など、素早く内容を判別したい、速読したいといった用途にご活用できます。また、TSUNAと組み合わせることで、大量の文章に自動で見出しと要約を付与し、一覧にすることも可能です。

■ここまでの文章をTSUNAで見出し生成、本APIで要約し、3分の1の長さにした例
(すべての文を7割程度圧縮し、段落を自動で付与)

自然言語処理研究の成果「長文要約生成」のAPIを公開
自然言語処理研究(注1)の成果の一つである「長文要約生成」の機能を体験できるAPIを公開しました。要約された文章を返します。
用途に応じた文章を生成。ディープラーニング(深層学習)により可能となった技術です。自動で見出しや要約を生成する。文章を圧縮する技術を開発。APIを公開しました。
5つの機能を提供。TSUNAにより要約する。圧縮する。割合まで圧縮する。重要な文を抽出。文書全体を指定した長さにする。長文の内容を把握しやすく要約することが可能。素早く内容を判別したいといった用途にご活用できます。一覧にすることも可能です。

■朝日新聞社 メディア研究開発センターとは(https://cl.asahi.com) 
朝日新聞社では、メディアラボ・研究チームと、情報技術本部・研究開発チーム「ICTRAD」を統合し、「メディア研究開発センター」が2021年4月に発足しました。人工知能を始めとする先端メディア技術と、新聞社ならではの豊富なテキストや写真、音声などの資源を活用し、社内外の問題解決を目指すとともに、自然言語処理や画像処理をはじめとした先端技術の研究・開発を進めていきます。 (お問い合わせ先:mrad-contact@asahi.com)

■「長文要約生成API」 デモサイト
https://cl.asahi.com/api_data/longsum.html
・お問い合わせフォームよりAPIキーの取得が必要です。

すべての画像


会社概要

株式会社朝日新聞社

1,768フォロワー

RSS
URL
https://www.asahi.com/corporate/
業種
情報通信
本社所在地
東京都中央区築地5-3-2(東京本社)
電話番号
03-2354-7105
代表者名
代表取締役会長 中村史郎・代表取締役社長 角田克
上場
未上場
資本金
6億5000万円
設立
1879年01月