ACES、マルチモーダルAIによる対話動画中の重要シーン抽出に関する特許を取得
重要な質疑などのシーンを自動で抽出
企業独自の知識・ノウハウを「エキスパートAI」として実装し、人とAIの協働を実現する東京大学松尾研究室発のAIスタートアップである株式会社ACES(東京都文京区、代表取締役 田村 浩一郎、以下「ACES」)は、会議や講演会における重要シーンを容易に検索できる技術に関する特許を取得いたしましたのでお知らせいたします。
■特許の概要
本特許は、ビジネスコミュニケーションにおける重要シーンを自動的に検出する画期的な技術です。
従来のように画像情報、音声情報、言語情報をはじめとする単一の情報(=シングルモーダル)のみの分析では、複雑なコミュニケーションを正確に理解することができませんでした。
しかし、本特許を用いることで、複数の情報 (=マルチモーダル)を人の知見と組み合わせ、必要なシーンを特定できるようになります。
例えば、「質問に悩んでいるシーン」を検出する場合、質問の内容(言語情報)、返答までの間(音声情報)、視線や姿勢の変化(画像情報)といった複数の情報を総合的に分析します。
これにより、商談での重要な質疑応答や、会議での本質的な議論、プレゼンテーションでの聴衆の反応など、ビジネスパーソンが着目したい場面を正確に抽出します。
さらに、業界や用途に応じて検索条件を自由にカスタマイズでき、特定のシーンを検出するための特徴的な条件(例:質問の検知と会話の間など)は組織内で共有・再利用することが可能です。この技術により、同じような状況(質問に悩むシーンなど)を、営業活動の振り返り、重要な商談シーンの共有、新人研修でのフィードバックなど、様々なビジネスシーンで横断的に活用できます。
■背景
企業活動において、商談や会議でのコミュニケーションを科学的に分析し、振り返りの効率化や個人スキルの定量的な把握を実現することへの期待が高まっています。
例えば商談において、相手が強調して質問するシーンは、振り返り時に特に着目すべき重要な場面です。しかし、こういった複雑なコミュニケーションの場面を捉えるには、書き起こしの文章に自然言語処理を行うといった単一の情報処理では不十分でした。
そこでACESは、言語情報である会話内容に加え、音声の抑揚や姿勢・視線といった非言語情報も組み合わせて分析することで、より正確な重要シーンの特定を可能にする技術を開発しました。
■特許について
特許番号:特許第7591311号(P7591311)
発明の名称:動画情報検索装置、検索方法、検索プログラム、及び検索結果の利用方法
特許権者:
【識別番号】520008533
【氏名又は名称】株式会社ACES
■株式会社ACES 会社概要
東京大学松尾研発のAIスタートアップである株式会社ACESは、ヒトの認識・解析を行うHuman Sensing(ヒューマンセンシング)技術をはじめとした画像・映像解析のAIアルゴリズムを用いて、ヒトの知見を数式化し、リアル産業のDXを推進しています。AIアルゴリズムを事業価値に落とし込むデザイン力をコアコンピタンスとして、クライアント様と二人三脚でDXに取り組むDXパートナー事業、自社アルゴリズムを組み込んだソフトウェアを提供するアルゴリズムソフトウェア事業を行っております。
代表者:代表取締役 田村 浩一郎
所在地:東京都文京区湯島2丁目31−14 ルーシッドスクエア湯島3階
設立:2017年
事業内容 :DXパートナー事業、アルゴリズムソフトウェア事業
URL:https://acesinc.co.jp(コーポレートサイト)
お問合せ先:ryo.takahashi@acesinc.co.jp(高橋)
すべての画像
- 種類
- 商品サービス
- ビジネスカテゴリ
- パソコンソフトウェア
- ダウンロード