AppierチーフAIサイエンティスト ミン・スン、新型コロナウイルス対策とビジネス推進に有用な「シーケンシャル・データのモデリング」に関する考察と予測を発表
AI(人工知能)テクノロジー企業のAppier(エイピア、共同創業者/CEO:チハン・ユー、以下Appier)は、チーフAIサイエンティストであるミン・スンが、新型コロナウイルス対策とビジネス推進に有用な、「シーケンシャル・データのモデリング」に関する考察と予測を発表したことをお知らせします。なお、シーケンシャル・データとは、連なったデータと定義し、並んでいる順番に処理することや、連続して立て続けに処理することを指します。
1.新型コロナウイルス対策に活用される「シーケンシャル・データのモデリング」
ミン・スンは、現在フェイクニュースの検出などで利用されている「シーケンシャル・データのモデリング」が、新型コロナウイルスの突然変異の予測、抗ウイルス薬の開発にも活用され始めていると説明しました。
新型コロナウイルス関連の研究論文は、世界中から毎日新しいものが発表されています。日本では東京大学や理化学研究所のAIPセンターなどが発表しています。AIがその膨大な量の研究論文を集約・分析することや、ソーシャルメディア上で新型コロナウイルスや感染症対策に関する「フェイクニュース」の検出を可能にしています。
また、「シーケンシャル・データのモデリング」は、生物医学領域の系列データ予測にも活用されています。アミノ酸配列を文字列に置き換え、分析することで新型コロナウイルスを構成するたんぱく質の3D構造を予測することができます。
AlphaFold 2はこれを活用してタンパク質がどのような機能で、どのような役割を果たすのかなど様々な発見に役立てられています。
ハーバード大学の研究者たちは、これらと同じような技術を用いて新型コロナウイルスの突然異変を予測しています。
抗ウイルス薬の開発
このようなスクリーニングプロセスが開発される前は、1日に処理できるスクリーニングの対象の数が数百万単位でしたが、AIを活用することで完全なエンドツーエンドのスクリーニングのパイプラインが開発され、1日に処理できる数が数十億となりました。それにより、従来の手法に比べて最高5万倍の速度で化合物を評価できるようになりました。ミン・スンは、この成果を「研究のポイントはエンドツーエンドのパイプラインの中にAIを導入し、そして堅牢なパイプラインを作り上げたことだ」と説明しています。
2.「シーケンシャル・データのモデリング」によるビジネスの促進
ミン・スンは、シーケンシャル・データのモデリングは、ビジネスにおいては特に「テキスト」と「音声」の2つの分野で有用だと述べます。
テキストの理解と生成
昨年、1,000億を超えるパラメーターを扱える大規模言語モデルGPT-3が注目されましたが、今年に入り、その6倍以上の兆レベルのパラメーターに対応した「Switch Transformer」が登場しました。ミン・スンは、学習コストや提供コストが抑制され、今後1~3年で言語の理解や生成能力が大きく進歩すると予測します。
音声サービス発展の可能性について予測
音声データの文字起こしは、英語・中国語・日本語などのビジネスシーンで利用者が多い言語では成熟しつつあります。一方長尺の音声においては、それ以外の言語への対応は十分とはいえず、5~10%のエラーが出てしまうのが現状です。
昨年、新型コロナウイルスによる巣ごもり需要で、長尺の音声コンテンツが人気となり、Clubhouseなどの会話型SNSがヒットし、日本での利用者が増えています。増加している音声データをどう活用するかがビジネス上でのポイントになります。
GPT-3やSwitch Transformerなどで利用できる‶自己教師あり学習”を適用すると、入力用の音声ファイルからアノテーションなしで教師用データを抽出できます。
音声は生データのサンプリングから、音素に分解、音節を特定し、単語に結びつけていくという手間が加わります。そのため、連続性を持った長尺の音声は、データポイントが膨大になる上、複雑な階層構造があるため、学習が難しいとされています。ミン・スンはAI技術の進歩により、今後1~3年で長尺音声の文字起こしが可能になると予測します。さらに音声データを直接検索したり、ソーシャルチャネルでやり取りされる音声でトレンド分析するようなことも可能となるだろう、他人の声を使って成りすます音声クローンのような使い方が出てくる懸念はあるものの、リモート会議中の自分の音声を加工し、プロのアナウンサーのような美声にしたり、ものを食べている咀しゃく音をカットできる技術もまもなく利用可能になるだろうと予測しました。
Appier について
Appier は、AI(人工知能)テクノロジー企業として、企業や組織の事業課題を解決するための AI プラットフォームを提供しています。詳細はhttps://www.appier.com/ja/をご覧ください。
※過去の発表はhttps://www.appier.com/ja/news/をご覧ください。
Appier チーフAIサイエンティスト MIN SUN(ミン・スン)
2005年からGoogle Brainの共同設立者の一人であるAndrew Ng(アンドリュー・エン)氏、元Google CloudのチーフサイエンティストであるFei-fei Li(フェイフェイ・リー)氏などのプロジェクトに携わり、AAAI(アメリカ人工知能学会)をはじめ世界トップの人工知能学会で研究論文を発表。2014年に国立清華大学の准教授に就任。2015年から2017年には、CVGIP(Computer Vision Graphics and Image Processing)Best Paper Awardsを3年連続で受賞。専門分野は、コンピュータビジョン、自然言語処理、深層学習、強化学習。2018年には「研究者には肩書きよりもデータが必要」と感じ、AIテクノロジー企業AppierにチーフAIサイエンティストとして参画。新製品の開発、既存製品の機能改善のほか、記述的な課題解決を行う。
1.新型コロナウイルス対策に活用される「シーケンシャル・データのモデリング」
ミン・スンは、現在フェイクニュースの検出などで利用されている「シーケンシャル・データのモデリング」が、新型コロナウイルスの突然変異の予測、抗ウイルス薬の開発にも活用され始めていると説明しました。
新型コロナウイルス関連の研究論文は、世界中から毎日新しいものが発表されています。日本では東京大学や理化学研究所のAIPセンターなどが発表しています。AIがその膨大な量の研究論文を集約・分析することや、ソーシャルメディア上で新型コロナウイルスや感染症対策に関する「フェイクニュース」の検出を可能にしています。
生物医学領域における系列データのモデリングにより、変異を予測
また、「シーケンシャル・データのモデリング」は、生物医学領域の系列データ予測にも活用されています。アミノ酸配列を文字列に置き換え、分析することで新型コロナウイルスを構成するたんぱく質の3D構造を予測することができます。
AlphaFold 2はこれを活用してタンパク質がどのような機能で、どのような役割を果たすのかなど様々な発見に役立てられています。
ハーバード大学の研究者たちは、これらと同じような技術を用いて新型コロナウイルスの突然異変を予測しています。
抗ウイルス薬の開発
アメリカの国立研究所などが開発した「IMPECCABLE」(インペカブル)は、新型コロナウイルス感染症候補薬を評価し、創薬の工法をスクリーニングするために使われています。これはAIとコンピュータ処理ツール、そしX線結晶学の構造解析の組み合わせによる統合モデリングパイプラインです。
このようなスクリーニングプロセスが開発される前は、1日に処理できるスクリーニングの対象の数が数百万単位でしたが、AIを活用することで完全なエンドツーエンドのスクリーニングのパイプラインが開発され、1日に処理できる数が数十億となりました。それにより、従来の手法に比べて最高5万倍の速度で化合物を評価できるようになりました。ミン・スンは、この成果を「研究のポイントはエンドツーエンドのパイプラインの中にAIを導入し、そして堅牢なパイプラインを作り上げたことだ」と説明しています。
2.「シーケンシャル・データのモデリング」によるビジネスの促進
ミン・スンは、シーケンシャル・データのモデリングは、ビジネスにおいては特に「テキスト」と「音声」の2つの分野で有用だと述べます。
テキストの理解と生成
昨年、1,000億を超えるパラメーターを扱える大規模言語モデルGPT-3が注目されましたが、今年に入り、その6倍以上の兆レベルのパラメーターに対応した「Switch Transformer」が登場しました。ミン・スンは、学習コストや提供コストが抑制され、今後1~3年で言語の理解や生成能力が大きく進歩すると予測します。
音声サービス発展の可能性について予測
音声データの文字起こしは、英語・中国語・日本語などのビジネスシーンで利用者が多い言語では成熟しつつあります。一方長尺の音声においては、それ以外の言語への対応は十分とはいえず、5~10%のエラーが出てしまうのが現状です。
昨年、新型コロナウイルスによる巣ごもり需要で、長尺の音声コンテンツが人気となり、Clubhouseなどの会話型SNSがヒットし、日本での利用者が増えています。増加している音声データをどう活用するかがビジネス上でのポイントになります。
GPT-3やSwitch Transformerなどで利用できる‶自己教師あり学習”を適用すると、入力用の音声ファイルからアノテーションなしで教師用データを抽出できます。
音声は生データのサンプリングから、音素に分解、音節を特定し、単語に結びつけていくという手間が加わります。そのため、連続性を持った長尺の音声は、データポイントが膨大になる上、複雑な階層構造があるため、学習が難しいとされています。ミン・スンはAI技術の進歩により、今後1~3年で長尺音声の文字起こしが可能になると予測します。さらに音声データを直接検索したり、ソーシャルチャネルでやり取りされる音声でトレンド分析するようなことも可能となるだろう、他人の声を使って成りすます音声クローンのような使い方が出てくる懸念はあるものの、リモート会議中の自分の音声を加工し、プロのアナウンサーのような美声にしたり、ものを食べている咀しゃく音をカットできる技術もまもなく利用可能になるだろうと予測しました。
Appier について
Appier は、AI(人工知能)テクノロジー企業として、企業や組織の事業課題を解決するための AI プラットフォームを提供しています。詳細はhttps://www.appier.com/ja/をご覧ください。
※過去の発表はhttps://www.appier.com/ja/news/をご覧ください。
Appier チーフAIサイエンティスト MIN SUN(ミン・スン)
2005年からGoogle Brainの共同設立者の一人であるAndrew Ng(アンドリュー・エン)氏、元Google CloudのチーフサイエンティストであるFei-fei Li(フェイフェイ・リー)氏などのプロジェクトに携わり、AAAI(アメリカ人工知能学会)をはじめ世界トップの人工知能学会で研究論文を発表。2014年に国立清華大学の准教授に就任。2015年から2017年には、CVGIP(Computer Vision Graphics and Image Processing)Best Paper Awardsを3年連続で受賞。専門分野は、コンピュータビジョン、自然言語処理、深層学習、強化学習。2018年には「研究者には肩書きよりもデータが必要」と感じ、AIテクノロジー企業AppierにチーフAIサイエンティストとして参画。新製品の開発、既存製品の機能改善のほか、記述的な課題解決を行う。
このプレスリリースには、メディア関係者向けの情報があります
メディアユーザーログイン既に登録済みの方はこちら
メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。
すべての画像