世界最大級のAIデータ分析コンペティション「Kaggle」で金メダルを獲得

株式会社NTTドコモ

 株式会社NTTドコモ(以下、ドコモ)の鈴木明作(すずきめいさく)、宮木健一郎(みやきけんいちろう)を含むチーム(以下、本チーム)は、世界最大級のAIデータ分析コンペティションプラットフォーム「Kaggle(カグル)」※1で2025年7月から開催された国際コンペティション「Jigsaw - Agile Community Rules Classification」(以下、本コンペティション)※2において、全2,445チーム中11位に入賞し、金メダルを獲得しました。

また鈴木社員は、「Kaggle」コンペティションに参加している約20万人※3の上位約1%に相当する「Kaggle Master※4」の称号を獲得しました。

       左から鈴木明作、宮木健一郎

 「Kaggle」は、2,700万人以上※3のデータサイエンティストや機械学習エンジニアなどが登録をしており、実社会の課題に対して最先端のアルゴリズムを活用し、その精度を競うAIデータ分析コンペティションプラットフォームです。本コンペティションでは、コミュニティルール配下におけるテキスト分類がテーマであり、オンライン掲示板「Reddit」※5に投稿されたコメントが、コミュニティごとに設けられたルール(広告掲載の禁止など)に違反しているかを判定するタスクが設定され、本チームではコミュニティのルールと投稿文の文脈理解に対して、多様なAIモデルにより予測を行う手法を提案し、タスクの解決につなげることができました。

 ドコモでは、ビッグデータを活用した広告ターゲティングのための顧客理解エンジン「docomo
Sense®※6」など、大規模言語モデルを始めとするAIを活用した技術開発に取り組んでいます。ドコモは、今後もデータサイエンス分野の人材育成に向け、「Kaggle」を始めとするさまざまなコンペティションへの社員参加を推奨し、最先端かつ世界最高峰のAI技術を習得すると共に、得られた知見や技術を活用した新たな付加価値をお客さまに提供できるよう取り組んでまいります。

※1 https://www.kaggle.com/

※2 https://www.kaggle.com/competitions/jigsaw-agile-community-rules

※3 2025年11月21日時点

※4 Kaggleでは個人のメダル獲得枚数に応じて4つのランクが設定されており、上から2番目のKaggle Masterは金メダル1枚と銀メダル2枚以上の獲得が条件となっている

※5 https://www.reddit.com/

※6 https://ssw.web.docomo.ne.jp/marketing/strengths/sense/

*「docomo Sense」は、株式会社NTTドコモの登録商標です。


別紙

            本コンペティションの概要

1. テーマ:

   本コンペティションでは、オンライン掲示板(Reddit)のコメントがコミュニティのルールに違反しているかの分類精度を競うテーマが設定されました。参加チームは提供された詳細データから問題設定に適した手法を考案し、そのテキスト分類精度を競いました。

  •  提供データ(主なデータを抜粋)

      ➣   コミュニティルール︓掲示板のコミュニティごとに設けられたルールテキスト(計6つ)

          ✧   例. 広告禁止、法的助言の禁止 など

      ➣   正例サンプル︓コミュニティルールに違反しているサンプルテキスト

      ➣   負例サンプル︓コミュニティルールに違反していないサンプルテキスト

      ➣   違反判定結果︓0 or 1の二値情報

  •    問題設定

     本コンペティションでは、以下の図1に示す通り、オンライン掲示板であるRedditへの投稿コメンが、6つのコミュニティごとに設けられた各ルールに違反しているかを判定します。

               図1. 本コンペティションの問題設定

2.  提案した解法:

  鈴木社員、宮木社員を含むチームは、提供データにあるサンプルが実際にRedditに投稿された場合に、コミュニティルールの違反になるかをという情報を各AIモデルにオンラインで学習させる手法を元に、今回の解法の検討を行いました。オンライン学習を行うAIモデルには、下記のように得意分野が異なるAIモデルを13個使い、各AIモデルの予測結果を組み合わせ、更に予測対象データを予測後に作成されたラベルを使って再度予測対象データにより学習を行う疑似ラベル(Pseudo Label)や、一部のAIモデルではルールごとにAIモデルを作成するなどの工夫を行うことで、精度が高い予測結果を導く手法を提案しました(図2)。

  •     活用したAIモデル

        ➣   LLM ※1︓テキストの次の単語を予測することが得意なAI

        ➣   埋め込みモデル ※2︓テキストの意味情報の近さを扱うことが得意なAI

        ➣   分類モデル ※3︓テキストの分類が得意なAI

                                            図2. 金メダル獲得解法

※1 大規模言語モデル

※2 テキストや画像などのデータを数値ベクトルに変換するモデル

※3 入力データをあらかじめ定義されたカテゴリ(クラス)に分類するための機械学習モデル

このプレスリリースには、メディア関係者向けの情報があります

メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。

すべての画像


ビジネスカテゴリ
その他
ダウンロード
プレスリリース素材

このプレスリリース内で使われている画像ファイルがダウンロードできます

会社概要

株式会社NTTドコモ

107フォロワー

RSS
URL
https://www.docomo.ne.jp/
業種
情報通信
本社所在地
東京都千代田区永田町2丁目11番1号 山王パークタワー
電話番号
-
代表者名
前田 義晃
上場
未上場
資本金
-
設立
-