Kaggle Grandmaster Chen、Kaggle Master 劉・竹ノ内によるRist社員チームがKaggleコンペティションで金メダルを獲得
本コンペティションは、「University of British Columbia (UBC)」の主催で2023年10月6日〜2024年1月3日にかけて開催され、卵巣がんのサブタイプ分類を行うタスクでした。
卵巣がんには複数のサブタイプが存在し、今回提供されたデータセットにはそのうち5つのサブタイプが含まれていました。これら5つのサブタイプを正確に分類するほか、提出時には学習データに存在しないレアなサブタイプを、別個1クラスとして予測するという点が特徴でした。
また、WSI(Whole Slide Image)という形式の、1辺あたり数万pxもする巨大な画像を扱う点も特徴の一つでした。
Chen、劉、竹ノ内のチームは個人・複数人からなる全1,326チーム中5位に入賞し、金メダルを獲得いたしました。
本コンペティションの結果はこちらからご覧いただけます。
https://www.kaggle.com/competitions/UBC-OCEAN/leaderboard
Chenコメント
In this competition, we need to work with ultra-high-resolution images. If we divide the images into patches, we will be dealing with hundreds of sets of patches, each consisting of thousands of patches, but with only one overall label for each set. We have tried many approaches to address this issue, including patch importance models, multiple instance learning models, and so on.
The size and data format of the images have also posed additional challenges for inference.
Thanks to the hard work of my teammates, we secured a place in the gold medal zone.
劉コメント
本コンペティションでは、学習データとして主に全スライド画像(WSI)を使用しましたが、テストデータには組織マイクロアレイ(TMA)が多く含まれるという特徴があり、これが大きな課題でした。重要なことは、WSIデータで学習していながらも、TMAの予測精度を高める方法を見出すことでした。この問題に対処するため、まずWSIとTMAのスケールを調整し、WSIからTMAに近い特性を持つデータを選択するためにデータマイニングを実施しました。このアプローチによって、最終的に良い結果を得ることができました。
このコンペティションを通じて、データマイニングの重要性を改めて深く認識しました。
今後の業務においても、データの品質に対する意識を一段と高め、それを優先することが必要だ
と感じています。また、今回のコンペでは特化したStain Normalizationという後処理技術が非常に有効でした。深層学習と画像処理関数の適切な組み合わせによって優れた結果を得ることができ、これからも深層学習に限らず、様々な手法を組み合わせて進めることの重要性を実感しました。
竹ノ内コメント
画像が大きくそのままでは扱えないので、パッチ分割することを考えました。パッチ分割したとしても、使えるパッチ数には計算リソース的な制約があるため、腫瘍部分にフォーカスして選択できる枠組みを考えました。また、WSIが20を超える施設から集められていたため、施設ごとのばらつきを吸収する仕組みを考えることも大事でした。手元での評価を機能させることができず、実験サイクルがうまく回せなかったため、モデルの性能に自信が持てませんでした。最後まで不安が残るコンペでしたが、なんとかprize圏内という結果に落ち着いて安心しました。
本コンペティションを通じて、巨大な画像を扱う時のコツを学ぶことができました。ライブラリの選定や、中間データにどの形式を使用するべきか、など細かいところで実験の効率が大きく変わりました。
病理診断の場で応用が効く技術だと思うので、業務で機会があれば今回得た知見を活かしていきたいです。
Kaggleとは
Kaggleとは、登録者数1,600万人(※1)を超える世界最大級のデータ分析プラットフォームです。企業や団体からコンペティション形式で出題された課題に対し、Kagglerと呼ばれるKaggleに登録するユーザーたちが分析モデルの精度を競います。
Kaggleのコンペティション参加者は、成績に応じてKaggle Grandmaster、Kaggle Master、Expert、Contributor、Noviceの順にランク分けされます。最上位のKaggle Grandmasterは世界に319人(※2)しかおらず、優秀なAIエンジニア・データサイエンティストを表す称号としても知られています。
※1、2 2023年1月10日時点。
世界最高クラスのAIエンジニア・データサイエンティストが在籍する「Rist Kaggle Team」
Ristは2020年より、優秀な成績を持つKagglerを積極的に採用する「Kaggle枠採用」を開始すると同時に、世界最高クラスのAIエンジニア・データサイエンティストで構成される「Rist Kaggle Team」を創設しました。現在、Rist Kaggle TeamにはKaggle Grandmasterが6名、Kaggle Masterが5名在籍しており、高難度なデータ分析・AI技術を用いたソリューション提供・プロダクト開発などに従事しています。
Ristでは、2026年3月末までに「Rist Kaggle Team」を20名に増員することを目標に、今後「Kaggle枠採用」に力を入れてまいります。
Ristについて
Ristは先端技術を取り入れることで顧客企業や社会の課題を解決し、価値提供を行います。
人工知能技術Deep Learningなどを用いて、[工場×AI]をコンセプトに画像AI事業の「Deep Inspection」、データ分析事業の「Deep Analytics」の2つの領域で、お客様に合わせた幅広いAIシステムをオーダーメイドで開発しています。
AIを用いたシステムの社会実装を加速させるため、2018年12月に京セラコミュニケーションシステムの完全子会社となりました。
- 会社名:株式会社Rist
- 所在地:京都府京都市下京区五条通河原町西入本覚寺前町830 京都エクセルヒューマンビル 7階
- 設立日:2016年8月1日
- 代表取締役社長:長野 慶
- URL: https://www.rist.co.jp
※記載されている会社名、ロゴ、システム名、商品名、ブランド名などは、各社の商号、登録商標、または商標です。
このプレスリリースには、メディア関係者向けの情報があります
メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。
すべての画像
- 種類
- その他
- ビジネスカテゴリ
- システム・Webサイト・アプリ開発
- ダウンロード