ソフトバンクのデータサイエンティストがKaggle主催のコンペティション「The Learning Agency Lab - PII Data Detection」で金メダルを獲得

2024/06/18  ソフトバンク 株式会社 

ソフトバンクのデータサイエンティストが
Kaggle主催のコンペティション「The Learning Agency
Lab - PII Data Detection」で金メダルを獲得

2024年6月18日
ソフトバンク株式会社

ソフトバンク株式会社(以下「ソフトバンク」)は、世界最大のAI(人工知能)コンペプラットフォーム「Kaggle(カグル)」主催のコンペティション「The Learning Agency Lab - PII Data Detection」(以下「本コンペティション」)で、ソフトバンクのAI戦略室 AI&データサイエンス統括部 AIシステム開発部に所属するデータサイエンティストの荻野聖也(おぎの・まさや)がチームで第14位となり、金メダルを獲得しましたのでお知らせします。また、荻野は、本コンペティションで通算2枚目の金メダルを獲得したことにより、「Kaggle」に参加する20万人超のうち上位0.2%にランクインしています。(2024年6月1日時点)

本コンペティションは、生徒の文章から個人を特定できる情報(PII:Personally Identifiable Information)を検出するモデルの性能を競うものです。このたび、本コンペティションに参加する2,048チームの中で第14位の成績となり、チームで金メダルを獲得しました。ソフトバンクは、テキスト分析やチャットボットなどの自然言語処理技術や大規模言語モデル(LLM)を応用したAIシステムの開発を推進しており、本コンペティションで得られた知見や経験を基に、より高度なAIシステムの実現を目指します。

ソフトバンクの荻野聖也は、次のように述べています。
「チームメンバーの皆さんに心から感謝申し上げます。ラベルを含むサンプルを持つデータが学習データには非常に少なく、どのようにパイプラインを作るか、どのように外部データを活用していくかという難しさがありました。疑似的な個人情報を基に作成したプロンプトから、大規模言語モデルで作成した追加データを巧みに活用したこと、ルールベースの手法を機械学習とミックスさせたことなどにより、精度を向上できた点が金メダル獲得の要因だと考えています。大規模言語モデル自体を学習データの作成に用いるというのは、これまでのコンペティションではなかったため、非常に面白く、本コンペティションを通して業務でも生かせる技術を会得できたと思います。本コンペティションで得られた経験を業務に還元しつつ、『Kaggle Grandmaster』を目指して、引き続き技術研鑽に励んでいきます」

ソフトバンクは、SDGs(持続可能な開発目標)の達成を経営の重要事項と位置付け、六つのテーマを重要課題として定めています。その一つとして、5G(第5世代移動通信システム)やAIなどの最新のテクノロジーを活用した「DX(デジタルトランスフォーメーション)による社会・産業の構築」を掲げています。AIを応用した新しいソリューションの開発やビジネスの変革を強力に推進するとともに、優れたAIの技術者の育成を引き続き推進していきます。

  • SoftBankおよびソフトバンクの名称、ロゴは、日本国およびその他の国におけるソフトバンクグループ株式会社の登録商標または商標です。
  • その他、このプレスリリースに記載されている会社名および製品・サービス名は、各社の登録商標または商標です。

関連業界