松尾研究所のデータサイエンティスト、Kaggle金メダル獲得で「Grandmaster」昇格!古代アッシリア語翻訳に挑むAI技術の最前線

松尾研究所のデータサイエンティストがKaggleで金メダル獲得、Grandmasterに昇格!

AI研究と社会実装を推進する株式会社松尾研究所のデータサイエンティスト、奥村悠希氏が、世界中のAIエンジニアが腕を競う最大規模のオンラインプラットフォーム「Kaggle(カグル)」主催のコンペティション「Deep Past Challenge – Translate Akkadian to English」において、見事金メダルを獲得しました!🏆✨

今回の受賞により、奥村氏は世界で393人目となる「Kaggle Competitions Grandmaster」の称号を手にしました。これは、約20万人の競技人口のうち上位わずか0.2%にしか与えられない、データサイエンス分野における最高峰の栄誉です。この偉業は、松尾研究所のデータサイエンティストが持つ発想力と技術力が世界レベルで高く評価されたことを示しています。

松尾研究所ロゴ

約4,000年前の古代アッシリア語翻訳に挑む

奥村氏が参加した「Deep Past Challenge」は、約4,000年前の古代アッシリア商人たちが残した楔形文字文書を対象に、転写された古アッシリア語(アッカド語の一方言)を英語へ翻訳するモデルの構築が求められる、非常に難易度の高いコンペティションでした。

データが限られ、文法も複雑な古代言語に対応した翻訳モデルの設計・実装は、まさにAI技術の最前線を行く挑戦です。商業記録や書簡をいかに正確に英語へ翻訳できるかが競われ、その成果は歴史研究にも大きく貢献する可能性を秘めています。

受賞者が語る、課題解決へのアプローチ

奥村悠希氏(株式会社松尾研究所 データサイエンティスト)は、今回のコンペティションでの取り組みについて次のようにコメントしています。

「アッカド語は低リソース言語であるため、学習データの拡充が必要不可欠でした。そのため、VLM(Vision-Language Model)を用いてPDF形式の非構造化データを整理しながら、対訳コーパスを丁寧に抽出しました。さらに、継続事前学習や逆翻訳データの追加など、翻訳モデルの性能向上に役立つ手法も活用し、精度向上につなげることができました。今回のコンペティションをきっかけに、アッカド語の解析がさらに進むことを願っています。」

このコメントからは、限られたリソースの中で最大限の成果を引き出すための、奥村氏の深い洞察と革新的なアプローチがうかがえます。特に、VLMを活用したデータ整理や、継続事前学習・逆翻訳といった高度な技術の適用は、多くのデータサイエンティストにとって示唆に富む内容でしょう。💡

松尾研究所が目指すAI社会実装と人材育成

松尾研究所は、国立大学法人 東京大学大学院 工学系研究科 松尾・岩澤研究室と連携し、大学を中心としたイノベーションエコシステムの構築と発展を目指しています。アカデミアから生まれる研究成果・技術の「開発・実装」を通じて、広く社会への普及と日本の産業競争力向上に貢献しています。

同研究所には、今回Grandmasterに昇格した奥村氏をはじめ、Kaggle Grandmasterクラスのトップレベルのデータサイエンティストが多数在籍し、日々切磋琢磨しながらAIの社会実装に取り組んでいます。高いレベルでAIの挑戦を志す方々にとって、これほど刺激的な環境は他にないでしょう。

松尾研究所でのキャリアに興味をお持ちの方は、以下の求人をご確認ください。まずはカジュアル面談から、あなたの可能性について語り合ってみてはいかがでしょうか?

今回の奥村氏の快挙は、AI技術が歴史研究という新たな領域で大きな可能性を拓くことを示唆しています。松尾研究所の今後のさらなる活躍に期待が高まります。🚀

この記事を書いた人 Wrote this article

lightstone

TOP