CTO大川幸男が、東京大学大学院数理科学研究科の講義で課題を提供
株式会社MiDATAは、2026 年2月2日(月) ~ 2月6日(金)に開催される東京大学大学院数理科学研究科の講義「産業界からの課題解決のためのスタディグループ」にて、課題提供を行います。
課題内容
日常的なWebサービスにおいて、ユーザーの過去の行動から嗜好を推定する「レコメンデーション」は機械学習の主要な応用例である。特に「購入」や「閲覧」といった正の行動履歴のみが観測される「暗黙的フィードバック(Implicit Feedback)」の解析は、産業界において極めて重要である。しかし、未観測のデータが「興味がない(負例)」のか、単に「アイテムを知らなかった(欠損)」のかを数理的にどう扱うべきかという1 「負例の不確実性」が、推定の精度や妥当性を左右する大きな課題となっている。 本講座では、標準的な手法である「行列分解(Matrix Factorization)」を基礎に据え、暗黙的フィードバック下での負例のサンプリング手法(BPR 等)に関する数理的な発展の経緯を調査・理解することを目指す。 一方、近年の実務においては「候補生成とランキング」からなる二段階推論が、従来の行列分解手法を上回る精度を示し、広く採用されている。第一段階(候補生成)は、膨大なアイテム空間から「正例である可能性が極めて低いもの」を排除するプロセスであり、これは負例のサンプリング問題に対する一つの実践的な解釈と捉えることができる。参加者の関心や余力に応じて、この二段階推論の数理的妥当性を、PositiveUnlabeled (PU) Learning や、選択バイアスを統計的に補正する反実仮想推論(Counterfactual Learning)といった理論を足がかりに考察したい。最終的には、公開データを用いた簡易的な検証を通じて、理論と実務の結節点を探したい。
詳細は、以下をご参照ください。
https://www.ms.u-tokyo.ac.jp/wings-fmsp/SG_260202.pdf
