はじめに Learning to rankにおけるポジションバイアスの求め方の一種であるRegression-based EM[Wang18]の導出についてまとめる。 より具体的には論文中のEMアルゴリズムの更新式(2)のあたりを詳しく追う。 定義 基本的には論文の表記に従う。 $q$ : クエリ $d$ : 文書 $C$ : ユーザが文書をクリックしたか $R$ : ユーザが文書に興味があるか $E$ : ユーザが文書を確認したか $k$ : 文書の位置 $\mathcal{L} = \left\{ \left(c, q, d, k\right)\right\}$ : ユーザのログの集合 P…