LLM(大規模言語モデル)をはじめとする現代の生成AIが、事実に基づかない情報を生成する現象はhallucination(幻覚)と呼ばれる。この現象は、機械学習の根幹をなす「関数近似」という性質に深く根ざしている。 訓練データという制約と関数近似 機械学習の基礎は、与えられた訓練データを「制約」と見なし、それらを高い精度で再現できる関数 を見つけ出すことにある。 例えば、 という制約を満たす関数を求めたいとする。このような条件を満たす数式を構成する手法の一つにラグランジュ補間がある。 この数式は のときに となるよう設計されている。現代のニューラルネットワーク(NN)も、手法こそ異なるが「複数…