こんにちは、CCCMKホールディングス TECH LABの三浦です。 最近オープンソースのLLMのFine-Tuningにとても可能性を感じていて、色々なことに活用していきたいな、と考えています。ところがFine-Tuning用の学習用データが十分に集まらないことが多く、データが集まらないタスクではFine-Tuningの効果を検証することが出来ないという課題を持っています。 これまでその課題に対して、より高性能なLLMを使って学習データを生成させる、といったことを試してみました。かなり高品質なデータが出来るのですが、バラエティに富んだデータを生成しようとするとなかなかプロンプトによる指示だけ…