Claudeなら4.0から4.6のモデル世代差。 「感動した」という感情を発露しているだけで、ナレッジなどは特にないお気持ち記事です。 GitHub Copilot Coding Agentにアプリケーションの言語間移植進行について、現状の進行状況を棚卸しし、完了までの計画を立てて貰っていた。 過去には棚卸しが全く行えず、架空の機能を列挙して完了を目指す激しいハルシネーションが発生していた。 一方で直近の世代では実際の進行状況、存在するTODOや機能を正しく列挙し、完了を目指すため計画を立てることが出来た。 そして、移植進行を指示することで実際に残余のTODOが消化されていった。 特別な工夫を…