前回に引き続きリクルート社が発表した「japanese-clip-vit-b-32-roberta-base」を使っていきます。 touch-sp.hatenablog.com 今回は日本語での画像検索に挑戦しました。 1年以上前にOpenAIのCLIPを使って同じことをした経験があります。 touch-sp.hatenablog.com 用意した画像Kaggleの「Dogs vs Cats | Kaggle」からデータを使わせて頂きました。 テストデータだけを使ったのですが、それでも12500枚の画像があるのでそのうちの200枚だけにしています。 犬の画像と猫の画像が混ざっています。 「an…