OpenAIが公開しているオープンソースの音声認識モデル「Whisper」を試すため、音声ファイルの文字起こしを行う簡単なWebアプリを作成しました。これについて紹介します。クラウド上の文字起こしサービスと違ってローカル環境で使用できるため、機密事項を含む会議の音声ファイルの文字起こしを行うなど、活用しやすいかと思います。 開発環境: OS:Windows 11 Webブラウザー:Edge ツール:VSCode(Windows版) 使用モジュール:Python, ffmpeg, OpenAI Whisper, Flask 作成するWebアプリについて Webアプリの開発環境整備 VSCode,…