さまざまな音声・動画形式に対応しているマルチメディアコンバータ、及びライブラリ群。 ライセンスはLGPL。c99で書かれており、libavutil、libavformat、libavdevice、libavcodec、libavfilter、libpostproc、libswscaleなどのライブラリを含む。これらのライブラリはmplayer、VLC、ffdshow、avidemuxなどの様々なマルチメディアプログラムで使われている。
OpenAIが公開しているオープンソースの音声認識モデル「Whisper」を試すため、音声ファイルの文字起こしを行う簡単なWebアプリを作成しました。これについて紹介します。クラウド上の文字起こしサービスと違ってローカル環境で使用できるため、機密事項を含む会議の音声ファイルの文字起こしを行うなど、活用しやすいかと思います。 開発環境: OS:Windows 11 Webブラウザー:Edge ツール:VSCode(Windows版) 使用モジュール:Python, ffmpeg, OpenAI Whisper, Flask 作成するWebアプリについて Webアプリの開発環境整備 VSCode,…
この記事のサマリー 💡 TL;DR (要約): ボイスログは最強のインプット方法だ。しかし、ただ録るだけでは意味がない。「録音→変換→整理」という仕組み(ワークフロー)を構築することで、初めてあなたの「声」は未来の資産に変わる。 ✅ この記事でわかること: なぜ思考のキャプチャに「ボイスログ」が最適なのか 音声ファイルを軽量化(ファイルサイズ1/3)する、魔法のエンコード設定 混沌とした「声のメモ」を、Obsidian(オブシディアン)で構造化するための全手順 👥 この記事を読んでほしい人: Obsidianの基本的な使い方は理解している方 メモを取る時間を確保できず、アイデアを逃しがちだと感…
2025 May 31. "-movflags +faststart"オプション "-movflags faststart"オプション MP4ファイルをストリーミング時に最適化するためのもの。 オーディオストリームの種類には関係なく利用できる。 ただし、MP4フォーマットに出力する場合のみ意味を持つ。 "-movflags +faststart" +(プラス)記号が付いていることで、既存のmovflags設定に追加するという意味になる。 MP4のmoovアトムをファイルの先頭に移動させ、ストリーミング再生を最適化するオプション。 "-movflags faststart" faststartだ…
2025 May 31. 2025 Feb 24. 2024 May 26. 2023 Oct. 21. 2023 May 02. 2020 May 31. 2020 May 30. 出典 2020年版 デジタル放送録画の圧縮を最適化するFFmpegの使い方 - Simple Life in the digital age [確認]NHK解説放送のmp4エンコード · Issue #244 · l3tnun/EPGStation · GitHub https://haruo31.underthetree.jp/2014/11/25/%E5%89%AF%E9%9F%B3%E5%A3%B0%E3%…
要約 Arch LinuxでCDのリッピングやWAVの一括変換をします。前回の記事 WAVをFLACへ変換 とあるサントラをSteamで購入したので、WAVからFLACに一括変換してみました。こちらを参考にしております。(FLACの圧縮レベルって8までじゃないの?) $ find . -type f -name "*.wav" -exec bash -c 'ffmpeg -i "$0" -acodec flac -f flac -compression_level 5 "${0%.wav}".flac' {} ";" # WAV -> FLAC 圧縮レベル5 CDのリッピング morituri…
windows11 python3.13で動作 カレントディレクトリー内のMP4ファイルをh265でエンコード NVIDIAまたはintel GPU使用 ffmpegのパスは'c:/exe/ffmpeg-master-latest-win64-gpl-shared/bin' exeffmpeg.zipを展開し、C:ドライブにコピー pyinstaller goffmpeg.py --onefile でexeファイルがdistディレクトリに作られる このexeファイルをMP4ファイルのあるカレントディレクトリ内にコピーし実行 import os import subprocess import …
投稿日: 2025-04-03 最終更新日: 2025-06-22 この記事のサマリー 💡 TL;DR (要約): FFmpegは万能シェフ、LAMEはMP3専門職人。迷ったらFFmpegからLAMEを呼び出すのが最強!環境構築の「ハマりどころ」を私の実体験から徹底解説! ✅ この記事でわかること: FFmpegとLAMEの役割の明確な違い Windows環境で、つまずかずにFFmpegとLAMEを導入する全手順 私が実際にハマった「環境変数エラー」などの具体的な解決策 【2025年6月改訂版】ボイスログ管理に特化した、最新の最適エンコード設定 👥 この記事を読んでほしい人: FFmpegやL…
Windows環境でお世話になっていた "JDownloader 2" が、そのまま Linux 環境でもサポートされていて全く同じように使えるのですが、今回、ストリーミング形式のリソースを対象として動作させようとしたところ "FFmpegがインストールされていない" というメッセージが出て、そう言えば別途に必要だったなぁと思い起こし、ちょっとばかし弄ることに。ところが、そう簡単には行かなかったのでした。 どれをインストールしていいか分からないFFmpeg 本体のアプリである JDownloader2 は、アプリセンターのツールからインストールしていたので同様にアプリセンターのツールから FF…
何とは敢えて言わないが、データ変換ソフトとかで、「お試しで5分間の音声ファイルだけ変換できます」みたいなものがあるとして、元のデータは1時間長だった場合、それを5分長x12個のファイルに分割して1ファイルずつ変換すればお試し版で1時間分変換できるじゃん! みたいなセコいことを考えた人が居るとか居ないとか… まあそこは良いとして、簡単に音声ファイルを短く分割したいと思って色々調べたところ、ffmpegを使うとコマンド1発で出来るということが分かったのでそれを備忘としてここに残しておくことにする。 ffmpegは https://github.com/BtbN/FFmpeg-Builds/rele…
anオプションをつければいい 参考 qiita.com qiita.com