2023-08-01

Bluetoothで使われるAAC、SBC、LC3コーデックの音質比較

概要

Bluetoothに登場する新しいコーデック、LC3の音質を、従来からあるAAC、SBCと二重盲検法で比較した。
Bluetooth 5.2からのLC3の採用により、音声の遅延を抑えた自然な音声再生と、バッテリ消費の軽減が将来的に期待されている。
このLC3コーデックの音質を、Bluetoothイヤホン等で現在広く使われているAACコーデック、SBCコーデックと比較した。

結果

AAC、SBC、LC3共に一般的な設定で使う限り、どれも高音質であり、平均オピニオン評点が4点以上と、原音を忠実に再現した。

評価

Bluetoothで使えるAAC、SBC、LC3コーデックの音質比較、一般的な設定の場合

テストに利用した音源を試聴したい方、ダウンロードしたい方、ログを見たい方はこちらへ。
http://zak.s206.xrea.com/bitratetest/main.htm
https://drive.google.com/file/d/0ByvUr-pp6BuUSnlwUG1WNkZzeDA/view?usp=sharing

方法

銘柄に対する先入観が影響しないように、PSP ABC/HR v2.4とAKG K712を利用して、6個のエンコードされた圧縮音源をランダムに並び替えて、銘柄を伏せて採点した。採点基準は、「音質劣化が非常に気になる」が1点「気になる」が2点「わずかに気になる」が3点「原音からの音質変化が分かるが、気にならない」が4点「音質変化がわからない、区別できない」が5点。4.9点以下の評点をつける場合は、ABXYテストを15回行い、12回以上(これ以上の成績をまぐれで出す確率は約2%)正解して、違いを聞き取れることを確認してからそうした。27種の多様なジャンルを含むテスト用の非圧縮音源が使われた。このテストでの採点は、27(音源)×6(エンコーダ)×1(回)=162(回)。

使用したオプション

AAC

Androidで使われているFraunhofer社製のAACエンコーダ、fdk-aacが使われた。これはFAAC (libfaac) とは別物。
mstorsjo氏がメンテナンスし2023年2月にrarewaresで配布されていた、当時としては最新のfdkaac-1.0.4 built against fdk-aac 2.0.2, x64のバイナリが使われた。2023年6月時点では最新のバージョンではない。一般的な設定として192kbpsで、ビットレートを低くした設定として128kbpsでエンコードされた。

fdkaac -b 192000 -o 出力.mp4 原音.48kHz.16bit2ch.wav
fdkaac -b 128000 -o 出力.mp4 原音.48kHz.16bit2ch.wav

SBC

FFmpegに内蔵されているSBCエンコーダが使われた。利用されたバージョンは、2023年2月時点で最新だった FFmpeg N-109823-g385ec46424.
一般的な設定として345kbpsで、ビットレートを低くした設定として237kbpsでエンコードされた。

ffmpeg -y -i 原音.48kHz.16bit2ch.wav -c:a sbc -b:a 345k 出力.sbc
ffmpeg -y -i 原音.48kHz.16bit2ch.wav -c:a sbc -b:a 237k 出力.sbc

LC3（Googleの開発する Google/liblc3）

2023年2月時点で配布されていたバージョン liblc3 v1.0.1が使われた。
一般的な設定として192kbpsで、ビットレートを低くした設定として128kbpsでエンコードされた。
遅延の長短に関連するフレーム長はデフォルトのまま(10ms)とした。

elc3 -b 192000 原音.48kHz.16bit2ch.wav 出力.lc3
elc3 -b 128000 原音.48kHz.16bit2ch.wav 出力.lc3

詳細な優劣の分析

FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Blocked ANOVA analysis

Number of listeners: 27
Critical significance:  0.05
Significance of data: 0.00E+000 (highly significant)
---------------------------------------------------------------
ANOVA Table for Randomized Block Designs Using Ratings

Source of         Degrees     Sum of    Mean
variation         of Freedom  squares   Square    F      p

Total              161          69.27
Testers (blocks)    26           9.59
Codecs eval'd        5          37.25    7.45   43.18  0.00E+000
Error              130          22.43    0.17
---------------------------------------------------------------
Fisher's protected LSD for ANOVA:   0.224

Means:

FDK-AAC1 SBC345kb liblc319 FDK-AAC1 SBC237kb liblc312 
  4.72     4.65     4.13     4.12     3.62     3.42   

---------------------------- p-value Matrix ---------------------------

         SBC345kb liblc319 FDK-AAC1 SBC237kb liblc312 
FDK-AAC1 0.578    0.000*   0.000*   0.000*   0.000*   
SBC345kb          0.000*   0.000*   0.000*   0.000*   
liblc319                   0.961    0.000*   0.000*   
FDK-AAC1                            0.000*   0.000*   
SBC237kb                                     0.079    
-----------------------------------------------------------------------

FDK-AAC192kbps is better than liblc3192kbps, FDK-AAC128kbps, SBC237kbps, liblc3128kbps
SBC345kbps is better than liblc3192kbps, FDK-AAC128kbps, SBC237kbps, liblc3128kbps
liblc3192kbps is better than SBC237kbps, liblc3128kbps
FDK-AAC128kbps is better than SBC237kbps, liblc3128kbps


FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Friedman Analysis

Number of listeners: 27
Critical significance:  0.05
Significance of data: 0.00E+000 (highly significant)
Fisher's protected LSD for rank sums:  26.945

Ranksums:

FDK-AAC1 SBC345kb FDK-AAC1 liblc319 SBC237kb liblc312 
139.00   139.00    91.50    91.00    64.50    42.00   

---------------------------- p-value Matrix ---------------------------

         SBC345kb FDK-AAC1 liblc319 SBC237kb liblc312 
FDK-AAC1 1.000    0.001*   0.000*   0.000*   0.000*   
SBC345kb          0.001*   0.000*   0.000*   0.000*   
FDK-AAC1                   0.971    0.050*   0.000*   
liblc319                            0.054    0.000*   
SBC237kb                                     0.102    
-----------------------------------------------------------------------

FDK-AAC192kbps is better than FDK-AAC128kbps, liblc3192kbps, SBC237kbps, liblc3128kbps
SBC345kbps is better than FDK-AAC128kbps, liblc3192kbps, SBC237kbps, liblc3128kbps
FDK-AAC128kbps is better than SBC237kbps, liblc3128kbps
liblc3192kbps is better than liblc3128kbps

整形済みデータ

%FDK-AAC 128kbps	FDK-AAC 192kbps	liblc3 128kbps	liblc3 192kbps	SBC 237kbps	SBC 345kbps	
FDK-AAC128kbps	FDK-AAC192kbps	liblc3128kbps	liblc3192kbps	SBC237kbps	SBC345kbps	
%genre 15個のテスト音源
3.700	4.500	3.200	4.200	3.500	5.000	
4.800	4.700	3.300	4.100	3.100	4.500	
3.900	5.000	3.100	3.500	3.700	5.000	
4.100	5.000	3.500	4.400	3.700	5.000	
3.900	5.000	3.300	4.500	4.200	5.000	
4.200	5.000	3.300	3.900	2.800	4.400	
4.900	5.000	3.400	4.500	3.700	4.700	
4.200	5.000	3.400	4.100	3.100	4.300	
3.100	3.800	3.500	4.100	3.300	4.200	
3.900	5.000	3.100	3.800	2.700	5.000	
3.800	4.500	3.500	4.200	4.300	4.400	
3.700	5.000	3.400	4.100	3.500	4.600	
4.300	5.000	3.400	3.900	3.100	4.500	
4.200	4.800	3.300	4.100	2.700	5.000	
5.000	4.700	2.900	3.700	2.600	3.800	
%genre IgorC氏による12個のテスト音源
4.400	4.700	3.400	3.900	4.600	5.000	
4.200	4.500	3.900	4.400	5.000	5.000	
4.300	4.500	3.500	3.900	4.800	5.000	
4.000	4.800	3.200	4.150	2.800	4.450	
4.000	4.750	3.250	4.200	3.450	4.000	
4.200	4.300	3.200	3.800	2.500	3.900	
3.800	4.100	3.400	4.300	5.000	4.400	
3.700	5.000	3.600	4.200	3.900	5.000	
3.400	4.100	3.700	4.200	4.300	4.500	
4.300	4.600	3.200	4.200	3.900	5.000	
5.000	5.000	5.000	5.000	3.700	5.000	
4.300	5.000	3.400	4.100	3.800	5.000	
%samples	41_30sec	Perc.
%samples	finalfantasy	Strings
%samples	ATrain	Jazz
%samples	BigYellow	Pops
%samples	FloorEssence	Techno
%samples	macabre	Classic
%samples	mybloodrusts	Guitar
%samples	Quizas	Latin
%samples	VelvetRealm	Techno
%samples	Amefuribana	Pops
%samples	Trust	Gospel
%samples	Waiting	Rock
%samples	Experiencia	Latin
%samples	Heart to Heart	Pops
%samples	Tom's Diner	Acappella

%samples	01 castanets	inst.
%samples	02 fatboy_30sec	Techno
%samples	03 eig	Techno
%samples	04 Bachpsichord	inst.
%samples	05 Enola	Techno
%samples	06 trumpet	inst.
%samples	07 applaud	Live
%samples	08 velvet	perc.
%samples	09 Linchpin	Rock
%samples	10 spill_the_blood	guitar
%samples	11 female_speech	Speech
%samples	12 French_Ad	Speech
%bitrate
%FDK-AAC 128kbps	FDK-AAC 192kbps	liblc3 128kbps	liblc3 192kbps	SBC 237kbps	SBC 345kbps	
130216	194306	129655	193679	240012	348018
130143	194211	129669	193701	240012	348018
130544	194658	129658	193684	240019	348028
130269	194365	129649	193671	240015	348022
130464	194528	129665	193693	240018	348026
130447	194538	129718	193773	240021	348030
130472	194591	129689	193729	240018	348026
130247	194287	129661	193689	240013	348019
131536	195818	129784	193867	240035	348051
130358	194439	129686	193725	240014	348021
130114	194223	129662	193691	240013	348018
130429	194528	129651	193673	240018	348026
130446	194495	129647	193667	240018	348027
130248	194322	129633	193647	240013	348019
130511	194600	129708	193758	240018	348026
131858	196051	129808	193900	240055	348080
130174	194253	129632	193646	240013	348018
130895	195069	129709	193758	240024	348035
130265	194356	129665	193695	240015	348021
130250	194253	129652	193675	240013	348019
131374	195543	129772	193849	240036	348052
131676	195902	129788	193872	240044	348064
131075	195226	129767	193844	240031	348045
130805	194946	129711	193762	240023	348034
130125	194202	129651	193674	240012	348018
130456	194562	129640	193656	240019	348028
130795	194951	129723	193778	240031	348044

注：公開試聴試験での多人数の平均評点と管理人の評点が似たような傾向になることは確認しているので言えるが、ある個人がある再生環境で、ある価値観のもとに聞いたときの評価が、ここに書いた管理人の評価に似るかどうかまでは何とも言えない。また、今回利用した音源とは傾向の異なる音を多くエンコードした場合、結果や順位が異なる可能性があります。

2022-06-29

Bluetoothに登場するLC3コーデックと、AACの比較

概要

Bluetoothに登場する新しいコーデック、LC3を、従来からあるAACと二重盲検法で比較した。
2022年以降、Bluetooth 5.2という新しい規格がリリースされ、イヤホンやスピーカーと無線で接続するための新しい方法が準備される。以降のBluetooth規格では、LC3のサポートが必須となる見込み。
LC3の採用により、音声の遅延を抑えた自然な音声再生と、バッテリ消費の軽減が見込まれている。
このLC3コーデックを、Bluetoothイヤホン等で現在広く使われているAACコーデックと比較した。
LC3コーデックのエンコーダとして、欧州電気通信標準化機構(ETSI)が配布している最新版のLC3plusと、GoogleがAndroid用に開発しているliblc3の2銘柄が使われた。
AACコーデックのエンコーダとして、Apple製品で採用されているCoreAudioと、Androidで採用されているFDK-AACの2銘柄が使われた。
今回はストリーミングによる音楽聴取環境を想定して、ロスレスの原音をOpusの128kbpsでエンコードし、デコードしてからLC3かAACの160kbps CBRでエンコードし、この再エンコードされた音を原音と比較した。
あくまで参考として、MP3も比較対象に加えられた。MP3は再エンコードではなく、原音から直接エンコードされた。

結果

現在Bluetoothイヤホンで広く採用されている、AACエンコーダの方がむしろ原音に近い結果となった。
AACは、再エンコードにもかかわらず両者とも平均オピニオン評点4.3点以上と高い忠実度となった。
LC3の平均オピニオン評点は4点を下回った。
AACについては、CBRを強制したAppleのCoreAudioと、FDK-AACに大きな違いは無かった。これは前回の48kHz, 144kbpsで行ったテストと同様の結果。
LC3については、欧州電気通信標準化機構(ETSI)版とGoogle版に大きな違いは無かった。
AAC, LC3のいずれも、Opusからの再エンコードにも関わらず、MP3 128kbps(CBR)よりも高い忠実度となった。

評価

方法

銘柄に対する先入観が影響しないように、PSP ABC/HR v2.4とRP-HJE150を利用して、6個のエンコードされた圧縮音源をランダムに並び替えて、銘柄を伏せて採点した。採点基準は、「音質劣化が非常に気になる」が1点「気になる」が2点「わずかに気になる」が3点「原音からの音質変化が分かるが、気にならない」が4点「音質変化がわからない、区別できない」が5点。4.9点以下の評点をつける場合は、ABXYテストを15回行い、12回以上(これ以上の成績をまぐれで出す確率は約2%)正解して、違いを聞き取れることを確認してからそうした。27種の多様なジャンルを含むテスト用の非圧縮音源が使われた。このテストでの採点は、27(音源)×6(エンコーダ)×1(回)=162(回)。

使用したオプション

サンプリング周波数が44.1kHzのロスレス音源からOpusへの変換（ストリーミングによる音楽聴取環境を再現するために使用）

Opusのエンコードとデコードには、最新版のopus-tools-0.2-opus-1.3が使われた。
Opusをデコードした一時ファイルについては、ビット深度とサンプリング周波数を各LC3エンコーダが対応する16bitと48kHz, 44.1kHzに変換するため、qaac に同梱されている refalac の64bit版が使われた。

opusenc --bitrate 128 原音.wav 一時ファイル.opus
opusdec --float --quiet 一時ファイル.opus 一時ファイル.wav
refalac64 一時ファイル.wav --rate 48000 -D -b 16 -o 一時ファイル48kHz.wav
refalac64 一時ファイル.wav --rate 44100 -D -b 16 -o 一時ファイル44kHz.wav

AAC (Appleのエンジン)

Appleが使うエンジン CoreAudioToolbox 7.10.9.0 が qaac 2.73 (x64 version) 経由で使われた。
Bluetoothでの伝送環境を再現するため、CBRを指定して強制させた。

qaac64 --cbr 160 -o 出力.mp4 一時ファイル44kHz.wav

AAC (Androidのエンジン)

Androidで使われているFraunhofer社製のAACエンコーダ、fdk-aacが使われた。これはFAAC (libfaac) とは別物。
mstorsjo氏がメンテナンスしている、バージョン fdk-aac v2.0.2 を FFmpeg N-102573-g9d4c018497 に組み込んだ状態で使われた。このコマンドラインだけで、CBRで出力される。

ffmpeg -y -i 一時ファイル44kHz.wav -c:a libfdk_aac -b:a 160k 出力.mp4

LC3（欧州電気通信標準化機構の配布するLC3plus）

2022年4月19日時点でFraunhoferのページで紹介され、欧州電気通信標準化機構（ETSI）から配布されていた最新の、
LC3plus Floating Point Software V1.6.3ETSI, ETSI TS 103 634 V1.3.1. が使われた。
配布されていたソースコードのfloating_point版をMSYS環境でビルドしエンコードさせた。
なお2022年6月29日現時点でも同バージョンが配布されている。

LC3plus -E -q -v 一時ファイル44kHz.wav 出力.lc3 160000

LC3（Googleの開発する Google/liblc3 、Zephyr上ではliblc3codec表記）

2022年4月19日時点で配布されていたバージョンを使用。
以降、2022年6月28日までに高速化やAPIの24bit深度対応、外部モジュール化などが行われたため最新版ではない。
このGoogle/liblc3は、2022年6月29日現在もサンプリング周波数44.1kHzのwavファイルを直接入力できない。
そのため、これのみOpus-toolsのサンプリング周波数48kHz出力を44.1kHzに変換せずに48kHzのまま使った。

elc3 -b 160000 一時ファイル48kHz.wav 出力.lc3

MP3

あくまでLC3, AACとの比較参考のために使用。最新版のLAME、LAME 3.100.1(64bit版)がCBRで使われた。

lame -b 128 原音.wav 出力.mp3
lame -b 64 原音.wav 出力.mp3

詳細な優劣の分析

FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Blocked ANOVA analysis

Number of listeners: 27
Critical significance:  0.05
Significance of data: 0.00E+000 (highly significant)
---------------------------------------------------------------
ANOVA Table for Randomized Block Designs Using Ratings

Source of         Degrees     Sum of    Mean
variation         of Freedom  squares   Square    F      p

Total              161         132.90
Testers (blocks)    26           7.81
Codecs eval'd        5         114.05   22.81   268.52  0.00E+000
Error              130          11.04    0.08
---------------------------------------------------------------
Fisher's protected LSD for ANOVA:   0.157

Means:

AAC(FDK) AAC(Appl LC3plus  liblc3   LAMECBR1 LAMECBR6
  4.36     4.35     3.99     3.89     3.56     1.90  

---------------------------- p-value Matrix ---------------------------

         AAC(Appl LC3plus  liblc3   LAMECBR1 LAMECBR6
AAC(FDK) 0.926    0.000*   0.000*   0.000*   0.000*  
AAC(Appl          0.000*   0.000*   0.000*   0.000*  
LC3plus                    0.227    0.000*   0.000*  
liblc3                              0.000*   0.000*  
LAMECBR1                                     0.000*  
-----------------------------------------------------------------------

AAC(FDK) is better than LC3plus, liblc3, LAMECBR128kbps, LAMECBR64kbps
AAC(Apple) is better than LC3plus, liblc3, LAMECBR128kbps, LAMECBR64kbps
LC3plus is better than LAMECBR128kbps, LAMECBR64kbps
liblc3 is better than LAMECBR128kbps, LAMECBR64kbps
LAMECBR128kbps is better than LAMECBR64kbps


FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Friedman Analysis

Number of listeners: 27
Critical significance:  0.05
Significance of data: 0.00E+000 (highly significant)
Fisher's protected LSD for rank sums:  26.945

Ranksums:

AAC(Appl AAC(FDK) LC3plus  liblc3   LAMECBR1 LAMECBR6
143.00   141.00    98.00    87.00    71.00    27.00  

---------------------------- p-value Matrix ---------------------------

         AAC(FDK) LC3plus  liblc3   LAMECBR1 LAMECBR6
AAC(Appl 0.884    0.001*   0.000*   0.000*   0.000*  
AAC(FDK)          0.002*   0.000*   0.000*   0.000*  
LC3plus                    0.424    0.050*   0.000*  
liblc3                              0.244    0.000*  
LAMECBR1                                     0.001*  
-----------------------------------------------------------------------

AAC(Apple) is better than LC3plus, liblc3, LAMECBR128kbps, LAMECBR64kbps
AAC(FDK) is better than LC3plus, liblc3, LAMECBR128kbps, LAMECBR64kbps
LC3plus is better than LAMECBR128kbps, LAMECBR64kbps
liblc3 is better than LAMECBR64kbps
LAMECBR128kbps is better than LAMECBR64kbps

整形済みデータ

CoreAudio	FDK-AAC	LC3plus	Google / liblc3	LAME	LAME
%feature	5	Opus ⇒ AAC	Opus ⇒ AAC	Opus ⇒ LC3	Opus ⇒ LC3
%feature	7	   	 	  	 	MP3	MP3
%feature	10	CoreAudioToolbox 7.10.9.0, via qaac 2.73	FDK-AAC v2.0.2	V1.6.3 ETSI (floating point ver.)	liblc3 Apr 19, 2022	LAME 3.100.1-x64	LAME 3.100.1-x64
%feature	11	--cbr 160	-c:a libfdk_aac -b:a 160k	160000	-b 160000	-b 128 (CBR 128kbps)	-b 64 (CBR 64kbps)
%feature	12	Opus 128kbpsから再エンコード	Opus 128kbpsから再エンコード	Opus 128kbpsから再エンコード	Opus 128kbpsから再エンコード	原音から直接エンコード	原音から直接エンコード
%genre 15個のテスト音源
4.300	4.400	4.100	3.700	3.200	1.800	
4.700	4.500	4.200	3.700	4.100	1.700	
4.500	4.300	3.900	4.100	4.400	1.600	
4.500	4.400	4.100	3.900	3.700	2.100	
3.800	4.100	3.500	3.600	2.500	1.700	
4.300	4.200	3.700	3.400	3.800	1.700	
4.400	4.500	4.100	3.900	2.900	2.400	
4.400	4.500	3.600	4.100	3.900	1.700	
3.900	3.800	4.300	4.400	4.100	2.700	
4.500	4.400	3.900	3.500	3.600	1.800	
4.400	4.300	4.100	4.200	3.100	1.600	
4.200	4.100	3.900	3.700	3.300	2.200	
4.400	4.500	3.800	3.700	3.600	1.700	
4.200	4.400	3.900	3.800	3.600	1.600	
4.400	4.300	3.600	3.700	4.100	1.800		
%genre IgorC氏による12個のテスト音源
4.400	4.500	4.100	4.000	2.700	1.800	
4.100	4.400	4.600	4.500	3.600	1.600	
4.600	4.500	4.100	4.200	3.200	1.700	
4.300	4.400	3.900	3.800	3.600	1.900	
4.500	4.200	4.400	3.800	3.600	1.900	
4.300	4.200	3.800	3.700	3.200	2.100	
3.900	3.700	3.400	3.500	2.800	1.600	
4.100	4.400	3.900	4.300	2.600	1.900	
4.500	4.600	3.900	3.700	4.100	2.100	
4.200	4.300	3.800	3.500	4.100	2.200	
5.000	4.800	4.700	4.400	4.500	2.300	
4.700	5.000	4.400	4.300	4.100	2.200	

%samples	41_30sec	Perc.
%samples	finalfantasy	Strings
%samples	ATrain	Jazz
%samples	BigYellow	Pops
%samples	FloorEssence	Techno
%samples	macabre	Classic
%samples	mybloodrusts	Guitar
%samples	Quizas	Latin
%samples	VelvetRealm	Techno
%samples	Amefuribana	Pops
%samples	Trust	Gospel
%samples	Waiting	Rock
%samples	Experiencia	Latin
%samples	Heart to Heart	Pops
%samples	Tom's Diner	Acappella

%samples	01 castanets	inst.
%samples	02 fatboy_30sec	Techno
%samples	03 eig	Techno
%samples	04 Bachpsichord	inst.
%samples	05 Enola	Techno
%samples	06 trumpet	inst.
%samples	07 applaud	Live
%samples	08 velvet	perc.
%samples	09 Linchpin	Rock
%samples	10 spill_the_blood	guitar
%samples	11 female_speech	Speech
%samples	12 French_Ad	Speech
%bitrate
162387	161978	161014	161659	128285	64154
162562	162020	160979	161667	128230	64196
162879	162365	160984	161655	128372	64266
162679	162084	161015	161646	128319	64214
162749	162340	160981	161652	128368	64267
162989	162338	160987	161719	128440	64278
162974	162222	161016	161679	128458	64286
162331	162011	160989	161658	128271	64202
163932	163180	161141	161773	128827	64534
162628	162092	160980	161683	128295	64199
162327	161897	161024	161667	128244	64205
163037	162391	161182	161834	128553	64319
162736	162244	161050	161634	128353	64260
162391	162100	160983	161628	128304	64185
162832	162343	161019	161702	128470	64276
165547	163738	161116	161762	129023	64827
162311	161976	161009	161624	128336	64161
163482	162617	161070	161709	128613	64406
162476	162136	160979	161669	128396	64204
162317	162027	161015	161648	128300	64203
164590	163095	161051	161759	128666	64466
165505	163638	161164	161773	128851	64589
164116	162966	161075	161768	128639	64396
163213	162632	161036	161696	128588	64332
162477	162004	161025	161649	128264	64195
162842	162243	160988	161630	128432	64282
163657	162689	161047	161716	128663	64396

2022-03-15

Bluetoothで使われるLC3とAACの比較

概要

Bluetoothで使われる、LC3コーデックとAACコーデックの二重盲検法による比較。
2022年以降、Bluetooth 5.2という新しい規格がリリースされ、イヤホンやスピーカーと無線で接続するための新しい方法が準備される見込み。
新しい LE Audio を採用するデバイスでは、LC3というコーデックのサポートが必須となっている。
LC3は、音声の遅延を抑えた自然な音声再生と、バッテリ消費の軽減を狙って近年設計されたコーデックである。
このLC3コーデックを、現在Bluetoothで広く使われているAACコーデックと比較。
LC3コーデックのエンコーダとしては、欧州電気通信標準化機構(ETSI)が配布している最新版のLC3plusが使われた。
AACコーデックのエンコーダとしては、Apple製品で採用されている CoreAudioと、Androidで採用されているFDK-AACが使われた。

結果

ETSIが配布するLC3エンコーダよりも、現在のイヤホンやヘッドホンへの接続に広く使われているAACエンコーダの方がむしろ原音に忠実だった。
Appleが採用するエンコーダとAndroidが採用するエンコーダは大差ない結果となった。

評価

f:id:kamedo2:20220315030714p:plain — 全結果

f:id:kamedo2:20220315030752p:plain — テストに使われた27音源と評点一覧

方法

銘柄に対する先入観が影響しないように、PSP ABC/HR v2.4とAKG K712を利用して、3個のエンコードされた圧縮音源をランダムに並び替えて、銘柄を伏せて採点した。採点基準は、「音質劣化が非常に気になる」が1点「気になる」が2点「わずかに気になる」が3点「原音からの音質変化が分かるが、気にならない」が4点「音質変化がわからない、区別できない」が5点。4.9点以下の評点をつける場合は、ABXYテストを15回行い、12回以上(これ以上の成績をまぐれで出す確率は約2%)正解して、違いを聞き取れることを確認してからそうした。15種の多様なジャンルを含むテスト用の非圧縮音源が使われた。このテストでの採点は、27(音源)×3(エンコーダ)×1(回)=81(回)。

使用したオプション

サンプリング周波数が44.1kHzのロスレス音源から48kHzへの変換

qaac に同梱されている refalac が使われた。

refalac64 原音.44kHz.wav --rate 48000 -D -b 24 -o 原音.48kHz.wav

AAC (Appleのエンジン)

Appleが使うエンジン CoreAudioToolbox 7.10.9.0 が qaac 2.72 (x64 version) 経由で使われた。

qaac64 --cbr 144 -o 出力.mp4 原音.48kHz.wav

AAC (Androidのエンジン)

Androidで使われているFraunhofer社製のAACエンコーダ、fdk-aacが使われた。FAAC (libfaac) とは別物。
mstorsjo氏がメンテナンスしている、最新版のバージョン fdk-aac v2.0.2 を FFmpeg N-102573-g9d4c018497 に組み込んで使われた。

ffmpeg -y -i 原音.48kHz.wav -c:a libfdk_aac -b:a 144k 出力.mp4

LC3

2021年11月17日時点で欧州電気通信標準化機構(ETSI)から配布されていた最新の、
LC3plus Floating Point Software V1.6.3ETSI, ETSI TS 103 634 V1.3.1. が使われた。
配布されていたソースコードのfloating_point版をMSYS環境でビルドしエンコードさせた。
なお2022年3月15日時点でも同バージョンが配布されている。

LC3plus -E -q -v 原音.48kHz.wav 出力.lc3 144000

詳細な優劣の分析

FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Blocked ANOVA analysis

Number of listeners: 27
Critical significance:  0.05
Significance of data: 2.56E-012 (highly significant)
---------------------------------------------------------------
ANOVA Table for Randomized Block Designs Using Ratings

Source of         Degrees     Sum of    Mean
variation         of Freedom  squares   Square    F      p

Total               80          19.52
Testers (blocks)    26           7.06
Codecs eval'd        2           8.00    4.00   46.58  2.56E-012
Error               52           4.47    0.09
---------------------------------------------------------------
Fisher's protected LSD for ANOVA:   0.160

Means:

AndroidA AppleAAC LC3plus 
  4.41     4.40     3.74  

---------------------------- p-value Matrix ---------------------------

         AppleAAC LC3plus 
AndroidA 0.926    0.000*  
AppleAAC          0.000*  
-----------------------------------------------------------------------

AndroidAAC is better than LC3plus
AppleAAC is better than LC3plus

整形済みデータ

Apple AAC	Android AAC	LC3plus
%feature	5	AAC	AAC	LC3
%feature	10	CoreAudioToolbox 7.10.9.0, via qaac 2.72	FDK-AAC 2.0.2	V1.6.3 ETSI (floating point ver.)
%feature	11	--cbr 144	-c:a libfdk_aac -b:a 144k	144000
%genre Kamedo2's 15 sample
4.700	4.500	4.200	
4.500	5.000	3.300	
4.400	4.600	3.200	
4.700	4.500	4.200	
4.100	4.400	3.500	
4.500	4.300	3.700	
5.000	5.000	4.400	
4.400	4.600	3.900	
3.900	3.500	4.200	
4.400	4.500	3.300	
4.300	4.200	3.600	
4.200	3.900	3.500	
5.000	4.600	3.600	
4.300	4.600	3.500	
5.000	5.000	3.600	
%genre IgorC's 12 sample
4.400	4.200	3.700	
3.800	4.100	3.600	
4.200	4.100	3.300	
4.500	4.400	3.700	
4.400	4.500	3.500	
3.900	4.200	3.300	
4.100	3.400	3.700	
4.300	4.400	4.100	
4.400	4.200	3.800	
4.100	4.400	3.700	
5.000	5.000	5.000	
4.400	5.000	3.900	

%samples	41_30sec	Perc.
%samples	finalfantasy	Strings
%samples	ATrain	Jazz
%samples	BigYellow	Pops
%samples	FloorEssence	Techno
%samples	macabre	Classic
%samples	mybloodrusts	Guitar
%samples	Quizas	Latin
%samples	VelvetRealm	Techno
%samples	Amefuribana	Pops
%samples	Trust	Gospel
%samples	Waiting	Rock
%samples	Experiencia	Latin
%samples	Heart to Heart	Pops
%samples	Tom's Diner	Acappella

%samples	01 castanets	inst.
%samples	02 fatboy_30sec	Techno
%samples	03 eig	Techno
%samples	04 Bachpsichord	inst.
%samples	05 Enola	Techno
%samples	06 trumpet	inst.
%samples	07 applaud	Live
%samples	08 velvet	perc.
%samples	09 Linchpin	Rock
%samples	10 spill_the_blood	guitar
%samples	11 female_speech	Speech
%samples	12 French_Ad	Speech
%bitrate
146469	146146	145654
146500	146046	145613
146974	146453	145651
146778	146180	145642
146777	146356	145649
146921	146302	145626
147158	146361	145673
146681	146144	145653
148366	147429	145617
146607	146261	145618
146446	146024	145611
146748	146341	145645
146744	146334	145632
146687	146168	145627
146773	146411	145621
149514	147559	145751
146462	146076	145622
147719	146806	145700
146732	146184	145664
146422	146178	145644
148665	147225	145747

2021-09-27

Opus, HE-AAC v2, xHE-AACの音質比較

概要

2006年～2012年に規格が策定された比較的新しいコーデックである、Opus、HE-AAC v2、xHE-AACの、40kbps付近での音質を、MP3の131kbps付近での音質と、二重盲検法により比較した。
全てのコーデックは48kHzの設定で比較した。

結果

40kbps前後だと、Opus、HE-AAC v2、xHE-AACの平均オピニオン評点は3.0を下回る低い評点となった。
40kbpsの最新のコーデックよりも、LAMEでエンコードした131kbpsのMP3の方が高い忠実度となった。
MP3を除く最新コーデック3種は、40kbpsでは平均オピニオン評点に大きな差がなかった。
2種のハードウェアがテストに利用されたが、平均オピニオン評点に大きな差はなかった。

評価

f:id:kamedo2:20210627005318p:plain — 全結果

f:id:kamedo2:20210627005338p:plain — テストに使われた15音源と評点一覧

f:id:kamedo2:20210627005356p:plain — 全結果（ハードウェア別）１回目がPanasonic RP-HT560、２回目がAKG K712

f:id:kamedo2:20210627005439p:plain — テストに使われた15音源と評点一覧（ハードウェア別）１回目がPanasonic RP-HT560、２回目がAKG K712

f:id:kamedo2:20210627005416p:plain — ビットレートの平均と分布 FDK-AACのみがCBR。他はVBRでありエンコードが難しい音声に多くのビットを割り当てる。

方法

銘柄に対する先入観が影響しないように、PSP ABC/HR v2.4とRP-HT560(1回目)、AKG K712(2回目)を利用して、4個のエンコードされた圧縮音源をランダムに並び替えて、銘柄を伏せて採点した。採点基準は、「音質劣化が非常に気になる」が1点「気になる」が2点「わずかに気になる」が3点「原音からの音質変化が分かるが、気にならない」が4点「音質変化がわからない、区別できない」が5点。4.9点以下の評点をつける場合は、ABXYテストを15回行い、12回以上(これ以上の成績をまぐれで出す確率は約2%)正解して、違いを聞き取れることを確認してからそうした。15種の多様なジャンルを含むテスト用の非圧縮音源が使われた。このテストでの採点は、15(音源)×4(エンコーダ)×2(回)=120(回)。

使用したオプション

サンプリング周波数が44.1kHzのロスレス音源から48kHzへの変換

qaac に同梱されている refalac が使われた。

refalac64 原音.wav --rate 48000 -D -b 32 -o 原音.48kHz.wav

Opus

YoutubeやDiscord等、ウェブで広く使われているフリーな音声コーデック Opus。
2021年5月現在最新の公式ビルド opus-tools-0.2-opus-1.3 が使われた。

opusenc --bitrate 39 原音.48kHz.wav 出力.mp3

HE-AAC v2

HE-AAC v2 は、AAC-LCなどの後継として2006年に策定された音声コーデック。SBR（スペクトル帯域複製）やパラメトリックステレオなどの技術が使われる。
fdk-aacは、Androidで使われているFraunhofer社製のAACエンコーダ。FAAC (libfaac) とは別物です。
mstorsjo氏がメンテナンスしている、2021年5月現在最新版のバージョン fdk-aac v2.0.2 を FFmpeg r.102573 に組み込んで（MSYS MinGW 64bitを使って自分でビルドして）使われた。

ffmpeg -i 原音.48kHz.wav -c:a libfdk_aac -profile:a aac_he_v2 -b:a 42k 出力.mp4

xHE-AAC

xHE-AACは、HE-AAC v2の後継として2012年に策定された音声コーデック。Netflixやデジタルラジオモンディエールで使われる。
今回はxHE-AACエンコーダとして、ドイツのコンピュータ技術者であるChristian R. Helmrich氏が開発したxHE-AACエンコーダで、2021年5月時点ではまだ最新版だったバージョン、exhale-V1.1.5-1592b40c_x64 が使われた。
なお、2021年6月現在の最新版である V1.1.6 では音質面の調整も入っている。
設定「a」は40kbps前後にエンコードされる、exhaleで選択できる最低のビットレート。SBRが使われる。

exhale a 原音.48kHz.wav 出力.mp4

MP3

定番のMP3エンコーダ、LAMEの最新版 3.100.1 が使われた。

lame -V 5 原音.48kHz.wav 出力.mp3

詳細な優劣の分析

FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Blocked ANOVA analysis

Number of listeners: 15
Critical significance:  0.05
Significance of data: 7.34E-007 (highly significant)
---------------------------------------------------------------
ANOVA Table for Randomized Block Designs Using Ratings

Source of         Degrees     Sum of    Mean
variation         of Freedom  squares   Square    F      p

Total               59          20.71
Testers (blocks)    14           4.55
Codecs eval'd        3           8.43    2.81   15.26  7.34E-007
Error               42           7.73    0.18
---------------------------------------------------------------
Fisher's protected LSD for ANOVA:   0.316

Means:

mp3128   exh36k   opu36k   fdk36k  
  3.75     2.97     2.90     2.81  

---------------------------- p-value Matrix ---------------------------

         exh36k   opu36k   fdk36k  
mp3128   0.000*   0.000*   0.000*  
exh36k            0.673    0.313   
opu36k                     0.555   
-----------------------------------------------------------------------

mp3128 is better than exh36k, opu36k, fdk36k

整形済みデータ

Opus 1.3	FDK-AAC 2.0.2	exhale 1.1.5	LAME 3.100.1
%feature	0	Opus	HE-AAC v2	xHE-AAC(USAC)	MP3
%feature	7	≒40kbps	≒40kbps	≒40kbps	≒131kbps
%feature	10	--bitrate 39	-c:a libfdk_aac -profile:a aac_he_v2 -b:a 42k	a	-V 5
%feature	11	アルバム平均:~40kbps	アルバム平均:~43kbps	アルバム平均:~40kbps	アルバム平均:~131kbps
%feature	12	テスト音源平均:~46kbps	テスト音源平均:~43kbps	テスト音源平均:~45kbps	テスト音源平均:~143kbps
2.250	2.200	2.800	3.700	
3.200	3.900	3.300	2.900	
2.700	2.200	2.950	3.800	
2.750	2.400	2.950	3.900	
3.800	3.000	2.800	4.150	
2.000	1.800	3.050	3.750	
3.950	3.450	3.600	3.250	
3.400	3.200	2.750	4.100	
3.050	2.650	2.800	4.000	
2.100	2.900	2.550	3.750	
2.000	2.550	2.600	3.950	
3.100	2.750	2.900	3.700	
3.450	3.400	3.050	3.700	
2.600	2.750	3.150	3.900	
3.200	3.000	3.300	3.700	
%samples	41_30sec	Perc.
%samples	finalfantasy	Strings
%samples	ATrain	Jazz
%samples	BigYellow	Pops
%samples	FloorEssence	Techno
%samples	macabre	Classic
%samples	mybloodrusts	Guitar
%samples	Quizas	Latin
%samples	VelvetRealm	Techno
%samples	Amefuribana	Pops
%samples	Trust	Gospel
%samples	Waiting	Rock
%samples	Experiencia	Latin
%samples	Heart to Heart	Pops
%samples	Tom's Diner	Acappella
%bitrate
46331	43282	55803	159545
56552	43277	42408	113421
44465	43593	45380	141851
42608	43387	46175	152219
53898	43559	44766	174336
41318	43588	46528	137064
44302	43542	39861	135788
46242	43303	46629	148985
47125	44295	52523	157022
45743	43367	43348	129806
36764	43224	42329	153864
46754	43495	44439	141483
43211	43515	44221	143500
42659	43323	43100	138090
47066	43481	42887	119125

整形済みデータ(ハードウェア別)

opus-1st	opus-2nd	he-aac-v2-1st	he-aac-v2-2nd	xhe-aac-1st	xhe-aac-2nd	mp3-1st	mp3-2nd
%feature 7 1回目 2回目 1回目 2回目 1回目 2回目 1回目 2回目
%feature	8	≒40kbps	≒40kbps	≒40kbps	≒40kbps	≒40kbps	≒40kbps	≒131kbps	≒131kbps
2.1 	2.4 	2.3 	2.1 	2.7 	2.9 	3.8 	3.6
2.9 	3.5 	3.9 	3.9 	3.4 	3.2 	3.3 	2.5
2.9 	2.5 	2.1 	2.3 	3.2 	2.7 	3.9 	3.7
2.8 	2.7 	2.3 	2.5 	3.1 	2.8 	4.1 	3.7
3.7 	3.9 	2.9 	3.1 	2.7 	2.9 	4.2 	4.1
1.9 	2.1 	1.7 	1.9 	3.2 	2.9 	3.7 	3.8
4.1 	3.8 	3.9 	3.0 	3.7 	3.5 	3.3 	3.2
3.5 	3.3 	3.2 	3.2 	3.0 	2.5 	4.1 	4.1
3.2 	2.9 	2.1 	3.2 	2.9 	2.7 	3.9 	4.1
2.1 	2.1 	3.1 	2.7 	2.7 	2.4 	3.9 	3.6
1.9 	2.1 	2.5 	2.6 	2.7 	2.5 	4.1 	3.8
2.9 	3.3 	2.7 	2.8 	2.9 	2.9 	3.7 	3.7
3.5 	3.4 	3.3 	3.5 	2.9 	3.2 	3.8 	3.6
2.7 	2.5 	2.6 	2.9 	3.5 	2.8 	4.1 	3.7
3.3 	3.1 	3.1 	2.9 	3.4 	3.2 	3.7 	3.7

2021-03-24

Bluetoothで使えるコーデックの音質比較

概要

Bluetoothで使えるコーデックである、SBC、AAC、aptXの、二重盲検法による音質比較。

結果

一般的な設定で使う限り、SBCもAACもaptXも高音質であり、原音を忠実に再現した。
AACは、他より41%～45%低いビットレートで、SBCやaptXと同等の忠実度が得られた。

評価

f:id:kamedo2:20210323231720p:plain — Bluetoothで使えるコーデックの音質比較、一般的な設定の場合

f:id:kamedo2:20210323231747p:plain — Bluetoothで使えるコーデックの音質比較、全結果

f:id:kamedo2:20210323235400p:plain — Bluetoothで使えるコーデックの音質比較、テストに使われた27音源と評点一覧

方法

銘柄に対する先入観が影響しないように、PSP ABC/HR v2.4とRP-HT560を利用して、7個のエンコードされた圧縮音源をランダムに並び替えて、銘柄を伏せて採点した。採点基準は、「音質劣化が非常に気になる」が1点「気になる」が2点「わずかに気になる」が3点「原音からの音質変化が分かるが、気にならない」が4点「音質変化がわからない、区別できない」が5点。4.9点以下の評点をつける場合は、ABXYテストを15回行い、12回以上(これ以上の成績をまぐれで出す確率は約2%)正解して、違いを聞き取れることを確認してからそうした。27種の多様なジャンルを含むテスト用の非圧縮音源が使われた。このテストでの採点は、27(音源)×(3+2+2)(エンコーダ)×1(回)=189(回)。

使用したオプション

SBC

2020年10月時点で最新の、FFmpegに内蔵のSBCエンコーダとデコーダが使われた。

ffmpeg -i 原音.wav -c:a sbc -b:a 237k 出力.sbc
ffmpeg -i 原音.wav -c:a sbc -b:a 280k 出力.sbc
ffmpeg -i 原音.wav -c:a sbc -b:a 328k 出力.sbc （一般的なBluetoothの設定)

AAC

2020年10月時点で最新の、アンドロイドで使われている、Fraunhofer FDK AAC Codec Library がこのテストでもAAC-LCエンコーダとして使われた。

ffmpeg -i 原音.wav -c:a libfdk_aac -b:a 128k 出力.mp4
ffmpeg -i 原音.wav -c:a libfdk_aac -b:a 192k 出力.mp4 （一般的なBluetoothの設定)

aptX

2020年10月時点で最新の、FFmpegに内蔵のaptXエンコーダとデコーダが使われた。このテストでは、aptX LLやaptX HDではなく、通常のaptXがテストされた。

ffmpeg -i 原音.wav -c:a aptx -ar 32000 出力.aptX
ffmpeg -i 原音.wav -c:a aptx -ar 44100 出力.aptX （44kHzで、一般的なBluetoothの設定)

詳細な優劣の分析

FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Blocked ANOVA analysis

Number of listeners: 27
Critical significance:  0.05
Significance of data: 2.22E-016 (highly significant)
---------------------------------------------------------------
ANOVA Table for Randomized Block Designs Using Ratings

Source of         Degrees     Sum of    Mean
variation         of Freedom  squares   Square    F      p

Total              188          64.42
Testers (blocks)    26          13.67
Codecs eval'd        6          26.69    4.45   28.85  2.22E-016
Error              156          24.05    0.15
---------------------------------------------------------------
Fisher's protected LSD for ANOVA:   0.211

Means:

aac192k  sbc328k  aptx352k sbc280k  aac128k  aptx256k sbc237k
  4.66     4.59     4.50     4.22     4.06     3.89     3.55

---------------------------- p-value Matrix ---------------------------

         sbc328k  aptx352k sbc280k  aac128k  aptx256k sbc237k
aac192k  0.534    0.157    0.000*   0.000*   0.000*   0.000*
sbc328k           0.427    0.001*   0.000*   0.000*   0.000*
aptx352k                   0.008*   0.000*   0.000*   0.000*
sbc280k                             0.148    0.002*   0.000*
aac128k                                      0.098    0.000*
aptx256k                                              0.002*
-----------------------------------------------------------------------

aac192k is better than sbc280k, aac128k, aptx256k, sbc237k
sbc328k is better than sbc280k, aac128k, aptx256k, sbc237k
aptx352k is better than sbc280k, aac128k, aptx256k, sbc237k
sbc280k is better than aptx256k, sbc237k
aac128k is better than sbc237k
aptx256k is better than sbc237k

整形済みデータ

sbc237k	sbc280k	sbc328k	aac128k	aac192k	aptx256k	aptx352k
%feature	7	SBC	SBC	SBC	AAC	AAC	aptX	aptX
%feature	10	ffmpeg N-99419-g4fceb2634e	ffmpeg N-99419-g4fceb2634e	ffmpeg N-99419-g4fceb2634e	FDK-AAC v2.0.1	FDK-AAC v2.0.1	ffmpeg N-99419-g4fceb2634e	ffmpeg N-99419-g4fceb2634e
%feature	11	-c:a sbc	-c:a sbc	-c:a sbc	-c:a libfdk_aac	-c:a libfdk_aac	-c:a aptx	-c:a aptx
%feature 12 237kbps 281kbps 331kbps 130kbps 194kbps 256kbps 353kbps
3.800	4.700	5.000	4.300	4.700	3.900	4.600	
3.100	3.800	4.600	4.600	5.000	3.600	4.400	
3.900	4.700	5.000	4.100	5.000	4.400	5.000	
3.600	5.000	5.000	4.300	5.000	4.500	5.000	
4.300	4.400	5.000	3.600	4.500	3.400	3.800	
3.200	3.900	4.500	4.100	4.600	4.200	4.400	
3.900	4.500	4.400	5.000	5.000	4.100	4.700	
3.200	4.100	4.600	4.400	5.000	5.000	5.000	
3.000	3.100	4.800	3.300	3.800	4.300	4.600	
2.900	3.300	4.300	4.100	4.700	3.500	4.600	
4.200	4.600	4.700	3.600	4.300	3.700	4.800	
2.900	3.900	4.500	3.500	4.400	3.700	4.200	
3.700	4.500	4.700	4.600	5.000	3.400	4.200	
3.100	3.800	4.300	3.900	5.000	3.400	4.200	
2.900	3.500	3.800	4.100	5.000	3.300	4.300	
4.100	4.400	5.000	3.700	4.500	3.900	4.800	
4.700	5.000	5.000	3.700	4.400	3.800	5.000	
4.300	4.800	4.700	3.800	4.200	3.200	4.500	
3.200	3.800	4.400	4.100	4.700	4.200	4.500	
3.100	4.200	4.400	4.500	5.000	3.300	3.500	
2.900	3.200	3.900	4.300	4.500	3.400	3.700	
3.700	4.400	4.300	3.200	4.100	3.800	4.200	
3.200	3.900	4.200	3.800	4.400	3.600	5.000	
3.800	5.000	4.700	3.400	3.900	4.300	4.500	
3.600	4.600	4.700	4.200	5.000	3.800	4.500	
3.800	4.400	5.000	5.000	5.000	5.000	5.000	
3.800	4.400	4.400	4.500	5.000	4.200	4.600	
%samples	41_30sec	Perc.
%samples	finalfantasy	Strings
%samples	ATrain	Jazz
%samples	BigYellow	Pops
%samples	FloorEssence	Techno
%samples	macabre	Classic
%samples	mybloodrusts	Guitar
%samples	Quizas	Latin
%samples	VelvetRealm	Techno
%samples	Amefuribana	Pops
%samples	Trust	Gospel
%samples	Waiting	Rock
%samples	Experiencia	Latin
%samples	Heart to Heart	Pops
%samples	Tom's Diner	Acappella
%samples	01 castanets	inst.
%samples	02 fatboy_30sec	Techno
%samples	03 eig	Techno
%samples	04 Bachpsichord	inst.
%samples	05 Enola	Techno
%samples	06 trumpet	inst.
%samples	07 applaud	Live
%samples	08 velvet	perc.
%samples	09 Linchpin	Rock
%samples	10 spill_the_blood	guitar
%samples	11 female_speech	Speech
%samples	12 French_Ad	Speech
%bitrate
237036 	281135 	330747 	130016 	194031 	256000 	352800
237006 	281100 	330706 	130850 	195057 	256000 	352800
237030 	281128 	330739 	131475 	195827 	256001 	352800
236969 	281057 	330655 	131082 	195248 	256000 	352800
237027 	281125 	330735 	130561 	194707 	256000 	352800
237024 	281121 	330731 	129960 	194015 	256000 	352800
236965 	281051 	330648 	131447 	195921 	255999 	352800
237028 	281126 	330737 	130083 	194180 	256000 	352800
237016 	281112 	330720 	130659 	194779 	256000 	352800
237028 	281126 	330736 	129955 	194043 	256000 	352800
237016 	281112 	330720 	129951 	194008 	256000 	352800
237015 	281110 	330718 	130240 	194347 	256000 	352800
237028 	281126 	330736 	129990 	194050 	256000 	352800
236995 	281087 	330690 	130563 	194840 	256001 	352800
237008 	281102 	330708 	130306 	194432 	256000 	352800
237011 	281106 	330713 	130050 	194111 	256000 	352800
237032 	281131 	330743 	130262 	194347 	256000 	352800
237026 	281124 	330735 	130223 	194454 	256000 	352800
237008 	281103 	330709 	130183 	194246 	256000 	352800
237028 	281126 	330737 	129975 	194041 	256000 	352800
236973 	281061 	330660 	131100 	195263 	256000 	352800
237037 	281136 	330749 	130049 	194117 	256000 	352800
237015 	281111 	330719 	129868 	193955 	256000 	352800
237037 	281137 	330750 	130167 	194256 	256000 	352800
237005 	281099 	330705 	130234 	194273 	256000 	352800
237020 	281117 	330725 	130062 	194140 	256000 	352800
237009 	281104 	330711 	130241 	194337 	256000 	352800

注：「詳細な優劣の分析」欄で、分析ソフトウェアに最後の6音源の採点結果を入力していなかったため、お詫びして出力結果を訂正します。全体的な結論に影響はありません。(2021/8/1追記)
注：公開試聴試験での多人数の平均評点と管理人の評点が似たような傾向になることは確認しているので言えるが、ある個人がある再生環境で、ある価値観のもとに聞いたときの評価が、ここに書いた管理人の評価に似るかどうかまでは何とも言えない。また、今回利用した音源とは傾向の異なる音を多くエンコードした場合、結果や順位が異なる可能性があります。

2017-03-23

LAME、Helix、iTunes MP3エンコーダの音質比較

概要

MP3エンコーダの音質比較。定評のあるオープンソースのMP3エンコーダであるLAMEの、現行版・α版に加え、爆速エンコードで知られるHelix MP3エンコーダ、Apple製のiTunesでMP3エンコードを選択したときに使われるエンコーダを、192kbpsで比較した。

結果

Helix MP3 エンコーダが最高得点となった。
iTunes のMP3エンコーダの品質は、2016年現在もなお、LAME等のオープンソースエンコーダに追い付いていない。
LAMEのα版(3.100α2)は、音質面で現行版に比べて明らかに優位ではない。

全てのエンコーダで、4.0(気にならない)以上の評点が過半数を占めた。

評価

f:id:kamedo2:20210324004740p:plain — LAME、Helix、iTunes MP3エンコーダの音質比較、全結果

f:id:kamedo2:20210324004823p:plain — LAME、Helix、iTunes MP3エンコーダの音質比較、テストされた27音源と評点一覧

形式	MP3	MP3	MP3	MP3
エンコーダ	LAME	LAME	Helix	iTunes
バージョン	3.100α2	3.99.5	v5.1	12.4.2.4
リリース年	2013	2011	2005	2016
レート制御	VBR	VBR	VBR	VBR
指定レート	-V2.75	-V2.3	-V111	192k
オプション	なし	なし	-HF2	高品質
平均スコア	4.32	4.35	4.46	4.09
テスト音源平均	201k	201k	197k	194k
アルバム平均	184k	185k	188k	192k
指定レート	-V2.75	-V2.3	-V111	192k
バージョン	3.100α2	3.99.5	v5.1	12.4.2.4
エンコーダ	LAME	LAME	Helix	iTunes

方法

銘柄に対する先入観が影響しないように、PSP ABC/HR v2.4とRP-HT560(1回目)、RP-HJE150(2回目)を利用して、4個のエンコードされた圧縮音源をランダムに並び替えて、銘柄を伏せて採点した。採点基準は、「音質劣化が非常に気になる」が1点「気になる」が2点「わずかに気になる」が3点「原音からの音質変化が分かるが、気にならない」が4点「音質変化がわからない、区別できない」が5点。4.9点以下の評点をつける場合は、ABXYテストを15回行い、12回以上(これ以上の成績をまぐれで出す確率は約2%)正解して、違いを聞き取れることを確認してからそうした。27種の多様なジャンルを含むテスト用の非圧縮音源が使われた。このテストでの採点は、27(音源)×4(エンコーダ)×2(回)=216(回)。

使用したオプション

Helix mp3 encoder v5.1 -V111 -HF2
LAME 3.99.5 -V2.3
LAME 3.100.alpha2 -V2.75
iTunes 12.4.2.4 high quality default, vbr enabled

詳細な優劣の分析

FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Blocked ANOVA analysis

Number of listeners: 27
Critical significance:  0.05
Significance of data: 1.42E-009 (highly significant)
---------------------------------------------------------------
ANOVA Table for Randomized Block Designs Using Ratings

Source of         Degrees     Sum of    Mean
variation         of Freedom  squares   Square    F      p

Total              107           8.62
Testers (blocks)    26           4.02
Codecs eval'd        3           1.98    0.66   19.62  1.42E-009
Error               78           2.62    0.03
---------------------------------------------------------------
Fisher's protected LSD for ANOVA:   0.099

Means:

helixv   l3995v   l100a2   itunes   
  4.46     4.35     4.32     4.09   

---------------------------- p-value Matrix ---------------------------

         l3995v   l100a2   itunes   
helixv   0.029*   0.005*   0.000*   
l3995v            0.530    0.000*   
l100a2                     0.000*   
-----------------------------------------------------------------------

helixv is better than l3995v, l100a2, itunes
l3995v is better than itunes
l100a2 is better than itunes

整形済みデータ

l100a2	l3995v	helixv	itunes
4.400	4.450	4.350	3.900
4.300	4.200	4.500	4.150
4.400	4.100	5.000	4.400
4.450	4.250	4.800	4.400
4.350	4.250	4.050	3.850
4.400	4.150	4.300	3.900
4.250	4.300	4.550	4.200
4.500	4.350	4.700	4.200
4.200	4.050	3.950	3.700
4.250	4.500	4.750	3.950
4.250	4.250	4.150	4.200
3.800	3.850	4.200	3.950
4.100	4.400	4.500	4.150
4.000	4.300	4.400	3.750
4.400	4.400	4.700	3.950
4.100	4.150	4.350	3.750
4.350	4.450	4.750	3.750
4.100	4.250	4.350	3.650
4.350	4.450	4.450	4.300
4.300	4.250	4.400	4.300
4.350	4.600	4.450	4.050
4.100	4.150	4.250	4.100
4.800	5.000	4.850	4.300
4.600	4.600	4.050	4.300
4.100	4.350	4.500	4.550
5.000	4.900	4.750	4.600
4.450	4.550	4.450	4.150

概要

結果

評価

方法

使用したオプション

SBC

LC3（Googleの開発する Google/liblc3）

詳細な優劣の分析

整形済みデータ

概要

結果

評価

方法

使用したオプション

サンプリング周波数が44.1kHzのロスレス音源からOpusへの変換（ストリーミングによる音楽聴取環境を再現するために使用）

AAC (Appleのエンジン)

AAC (Androidのエンジン)

LC3（欧州電気通信標準化機構の配布するLC3plus）

LC3（Googleの開発する Google/liblc3 、Zephyr上ではliblc3codec表記）

MP3

詳細な優劣の分析

整形済みデータ

概要

結果

評価

方法

使用したオプション

サンプリング周波数が44.1kHzのロスレス音源から48kHzへの変換

AAC (Appleのエンジン)

AAC (Androidのエンジン)

LC3

詳細な優劣の分析

整形済みデータ

基本中の基本

最高音質のオプション

高音質のオプション

持ち運び用のオプション

超低ビットレート用

変換に時間がかかるけど高音質なオプション

CBR,VBR,ABRの違い

概要

結果

評価

方法

使用したオプション

サンプリング周波数が44.1kHzのロスレス音源から48kHzへの変換

Opus

HE-AAC v2

xHE-AAC

MP3

詳細な優劣の分析

整形済みデータ

整形済みデータ(ハードウェア別)

概要

結果

評価

方法

使用したオプション

SBC

aptX

詳細な優劣の分析

整形済みデータ

概要

結果

評価

方法

使用したオプション

詳細な優劣の分析

整形済みデータ