音風景ブログ RSSフィード

2017-03-23

LAME、Helix、iTunes MP3エンコーダの音質比較

概要

MP3エンコーダの音質比較。定評のあるオープンソースMP3エンコーダであるLAMEの、現行版・α版に加え、爆速エンコードで知られるHelix MP3エンコーダApple製のiTunesMP3エンコードを選択したときに使われるエンコーダを、192kbpsで比較した。

結果

Helix MP3 エンコーダが最高得点となった。

iTunesMP3エンコーダの品質は、2016年現在もなお、LAME等のオープンソースエンコーダに追い付いていない。

LAMEのα版(3.100α2)は、音質面で現行版に比べて明らかに優位ではない。

全てのエンコーダで、4.0(気にならない)以上の評点が過半数を占めた。


評価

f:id:kamedo2:20170323224509p:image

形式MP3MP3MP3MP3
エンコーダLAMELAMEHelixiTunes
バージョン3.100α23.99.5v5.112.4.2.4
リリース年2013201120052016
レート制御VBRVBRVBRVBR
指定レート-V2.75-V2.3-V111192k
オプションなしなし-HF2高品質
10 41_30secPerc.4.44.44.43.9
11 finalfantasyStrings4.34.24.54.2
12 ATrainJazz4.44.15.04.4
13 BigYellowPops4.54.34.84.4
14 FloorEssenceTechno4.44.34.13.8
15 macabreClassic4.44.24.33.9
16 mybloodrustsGuitar4.34.34.64.2
17 QuizasLatin4.54.44.74.2
18 VelvetRealmTechno4.24.13.93.7
19 雨降花Pops4.34.54.84.0
20 TrustGospel4.34.34.24.2
21 WaitingRock3.83.94.24.0
22 ExperienciaLatin4.14.44.54.2
23 Heart To HeartPops4.04.34.43.8
24 Tom's DinerVocal4.44.44.74.0
01.castanetsinst.4.14.24.43.8
02.fatboy_30secTechno4.44.44.83.8
03.eigTechno4.14.34.43.7
04.Bachpsichordinst.4.44.44.44.3
05.EnolaTechno4.34.34.44.3
06.trumpetinst.4.44.64.54.1
07.applaudLive4.14.24.34.1
08.velvetPerc.4.85.04.94.3
09.LinchpinRock4.64.64.14.3
10.spill_the_bloodGuitar4.14.44.54.6
11.female_speechSpeech5.04.94.84.6
12.French_AdSpeech4.44.64.44.2
平均スコア4.324.354.464.09
テスト音源平均201k201k197k194k
アルバム平均184k185k188k192k
指定レート-V2.75-V2.3-V111192k
バージョン3.100α23.99.5v5.112.4.2.4
エンコーダLAMELAMEHelixiTunes

テストに利用した音源を試聴したい方、ダウンロードしたい方、ログを見たい方はこちらへ。

http://zak.s206.xrea.com/bitratetest/main.htm

https://drive.google.com/file/d/0ByvUr-pp6BuUSnlwUG1WNkZzeDA/view?usp=sharing

方法

銘柄に対する先入観が影響しないように、PSP ABC/HR v2.4とRP-HT560(1回目)、RP-HJE150(2回目)を利用して、4個のエンコードされた圧縮音源をランダムに並び替えて、銘柄を伏せて採点した。採点基準は、「音質劣化が非常に気になる」が1点 「気になる」が2点 「わずかに気になる」が3点 「原音からの音質変化が分かるが、気にならない」が4点 「音質変化がわからない、区別できない」が5点。4.9点以下の評点をつける場合は、ABXYテストを15回行い、12回以上(これ以上の成績をまぐれで出す確率は約2%)正解して、違いを聞き取れることを確認してからそうした。27種の多様なジャンルを含むテスト用の非圧縮音源が使われた。このテストでの採点は、27(音源)×4(エンコーダ)×2(回)=216(回)。

使用したオプション

Helix mp3 encoder v5.1 -V111 -HF2

LAME 3.99.5 -V2.3

LAME 3.100.alpha2 -V2.75

iTunes 12.4.2.4 high quality default, vbr enabled

詳細な優劣の分析

FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Blocked ANOVA analysis

Number of listeners: 27
Critical significance:  0.05
Significance of data: 1.42E-009 (highly significant)
---------------------------------------------------------------
ANOVA Table for Randomized Block Designs Using Ratings

Source of         Degrees     Sum of    Mean
variation         of Freedom  squares   Square    F      p

Total              107           8.62
Testers (blocks)    26           4.02
Codecs eval'd        3           1.98    0.66   19.62  1.42E-009
Error               78           2.62    0.03
---------------------------------------------------------------
Fisher's protected LSD for ANOVA:   0.099

Means:

helixv   l3995v   l100a2   itunes   
  4.46     4.35     4.32     4.09   

---------------------------- p-value Matrix ---------------------------

         l3995v   l100a2   itunes   
helixv   0.029*   0.005*   0.000*   
l3995v            0.530    0.000*   
l100a2                     0.000*   
-----------------------------------------------------------------------

helixv is better than l3995v, l100a2, itunes
l3995v is better than itunes
l100a2 is better than itunes

整形済みデータ

l100a2	l3995v	helixv	itunes
4.400	4.450	4.350	3.900
4.300	4.200	4.500	4.150
4.400	4.100	5.000	4.400
4.450	4.250	4.800	4.400
4.350	4.250	4.050	3.850
4.400	4.150	4.300	3.900
4.250	4.300	4.550	4.200
4.500	4.350	4.700	4.200
4.200	4.050	3.950	3.700
4.250	4.500	4.750	3.950
4.250	4.250	4.150	4.200
3.800	3.850	4.200	3.950
4.100	4.400	4.500	4.150
4.000	4.300	4.400	3.750
4.400	4.400	4.700	3.950
4.100	4.150	4.350	3.750
4.350	4.450	4.750	3.750
4.100	4.250	4.350	3.650
4.350	4.450	4.450	4.300
4.300	4.250	4.400	4.300
4.350	4.600	4.450	4.050
4.100	4.150	4.250	4.100
4.800	5.000	4.850	4.300
4.600	4.600	4.050	4.300
4.100	4.350	4.500	4.550
5.000	4.900	4.750	4.600
4.450	4.550	4.450	4.150

注:公開試聴試験での多人数の平均評点と管理人の評点が似たような傾向になることは確認しているので言えるが、ある個人がある再生環境で、ある価値観のもとに聞いたときの評価が、ここに書いた管理人の評価に似るかどうかまでは何とも言えない。また、今回利用した音源とは傾向の異なる音を多くエンコードした場合、結果や順位が異なる可能性があります。

すがりすがり 2017/08/23 08:02 はじめまして
当ブログ楽しみに拝見しております。
こちらのブログでは比較的低ビットレートでのブラインドテストが多いですが、
もし可能であればAACエンコードにおけるハイビットレート(320Kbps)あたりで、
qaac nero その他の比較をされるご検討をおねがいできないでしょうか。

qaacが巷では音が良いと評されていますが、私
自身neroの方がハイビットレートでは上だと思っておりまして・・・。

nercoはq-vbrで400kbps以上をだせるので、これは圧倒的ですが、
こちらも参考に比較いただけるとうれしいです。

ご検討おねがいします!

kamedo2kamedo2 2017/08/26 02:50 すがりさん

当ブログをご高覧頂きありがとうございます。

高いレートのブラインドテスト結果を希望されるその気持ち、分かります。

しかしながら、統計的に有意な勝敗が決しないと思われるため、行いません。
得られる結論は、MP3 224 Kbps のテスト結論に近くなるものと思われます。
http://d.hatena.ne.jp/kamedo2/20130531/1370023293
また、世界で過去に行われたリスニングテストを見ますと、ブラインドテストとしては 192 Kbps であっても相当レートの高い部類に入る、と理解していただければ幸いです。
https://en.wikipedia.org/wiki/Codec_listening_test#Results
伯パラナ連邦工科大のRoberto José de Amorim氏は、Listening Test Conduction Handbook の中で、高いレートのリスニングテストを求める声に理解を示しつつ、「うまくいかない」と述べています。
また、外部サイトですが、ほとんどの音源においてほとんどの人が、AAC 256 Kbps を エンコード元のCD音質と区別できないというテスト結果があります。
https://cdvsmp3.wordpress.com/cd-vs-itunes-plus-blind-test-results/
それでも区別できる方は、ご自身でご判断される事をおすすめいたします。

通りすがりのあんぽんたん通りすがりのあんぽんたん 2018/08/27 13:10 皆、高ビットレートでのテスト結果を知りたいと思います。

私なんかは、qaac、Helix、LAMEの
最高品質のCBRとVBRの結果を知りたいなとか思ってしまいます。

似たような音質が続くと心理作用が大きく現れてしまい
テスト品質が下がる事も想像できますが…。

竹田竹田 2018/09/15 01:00 評価お疲れ様です。
こんな大昔のエンコーダーが一番音質いいのか・・・

もふもふもふもふ 2018/11/11 22:40 機材の品質が低すぎて聞き分けできない可能性はないのん?

スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト


画像認証

トラックバック - http://d.hatena.ne.jp/kamedo2/20170323/1490276874