Hatena::ブログ(Diary)

記憶の彼方へ

2006年12月14日

音楽検索エンジン:OWL

| 00:27 | 音楽検索エンジン:OWLを含むブックマーク 音楽検索エンジン:OWLのブックマークコメント

f:id:elmikamino:20061215001624j:image

Creative Commons Searchで、一ヶ月前に画期的な音楽検索サービスが始まった。「音楽で音楽をみつける(find music through music)」がモットーの「似た音楽検索エンジン(audio similarity search engine)」が稼働している。

f:id:elmikamino:20061215002120j:image

OWL multimedia http://www.owlmm.com/

画期的なのは、従来のテキスト(アーティスト名、曲名)検索ではなく、文字通り「音楽検索」ができるところである。

レッシグhttp://blog.japan.cnet.com/lessig/archives/003421.htmlによれば、

文句なしに、ここ数年で目にした一番クールな技術だ:クリエイティブ・コモンズの検索ページに行き、OWL Music Searchタブをクリック。(ブラウザにより、最初に仮検索をする必要があるかもしれない。改良中だが、検索バーに何か適当な文字列を入れること)。するとOWLの音楽検索インタフェイスが開くはずだ。OWLに何かmp3ファイルを食わせてみよう。音声が解析され、音が似ているクリエイティブ・コモンズ ライセンス曲の検索結果が表示される。マッチさせたい部分を選択すればもっとも近いものを探すことができる。

ひと月前の原文http://lessig.org/blog/archives/003605.shtmlでは、

This is easily the coolest technology I’ve seen in years: Go to the Creative Commons search page. Click on the OWL Music Search tab. (Depending upon the browser, you might need to run a fake search to get it to come alive ― we’re working on this, but just type anything in the search bar). You’ll then see OWL’s Music Search interface. Drop an MP3 on OWL. It will analyze it and show you similar sounding Creative Commons licensed music. You select the part of the song you want to match; it finds the closest match it can find.

また、『OPEN...』のGlyn Moody(http://opendotdotdot.blogspot.com/2006/11/google-is-that-sound-of-crying.html)によれば、

OWL multimedia has launched an audio similarity search engine stocked with 10,444 CC-licensed tracks from ccMixter and Magnatune, with many more to come from other CC supporting sound repositories.

You can search OWL via search.creativecommons.org but its real power is finding new music through music. Drag an mp3 into the OWL interface and you will be shown tracks that sound similar to the mp3 you provided. You can select a segment of a track to search on and of course you can limit your search to tracks with licenses that permit uses you require, e.g., commercial or derivative use.

というわけで、ccMixterを覗いてみたら、CC-licensed tracks(クリエイティブ・コモンズ ライセンス曲)はすでに20,000に達している。

肝心の「解析analyze」方法についてはレッシグもMoodyも明言していないが、OWLのインターフェースから想像するに、「波形解析」のようだ。

早速、OWLに何でもよいのだが、たまたまAlva Noto & Ryuichi SakamotoのInsenからMoonのMP3を食わせて(drop)、冒頭の8秒間を「検索」させたところ、波形が「似た(部分を持つ)曲」が71曲ヒットした。ちなみに、1曲目はLeon McCawleyの「Fabel, Fantasiestucke, Op.12」で、71曲目はPhilharmonia Baroqueの「Nisi Dominus - Beatus vir」だった。個人的には、これは、スライドショーのBGM選曲に「使える!」と思った。

f:id:elmikamino:20061215002405j:image

レッシグもMoodyも興奮気味に「クールだ!」とべた褒めしている(MoodyにあってはGoogleを揶揄してさえいる)が、私としてはそれこそクールに評価すべきだと思う。この音楽検索は一体何の役に立つのか?私がまず思いついた使い道は、映画のサウンドトラックやスライドショーのBGMの選曲である。ある曲に客観的に「似た」曲を探したいときには、非常に役に立つ。それから、ある楽曲の客観的な分析、例えばアントニオ・カルロス・ジョビンのある曲をOMLに検索させたら、ショパンのある曲がヒットすることで、ある種の音楽批評の材料になるとか。他にどんな使い道があるだろうか?

9 2006/12/15 03:27 こんばんわ。
三上先生のブログや講義を見聞きしていて『ギョッ』とする事があります。と言うのも、偶然なのでしょうが自分のブログに書き綴ったような事が割と話題になっているからです。
最近、私も最近『音楽検索』について考えていました。
今の所、そのOWLというヤツは私が求めている『検索』とはちょっと違う感じがしますが・・。
いやでも、かなり興味深いです。
そのOWLの検索だと、特定のジャンルや雰囲気の似た新しい楽曲の発見には使えそうですね。まぁあとは・・従来のテキスト検索とは逆の目的(楽曲の、曲名やアーティスト名が知りたい時)で使えそうですね。


http://isseizm.blog.shinobi.jp/
の『音楽を検索する』にサワリだけ綴ってみました。
中身は本当に人様に見せられるようなモンじゃないですけど、前にも『URL公表しなさい』と言われてしまったので恥をしのんで・・・。 できれば観ないで下さい!!笑

taknakayamataknakayama 2006/12/15 08:30 9さん、こんにちは。ある大企業が9さんがブログでおっしゃっている楽曲のさわりの情報を入れるとその曲名を教えてくれるサービスの商用化を検討していました。デモ版の実演を見せてもらったような覚えがあります。5,6年ほど前の話で、これは楽屋裏の情報です。あれは商用化されたのか、されずに終わってしまったのか、その後の状況を知りませんし、OWLほどクールだったかはよく分かりませんが。何かお伝えできるような情報が入手できたらお知らせします。

9 2006/12/15 10:07 taknakayamaさん、わざわざありがとうございます。やっぱりそういうサービスは何年も前から検討されているんですね。
私の場合、まず『わかっている情報が自分の頭の中にしかない、その楽曲のさわりの部分をどう表現するか』というのが問題で、taknakayamaさんがおっしゃっているサービスもOWLも手元(頭の中以外)に『さわりの情報』があればかなり便利ですよね。

その商品がその後どうなったのか、気になります。かなり興味深い情報をありがとうございます。また何かありましたら、よろしくお願いします。

fuzzy2fuzzy2 2006/12/15 10:43 音楽検索ですが、私も前に紹介記事か何かを見たような記憶があるのですが、日本では権利処理の問題をクリアするのがなかなか難しいのではないかと想像されます。利用者が検索したい音楽をサービスに送る部分が新しいので、そこで議論上の難点になります。(CCなら大丈夫です)
具体的にはcopyrightの原理の意識合わせ、課金する部分と金額の合意の取り方が問題で、JASRACよりもレコード会社との合意が厳しい状況になるように思えます。
注: 権利者側の提案を丸呑みするのならばおそらく次のような課金になります。
各利用者が使うPCについて、PC1台あたり数百〜数千円の補償金。
CDからPCに音楽を取り込むことについて、1曲につき約30円の著作権使用料+原盤の権利の使用料。
検索のためにサーバーへ音楽を送信することについて、1曲につき約30円の著作権使用料+原盤の権利の使用料。
検索結果の確認のためだけに利用者が試聴することについて、利用者毎に月額数百円(曲数無制限)。
検索結果を利用者が入手することについて、1曲につき約30円の著作権使用料+原盤の権利の使用料(ダウンロードの場合)。
著作権(JASRAC)は全曲一括で契約ができますが、原盤(レコード会社)については利用する各社毎に個別に契約が必要です。

fuzzy2fuzzy2 2006/12/15 11:01 ちなみに、映像(テレビや映画)や音楽、ネット上のファイルなどから使用されている楽曲を特定する技術は既に開発済みで、YouTube等でも不適切なファイルを自動的に判断する技術として採用予定とのニュースが流れています。

elmikaminoelmikamino 2006/12/15 18:46 中山さん、9さん、「楽曲のさわりの情報」、「わかっている情報が自分の頭の中にしかない、その楽曲のさわりの部分をどう表現するか」にかんしてですが、OWLでも、例えば、口ずさんだメロディーを録音して、MP3ファイルをアップロードすれば、CCライセンスの曲の範囲ですが、検索可能ですよね。中山さんが目撃したサービスは、そういうことも可能でしたか?

fuzzyさん、「映像(テレビや映画)や音楽、ネット上のファイルなどから使用されている楽曲を特定する技術」って、やっぱり「波形解析」ですか。

私はクリエイティブ・コモンズの思想、創造的共有ということにすごく興味があって、著作権処理を心配しないで、こころおきなく他人の創作物を、さらなる創造へと活かす共有地(コモンズ)をとにかく少しずつでも拡大していくことが、その動きに加担していくことが、個人的には大事なことだと思っています。著作権処理問題の現実はfuzzyさんのおっしゃる通りだと思います。資本主義の問題が商品になる作品にはつきまとうわけですね。作品の創造と再創造の独自のサイクルが回り、そこがワクワクするくらい面白く、なおかつ創作者に創作動機を高めるような利益がもたらされるようになればいいんですがね。妄想かな。

taknakayamataknakayama 2006/12/16 13:23 三上さん、そのときにどのような実装が検討されていたか、もう覚えていないのですが、基本的にはOWLと同様で波形を分析してマッチングをする技術でした。fuzzyさんがおっしゃるとおり、権利処理がビジネスの肝で、関連団体と交渉をするとか、しているとか、そんな話だったと思います。

fuzzy2fuzzy2 2006/12/16 15:03 実装方法はおそらくWaveletやそれに近い方法でしょう。波形をいくつかの周波数帯域に分けて、それぞれの(時間軸に対する)変化量を抽出して、その変化パターンのマッチングだろうと想像できます。(これで相当データ量を減らすことができます)
アナログ伝送や非可逆圧縮(MP3等)を経由した音でも比較できる必要があるため、波形そのものの比較ではよい結果がでないし、比較する処理量が大きくなる問題があるからです。
「口ずさんだメロディーを録音して、...」カラオケの採点機能は、近い技術ではあります。メロディーの楽譜データを持っているので、マイクから入力する歌の音程と音量を分析して、比較したり比較結果に味付けをしてから表示しているわけです。
口ずさんだメロディーを入力にして楽譜化する製品も確かありますが、楽曲検索まで実用化した話は見かけていないです。カラオケ屋さんは大量の楽譜データを持っているから、権利処理の問題さえなければ実装はそう難しくはないと思います。(CD音源との比較よりも、カラオケ音源との比較の方が簡単です)

taknakayamataknakayama 2006/12/16 21:59 私が見たものは、もう6年半も前に商用化されていたようです。サービスとしては今見るとプアですね。話題にもならなかったところをみるとコンテンツを集められなかったのでしょう。
http://www.ntt.com/meloq/

fuzzy2fuzzy2 2006/12/16 22:56 ソフトウェアだけで(オプションのハードウェアなしで)音声・音楽の認識ができるほどPCの処理能力が上がったのは、たしかに6年半ほど前ですね。
上記のサービス例ですが、中の利権がいろいろと複雑なために図中の関係各社が採用するのは実際難しいだろうなと思います(苦笑)。コンテンツの問題ではないような気がします。

elmikaminoelmikamino 2006/12/17 02:13 中山さん、fuzzyさん、
それにしても、やはりグーグルやYouTubeのように権利処理も自分の土俵でコントロールできるくらいの力量がなければ無理ですよね。あるいは、CCのように、まったく異質な土俵を作ってしまうか。丸山さんのmF247はうまく行ってるのかな。

fuzzy2fuzzy2 2006/12/17 03:34 今回の話で興味深い点は、
1. 技術、つまり音楽を認識する部分だけでは消費者には売れない。データ(大量の楽曲)とセットであることが必須。(Wikiのシステムだけでは大した売り上げが期待できないけど、Wikipedia級のコンテンツを含むと大きな広告収入が期待できる)
2. 協調と対立のバランスが取れている利害関係者から第三者が分け前を預かろうとするビジネスは簡単ではない。
3. 大量の消費者から少額の利用料を得る(携帯サイト)か、大量の広告主から少額の広告費を得る(Google)ように、既存の利害関係者抜きの新しいお金の流れを開発できると、ビジネスに加われる可能性がある

taknakayamataknakayama 2006/12/17 08:15 fuzzyさんの要約はとても素晴らしく、ビジネスの観点からの問題提起として興味深いですね。紹介させていただいたサービスの場合、プロトタイプを作っていた人たちは、「3」の認識ありきで始まり、「2」を如何にクリアするかを一生懸命考えていたみたいですが、そこは結果的には大きな溝を跳び越えられなかったようです。

elmikaminoelmikamino 2006/12/17 16:36 梅田さんのコラムhttp://www.shinchosha.co.jp/foresight/web_kikaku/u123.htmlで語られているテレビ局とYouTube@Googleとの権利交渉の本質を読んで、YouTubeの映像にはミュージシャンの演奏映像も多く含まれているので、音楽版の「ロングテール」に照準したビジネスモデルもYouTubeが実現しちゃったと考えていいのかな。音質はひどいけど。