コンピュータなどで使われる技術で、得られたデータ結果を音声で読み上げる表現手法。 その技術はカーナビ・交通機関の行先案内装置・翻訳機・ゲームなどでの自動応答システムに応用される。 あたかも人間が喋っているように聞こえるための『自然な音声列』を合成するための技術は、永遠の課題ともいえるほど難しいとされている。
こんにちは、テックです。 私は半引きこもりなので、基本的に外部との接触を避ける傾向にあります。 友人と話すのももっぱらSkypeとかを使い自宅で行うことが多いのですが、たまに「ボイスチェンジャー」を使ってくるやつがいるんです。 ボイスチェンジャーといえばゲーム実況者(ゲーム内の会話も含め)やYoutubeの配信者などが多い印象ですが、最近では詐欺などにも使われるそうで。。 www.yomiuri.co.jp 女性になりすまし1000人以上の方が騙されるって相当よね。 個人的には特に配信する予定も計画もないので使うことはないだろうと思っていたのですが、ふと思い立って私(キモオタ)が使っても女性の…
ここ最近VOICEVOXを使用して音声合成を楽しんでいましたが、その中でよくOpenJTalkを使用すればもっと軽くリアルタイムにできるのに…ということも言っていました。以前は自分もOpenJTalkを使っていたのですが、インストールの手順が煩雑だったのでいまいち手が出ないというのが正直なところでした。 参考 uepon.hatenadiary.com それも2016年のこと、現在ではどうなっているか改めて調べてみたところ、Pythonから簡単にOpenJTalkが使用できるラッパーであるpyopenjtalkがある事がわかりました。あまりにも簡単に導入ができるので、今後は導入はこれ1つで良い…
AIが発達してきて、ここ数年で情勢変わりそうなので、 現状をなるべく色んなサイトURLと共に記録しておく。 音声AIの変化(キャラクター性の不要) AIの使用例のニュース 日常生活の中で 終わり 蛇足 音声AIの変化(キャラクター性の不要) 最近、 ネットのサブカルに興味ない人たちのスマホから、ずんだもんを始めとする合成音声による解説が流れてくるようになった。 視聴者は、ずんだもんがどういったキャラ設定なのかを知らない。 声オタ以外が声優を意識せずナレーションを聞くように、動画の一要素として音声合成を聴いているし、利用されている。 これは、初音ミクを始めとする、日本の合成音声の文化から見ると驚…
先日来使用しているVOICEVOXですが、PCであればかなり高速に処理をすることができるとはいえ、リアルタイム性?というところではやはり処理時間がかかるため会話というところには使用が難しいと思いました。そこで、他にもなにかないかなと思い探してみることにしました。結果的にOpenJTalk一択かもしれないのですが、それ意外の可能性も捨てたくないですよね。 今回はEdge-TTSを使用してみることにします。EdgeというとWindowsの標準ブラウザというイメージがあるので、Windows意外では使用できないのでは?と思われる方もいるかと思いますが、今回使用するEdge-TTSはWindowsでの…
がっちりマンデー!!儲かる!声ビジネス! 2021年6月20日放送 TBS進藤晶子 加藤浩次 天野ひろゆき(キャイ~ン) 森永卓郎 リードスピーカー・ジャパンの音声合成技術とは? リードスピーカー・ジャパンは、音声合成ソフト「リードスピーカー」を開発している会社です。このソフトは、テキストを入力するだけでAIが文章を解析し、自然な音声で読み上げてくれるのです。音声合成市場は古くから存在していますが、リードスピーカーはその中でもトップクラスのシェアを持っています。利用料金は用途によって異なり、月額数万円から数十万円と幅広い参入が可能です。国内の約1500社が既にこの技術を利用しています。以前の音…
前回のエントリではVOICEVOXをPCにインストールされたUbuntuへインストールしたという内容でしたが、今回はRaspberryPiにVOICEVOXをインストールするという内容です。ただ、RaspberryPiの運用ではモニタのないヘッドレス環境での使用の可能性もあるため、この設定ではVOICEVOXを構成する要素の1つであるVOICEVOX COREを導入し、CLIでの運用を行ってみたいと思います。 ネットで検索してもうまくいかないという話はあるのですが、成功例はなかなかないようです。自分も数日悩みましたがようやく解決できました。 【参考】 uepon.hatenadiary.com…
前から気になっていたVOICEVOXをUbuntuに入れてみました。WindowsやMacでは動くのは当然だよね~ってところで、Linuxにも正式に対応しているというのが割とすごいなという印象です。以前から気にはなっていたのですが、なかなかさわる機会がなかったので、今回少し時間ができたのでインストールしてみようと思います。 VOICEVOXの説明に関しては以下の通り ja.wikipedia.org VOICEVOXは、ヒホが開発した音声合成ソフトウェアである。 VOICEVOX で生成した音声合成を使用して自分の作品を公開する場合、クレジットを表記し利用規約に同意すれば、商用、非商用問わず無…
音楽を制作している方々に先入観なく触ってみてもらいたいですね Synthesizer Vを開発したのが、中国出身のフア カンル氏。1997年生まれで、2018年末にSynthesizer Vを発表し、2019年には日本でDreamtonicsを設立。2022年にはAHSの代表取締役兼CTO(Chief Technology Officer=最高技術責任者)に就任した。フォーブス日本版において日本から世界を変える30歳未満を選出する“30 UNDER 30 JAPAN”に選ばれるなど、音声合成分野において名実共にトップランナーと言える存在だ。インタビューから、彼の類いまれな頭脳を垣間見てほしい。…
booksch.hatenablog.com アカペラ×AI - 技術は人の声の再現にどこまで近づけるか? の実験と結果 https://note.com/books_channel/n/n98eed2ac24b7 に引き続き 人の声に焦点を当てました。今回は"アカペラ"。#SunoAI 他で何処まで引き出せるか?とさせていただきました。私が最も興味のあるトコロでもあります。近年、AI技術の発展により、アカペラ音楽の生成も可能になってきました。AIによって完璧に人の声を再現できるのでしょうか? 今回、音楽生成AI「MusicGenerationAI」主に #SunoAIを用いて 、アカペラ音楽…
「いまどこ」を実現する方法をさまざま試してきて,1ヶ月が経過した。とうとう,1つの解決法に行き着いたので報告したい。 まずこれまでの経緯から。①単独のアプリで実現する方法--断念 「Android 現在地 音声案内」といったキーワードで連日のようにアプリを検索し,それらしきアプリは片っ端からインストールして試してみた。唯一,「Lazario」というスペインのアプリが残ったが,情報の更新の頻度,情報の確度・必要性において評価できなかった。視覚障害者向けのアプリも片っ端から確認したが,筆者のニーズに合うものはなかった。②地図アプリをベースとする方法--断念 山登り向けの地図アプリに,現在の標高を定…
俺はフラッピングビーターベースゲントアープの権利証持ちだ ライセンス名義は確か ブラウザス クナウザフ アンピビフィッケ BFLAUBGHUF CNAUTHAESGHF AMPBARGCHRHAH 歌うベースドラムデジタルメイキング ベロシティカットアウトスナッチフィッチオルガニズム フューザースライディッドフィジアベンドアウトクラッチナウト プチペアラレントディフライディングコートアウト つまりデジタルサウンドメイキング音声合成用のアレ 最近は色んな曲に隠しで使われてるかもよ!!?
今週の記事を投稿しました。今週の音声合成ソフトとキャラクターに関するニュースは、4件のニュースを取り上げました。 VOCALOID6 AI 花響琴が発売された。インターネット社からの3本目のVOCALOID6製品、CVは立花れおんさん、イラストはのうさん AI歌唱ソフトVoiSonaの新規ボイスライブラリ「玉姫(たまき)」が6月1日リリースと発表された。CVは、男の娘VTuber「犬山たまき」 リアルタイムに音声を変換し、新しい歌声を生成できるツール Vocoflex を Dreamtonics が発表。ベータ版テストプログラムへの参加者を募集中 Nintendo Switchソフト「Fit …
「VOICEVOX」の最新版v0.18.0、ソング機能が大幅に強化 こんにちは!山崎光春です。 「VOICEVOX」は、手軽にAI技術を活用した音声合成を利用できるフリーソフトウェアだ。最新版v0.18.0では、プロトタイプ版として搭載されていたソング機能が大幅に強化された[3]。 v0.16.0で初めて登場したソング機能は、テキストを読み上げるだけでなく音程を付けて歌わせることができる[2]。v0.17.0ではプロジェクトの保存機能やアンドゥ・リドゥ機能が追加され、楽曲制作ツールとしての利用が可能になっていた[3]。 そして、v0.18.0ではさらに機能が強化された[3]。矩形選択やコピー&…
歌声合成ソフトSynthesizer Vや文字読み上げソフトVOICEPEAKの開発元として知られるDreamtonicsが、さまざまな歌声を作り出すことができるソフトウェア/プラグインVocoflex(ボコフレックス)を発表。現在開発中で、ベータ版テストプログラムの試用者募集を開始した。 Vocoflexは、Dreamtonicsの音声合成の技術研究から生まれた、実験的な製品。10秒程度の音声ファイルをインポートするか、性別やトーンをカラーピッカーから指定するだけで、入力した歌声をインポートした音声ファイルや画面で指定した歌声に変換し、さらに複数の歌声をブレンドして新しい歌声を生み出すことが…
音声合成、音声認識、生成AIの技術を組み合わせれば、語学レッスンもPCやスマホでできるようになることは、想像できるものかもしれません。 Duolingo、speak、ELSA AIといったアプリでは、いずれも学習者との会話を通じて学習者の発音を修正したり、例文を示したりして、学習者がレベルに合わせて英会話を学べるようになっています。 以前からテープを繰り返し聞いたり、ラジオやテレビの英会話番組で学習する方法はありましたが、AI技術を使うことで学習者の発音や表現方法をチェックして修正することが可能になっている点で一線を画しているのかもしれません。 ただ、英会話は異文化との交流、外国人の思考態様や…
音声アシスタントとは、音声認識、音声合成、自然言語処理(NLP)を用いて、特定のアプリケーションを通じてサービスを提供するデジタルアシスタントのことである。この調査レポートは、OEMアシスタントアプリ市場に焦点を当てています。 QYResearchが発行した最新市場調査レポート「音声アシスタントアプリ―グローバル市場シェアとランキング、全体の売上と需要予測、2024~2030」によると、音声アシスタントアプリの世界市場規模は2029年までに12.8億米ドルに達し、予測期間中の年平均成長率は13.5%に達すると予測されています。 音声アシスタントアプリケーションの世界市場規模(百万米ドル)、20…
活字媒体であるこのブログも、今日はやる気をなくした朝から考え直している。 書くことでかばおうとしている自分自身というのが恐らく末っ子(弟がいるが年が離れていて、従姉と姉の4人の中で末っ子として育った)で、お兄ちゃんお姉ちゃんに先を行かれて良いところを取られて、しかし甘えるんだけど最初は優しくても長い目で見ると冷たくあしらわれている部分もある。それに24歳からだけど母親の別居とか姉の結婚とか弟の上京で家族の中でいちばん憎んでいたと言っても良い父親との同居で、一緒に住む中で父親の良いところも見つけたが男同士で俺が何処かオカマ役なり子供役で居ることで平穏を保っているが、そのことに対するやり場のないス…
超知能AIの暴走リスク このブログではAIの歴史と現在、そして近未来について考察してきました。 今回の記事では、もう少し先の未来――AIが人間と同等かそれ以上の知能を身に着けて、「超知能」となった時代の話をしましょう。 超知能AIの暴走は、サイエンス・フィクションでは定番のテーマの1つです。 たとえば映画『ターミネーター』は、自我に目覚めたAI「スカイネット」が人類に反旗を翻し、機械の軍隊で襲い掛かるという設定でした。映画『マトリックス』は、人類は薬漬けで眠らされて、一生を夢を見ながら過ごすという設定でした。機械の目的は、人体から出る微弱な電流を電源として利用することでした。ビデオゲーム『デト…
今週の音声合成ソフトとキャラクターに関するニュースは、9件取り上げました。 初音ミクが、アメリカ最大規模の野外音楽フェス「コーチェラ 2024」に出演、YouTube配信も行われた。来週も2週目 Weekend 2 が開催、出演予定 声優・梶裕貴の声を元にしたCeVIO AI ソングボイス『梵そよぎ』を制作するクラウドファンディングが開始。目標金額1000万円を集め、制作決定 桜ミクと弘前・函館コラボ、「桜ミク×ひろはこ」春の観光キャンペーンが始まる。メインビジュアルiXimaさん、テーマソング一二三さん、コラボグッズ、桜ミクコラボレーションルーム、陸奥新報・桜ミクコラボなど 結月ゆかりが、夕…
日記です。 日記 写真はホットケーキ。 牛乳じゃなくて水でも普通に美味いことがわかった。家計助かる。 「Lords of the Floor」を見た。 おじさん世代からすると伝説のイベント。22年ぶりに開催。めでたい。 ERIKが踊ってるのとか泣ける。 Commonが観客として満面の笑みで映ってるの笑った。あとウィンドミルもできるんだ…… みんないい顔してる。 みなさんお疲れ様でした。 今週もちょい忙しかった。書くことがあまりない。 良かったもの あーーーーーーーーーー / さたぱんP feat. 初音ミク youtu.be 「返して人生。」あたりの音声合成なのに魂の叫びとして心にズンとくる感…
『初音ミク』、それは電子の歌姫。より正確にはクリプトンが開発した音声合成ソフトウェアである。初登場はかれこれ17年前(2007年)にまで遡るが、彼女の登場によって音楽業界…特にアマチュアのソレは一変したといっていい。 『初音ミク』を筆頭に詳細な設定を持たない(固定させない)プレーンなキャラクター…『ボーカロイド』たちを用いて、数多のクリエイターが自作の楽曲を歌ってもらい動画サイトにアップロード、それによりニコニコ動画を発端としてインターネット中に、やがてインターネットの外にまで初音ミクたちボーカロイドは一大ムーブメントを引き起こした。…否、『引き起こした』と過去形なのは誤りか。正確には2024…
【ボカロPへの道】 向いている人の特徴と成功へのステップ はじめに ボカロPとは、VOCALOIDという音声合成技術を用いて楽曲を制作する人々のこと。 彼らは独自の楽曲を創り出し、インターネットを通じて幅広いリスナーに届けています。 しかし、ボカロPになるためには、どのような特徴が必要なのでしょうか?また、ボカロPになるためにはどのようなステップを踏むべきなのでしょうか? 本記事では、これらの疑問に答えるべく、ボカロPに向いている人の特徴とボカロPになるための具体的な方法を紹介します。 (adsbygoogle = window.adsbygoogle || []).push({}); ボカロ…
ACE Studio 空詩音レミが発表同時に自分のAI歌声合成を作成できるACE Studio カスタマイズAIシンガーサービスを使用して作成されており、同サービスのリリースも発表 CeVIO AI及びVoiSonaにおいて双葉湊音ソングボイス2.0.0が公開 Koemotion料金改定 VOICEVOX:冥鳴ひまりのクラウドファンディングが発表、開始されすべての目標を達成した。通常音源強化、感情「怒り」「叫び」「喜び」追加、挿絵差分追加、VOICEVOXソング追加が行われる。 VOCALOID6 AI 花響 琴(Hibiki Koto)が発表。4月18日発売予定。 「Voidol 1」および…
今回読んだ本はこれ。 見えないから、気づく (ハヤカワ新書) 作者:浅川 智恵子,(聞き手)坂元 志歩 早川書房 Amazon 浅川智恵子さんという方をご存じでしょうか? 最近だけでも、視覚障害者のためのナビゲーションロボットを開発したり、 www.technologyreview.jp 日本科学未来館の館長に就任したり、 www.museum.or.jp といろいろなトピックでニュースに取り上げられているので、お名前を耳にしたことがあるかもしれません。 浅川智恵子さんが自ら、これまでの歩みを振り返ったのが本書『見えないから、気づく』です。 どうやったらこんなキャリアを築けるんだ?と以前から興…
パソコンやスマホで、音楽にあわせて絵や写真がおどる動画の作り方を解説します。いらすとやを動かす方法はこちら。ダンス動画の作り方はこちら。音声合成はこちら。 ほかの解説動画はこちら。 内容: 1.9VAeきゅうべえのダウンロード 2.サンプルリミックスを保存 3.キャラクタを新しいファイルに保存 4.音楽ファイルを入れる 5.アニメキャストを開く 6.キャラクタを画像に変更 7.アニメキャストをサイズ変更 8.アニメキャストのローマ字を変更 9.速く切り替える 10.アニメキャストにラベルをつける 11.ローマ字ラベルを「X」に変更 12.長い音楽にあわせる方法 13.動画出力 歌詞動画の例 d…