コンピュータなどで使われる技術で、得られたデータ結果を音声で読み上げる表現手法。 その技術はカーナビ・交通機関の行先案内装置・翻訳機・ゲームなどでの自動応答システムに応用される。 あたかも人間が喋っているように聞こえるための『自然な音声列』を合成するための技術は、永遠の課題ともいえるほど難しいとされている。
概要 A.I. Voice の琴葉姉妹を購入したので、 Text2Speech で作成した音声をあとからちょっと色付けできるツールを作ってみた。ただ、私としてそこまで Text2Speech をやりたかったわけではないので、これが使えるツールになっているのかはわからない。どちらかというと下記の記事の続きものであり技術検証じみた趣味の開発であって、自身のニーズすらないところで作っているので的外れ感はあるかもしれない。 shurabap.hatenablog.jp 成果物とやれること スクショ * haruneko.github.io 44.1kHz 16bit の音声ファイルを下記のように編集で…
booksch.hatenablog.com [ BooksChannel本屋物語 | 日記Note | booksch.hatenablog.com | 日付号 | タイトル | 記事及び #タグ 他 | check… rinna 未来を感じました。JOHN LENNONの声の特徴をAIが機械学習し、自由自在に再現できればAI VOICEでBEATLESの新曲が聴ける時代になる。とは予想しているのですが、簡単に一般人の声を再現することが可能になれば、犯罪につながる予感もあり、実に悩ましい。 rinnakk.github.io WEB限定:BooksChannel店舗店頭買取用クーポン券発行し…
はじめに前回ESPnetというのを使わせて頂き音声合成を行いました。 touch-sp.hatenablog.com スクリプトを一部変えるだけで様々な音声が合成できるようなので今回一部を試してみました。結果(3種類の音声)jsut前回と同じです。 text2speech = Text2Speech.from_pretrained( model_tag=str_or_none('kan-bayashi/jsut_full_band_vits_prosody'), vocoder_tag=str_or_none('none'), device="cuda" ) tsukuyomi text2sp…
概要 C++ の vocoder に GUI を作ろうと思ったが、 C++ with Qt とかだとあんまり一般的な知見を得られないな、じゃあ React を使おう。ということで軽く言ったもののあんまり中身は軽くなくて下記のように苦しんでいた。が、ようやく React の世界に持ってこられたのでサンプルを作ってみた。これが私の React 入門編です。正直に言うと React + emscripten は全然入門じゃないと思う。 shurabap.hatenablog.jp 作ったもの https://haruneko.github.io/voice-editor-practical-impl…
はじめに PC環境 Python環境構築 Pythonスクリプト 用意するテキストファイル 使い方 音声比較 前回作成した音声 今回作成した音声 インストールされたライブラリのバージョン 2022年7月9日追記①(torch==1.12.0+cu113) 2022年7月9日追記②(torch==1.12.0+cu116) 2022年7月12日追記 はじめに以前「Open JTalk」を使って同様のことをしました。 touch-sp.hatenablog.com 今回は「ESPnet」というのを使わせて頂きました。 両者の結果が比較できるようにこの記事の最後に音声ファイルをのせておきます。 良か…
open-jtalk本体のインストール sudo apt install open-jtalk辞書ファイルのインストール sudo apt install open-jtalk-mecab-naist-jdic音声のダウンロード・解凍 wget https://sourceforge.net/projects/mmdagent/files/MMDAgent_Example/MMDAgent_Example-1.8/MMDAgent_Example-1.8.zip unzip MMDAgent_Example-1.8.zip使用するための準備必要なファイル群をカレントディレクトリにコピーしておく…
音声のテキスト化(音声認識,自動字幕)で遅れを取っていることを報告した 音声認識から翻訳,そして字幕入りの動画制作環境にすっかり取り残されてしまっていた件 - jeyseni's diary (hatenablog.com) 2022/5/3。とりあえず,2つの方法について整理しておくことにする。 たとえばZoom会議の流れを,主催者が録画したファイルがあるとする。これをテキスト起こしして議事録に仕上げようとした場合は,自動字幕化ソフトのVrewが良さそうである。これまで,手で要点をメモっていたのだが,書き取ったキーワードがだれの発言だったか,結構迷うことがある。○○さんがコメントしたな,と思…
こんにちは。管理人のまるです。 近年、ボーカロイドという言葉を耳にする機会も増えてきましたね。 ボーカロイドといえば、初音ミクが頭に浮かんだ方の中には、 可愛らしいビジュアルや、人間では出せない音域やリズムで歌える初音ミクに魅了された方も多いのではないでしょうか。 音声合成業界では、ボーカロイド以外にボイスロイドと呼ばれる人間のような自然な喋りが可能になるソフトが開発されています。 河崎純真さんが紹介していた記事によると、人間の喋り声にしか聴こえない革命的な音声合成ソフト 「VOICEPEAK」 が誕生したそうです。 ■河崎純真さんが紹介していた記事 www.dtmstation.com 動画…
youtu.be 【CoeFont】ドブ声フォントに絶対に云わなさそうなコト云わせたった クソヒゲモヒカンブタゴリラ謹製ドブ声フォント、完成しました。 🤟🏻 予想通りのドブっぷりで納得の仕上がり。 😆 YouTube 動画に使うときは声の高さを上げてチートしたら、ドブが少しでも浄化されるかな。 🤞🏻 https://coefont.cloud/coefonts/09d3dd17-8d8b-4e20-9344-1a78d5116d6b それでは、聞いていただきましょう。 クソヒゲモヒカンブタゴリラが絶対に云わなさそうなコト。 『お前以外、興味ないから。』 『先にシャワー浴びてこいよ。』 Voic…
Yahooニュース・アクセスランキングの見出しをスクレイピングで取得し、それを合成音声で読み上げます。 pywin32(win32com)はPythonからWindowsアプリケーションを制御するためのライブラリです。win32comでWindows標準の音声合成機能Microsoft Speech API(SAPI)を制御することで任意の文章を音声合成できます。 関連記事 Yahooニュース・アクセスランキングの見出しを取得し頻出単語を調べる 環境 windows10 home Anaconda 3/ jupyter notebook 6.4.6 Python 3.8.12 requests…
前回作ったもの(下記事)から引っ越しにより改修を加えたので改修箇所を中心に記事にします。 realtek.hatenablog.com 主な改修点 全体像 ラズパイが話せるようになった LINE通知できるようになった イベント検知で駆動できるようにコードを書き換えた GPIOからシャットダウン・起動できるようになった 主な改修点 ラズパイが話せるようになった LINE通知できるようになった イベント検知で駆動できるようにコードを書き換えた GPIOからシャットダウン・起動できるようになった 全体像 全体像 回路接写 動画Ver youtube.com ラズパイが話せるようになった OpenJt…
はじめに こんにちは、いやお久しぶりです。浜野実です。 2022年8月9日、ある新しいサービスが発表されましたね。 その名は「Symphoneme(シンフォニーム)」。 PRTIMESに出稿されたプレスリリースでは、こう謳っています。 テクノブレイブ株式会社(東京都千代田区、代表取締役:西村 陽一)は、音声合成技術を駆使した 歌声合成AIクラウドサービス『Symphoneme-S』(シンフォーニーム エス)を、 2022年8月17日よりサービス開始することを発表いたします。 prtimes.jp これを読む限り、「Symphoneme」というのはメディアミックス企画の総称のようです。 そして、…
今週は、マジカルミライ10th 大阪へ行ってきました。 #マジカルミライ10th トラック! pic.twitter.com/ifO9Tx8fnW — NAT(ナット) (@nat0468) 2022年8月12日 #マジカルミライ10th マジカルミライ年表。 pic.twitter.com/h3vjgHqh1w — NAT(ナット) (@nat0468) 2022年8月12日 #マジカルミライ10th 昼公演終わった。走馬灯を見てたのかもしれない。死ぬほど楽しかった! pic.twitter.com/JbmtR7jhyc — NAT(ナット) (@nat0468) 2022年8月14日 マジ…
⚡️NEWS⚡️TuneCore Japanで#初音ミク#鏡音リン#鏡音レン#巡音ルカ#MEIKO#KAITO#重音テトの商用利用が可能になりました!誰でもキャラクター名と2次創作によるキャラクターデザインを利用したオリジナル楽曲を音楽ストリーミング配信・DL販売が可能に🌏▼https://t.co/HeoEA2271b pic.twitter.com/du1dNgaq70 — TuneCore Japan (@TuneCoreJapan) 2022年8月10日 /📣楽曲配信を検討中の皆様に朗報です!\『#初音ミク』たち #ピアプロキャラクターズ を使用した楽曲を配信できるサービスが2つに!『…
⚡️NEWS⚡️TuneCore Japanで音声合成ソフト「足立レイ」の商用利用が可能になりました!誰でもキャラクター名と2次創作によるキャラクターデザインを利用したオリジナル楽曲を、音楽ストリーミング配信・ダウンロード販売が可能になります✈️https://t.co/mNsaBsEPJj pic.twitter.com/cVL8DRtzAG — TuneCore Japan (@TuneCoreJapan) 2022年8月9日 【お知らせ】TuneCore Japanさんで足立レイを使った配信が出来るようになりました!https://t.co/DfMXBLcE9j — メカニカルガール 公…
2022年8月7日~2022年8月13日の間にマイリスしたボカロなど音声合成ソフトを用いた曲をご紹介します。今回は3曲です。どれもおすすめなので、良かったら聴いてみてください!※全て敬称略させていただいております。 ■Circus-P::enough::海伊静かな始まりからぐっと盛り上がるのがたまりません。とてもかっこよくて体に響く低音が気持ち良い曲です。 ■水面湊人::muisiki::初音ミククールでどこかダークな雰囲気を感じる曲です。中盤の盛り上がりから、すとんと着地する感じがたまりません。 ■Fty::アトマリアの祈り::星界切なさ滲む民族調です。しっとりと響くメロディラインに引き込ま…
質問サイトを使っていると、ボカロについての質問を見ることがある。 「好きなボカロは?」「ボカロを教えて」などといった質問である。 とくにコロモーという質問サイトでは、ボカロなどのサブカル系の話はよく出る話題だ。 ちなみにボカロとは、ヤマハが開発した音声合成ソフト『Vocaloid』のこと。メグッポイドなど他社製品が含まれることもあるが、あくまで音声合成ソフトを指す言葉である。 しかし最近ではボカロをボカロ曲(ボカロを使って作った曲)として使う人が多いらしい。 「好きなボカロは?」「ボカロを教えて」といった質問にたいしてボカロ自体ではなく、ボカロの曲名が回答されていく。 どうやら質問している人も…
ニコニコ動画で行われている中二病投稿祭~羞恥無用のインモラル~というイベントに参加させてもらってますm(_ _)m CeVIOには女性キャラしか追加されない陰謀論【NEUTRINOトーク】 ■YouTube版はこちら■ 沢山のご視聴と沢山のご支援いつも本当にありがとうございますm(_ _)mそしてこのようなユニークなお祭りを企画してくださった主催者様に感謝ですm(_ _)m 極度の女余り状態のキャラクター付き音声合成世界をたくましく?生き抜く女性たちと、勘違いタカハシをテーマにしたボイスドラマです。 一方で陰キャだと言われるNEUTRINOのナクモ君ですが、この年々過酷になっていくだけの絶望的…
はじめに 皆さま初めましての方は初めまして、そうでない方は前回の記事を読んでいただきありがとうございます。京都大学バーチャルYouTuber同好会の観測者(の一部集団)です。今回、7/17に行われたヰ世界情緒と理芽による『Singularity Live』を観測した会員が一定数いたので、分担しながら感想記事をまとめることにしました。本記事は『Singularity Live』の感想記事です。オタクたちによる思いの丈を各々の言葉で書きましたので楽しんでいただければ幸いです。 はじめに 会員紹介 オープニングアクト 1.「君の望み、君の願い」-CIEL 2.「少年漫画」-CIEL ヰ世界情緒パート…
どーも、デニムです。 今回初めてNEUTORINO の めろう を使ってカバー曲やってみたんですが、nico.ms 感想や気付きなどをメモ代わりに残しておきます。 とにかく、ベタ打ちでも自然に歌ってくれるのがすごいですよね。感動です。 正直ボカロの歌声の人工的な響きがあまり好きになれなくて、今まで触れてこなかったのですが、めろうを初めて聴いたときに、これだ!と思ったんですよねー。 声質も好きだし、これからめろうで色々作っていきたいです。 めろう以外も、ずんだもんとか色々あるようなので、色々試してみたいですね! NEUTORINO の使い方はこちらの記事を参考にしました note.com あと今…
今週末は、仙台市天文台プラネタリウムで上映されている「音楽の時間 VOCALOID SONGS」を見てきました。 vocafro.hatenablog.com プラネタリウムで、音楽の時間 VOCALOID SONGS が上映されると聞いて。 (@ 仙台市天文台 - @sao1300 in 仙台市, 宮城県) https://t.co/ROi6c79FRm pic.twitter.com/5rNifHAqcp — NAT(ナット) (@nat0468) 2022年8月6日 音楽の時間 VOCALOID SONGS 面白かった。ボカロ曲全9曲、プラネタリウムならではの映像と合わせて楽しめた。歌に…
こんばんは。ときドルダイアリー動画を作り始めて、本日で99回目の投稿が完了した勇です。 動画編集をはじめてから見よう見まねでゲーム実況を作り、練習と称してときドルダイアリーを寸劇風の動画にして作り始めて投稿したのが2020年9月20日。 そこから毎週欠かさずに投稿し続けて、動画編集技術も少しずつ上達(しているとおもう)し、あれこれ試しつつ気が付けば2022年8月7日時点で99週連続投稿できていました。もうすぐ2年が経過しようとしてます。よく続いてるな、自分。 ----------------------------------- 閑話休題。タイトルのお話。 そんなさなか、softalkに以下の…
2022年7月31日~2022年8月6日の間にマイリスしたボカロなど音声合成ソフトを用いた曲をご紹介します。今回は2曲です。どれもおすすめなので、良かったら聴いてみてください!※全て敬称略させていただいております。 ■オーP::Nighfe::初音ミク洗練された音作りが印象的なスタイリッシュな曲です。展開が独特で一気に惹き込まれます。 ■ATOLS::ORIGAMI::初音ミク落ち着いた雰囲気の独特の雰囲気を持つ曲です。前半と後半で違う表情を持っていて、聴いていて楽しいです。 以上です!何か気に入ってもらえるものがあれば、ぼくとしても嬉しいです。
とりあえず先日購入したG-Tune E5-165ほうが解像度多いので環境が広ければ広いほど都合いい曲ソフト郡を新PCに移行中。正規ユーザーなのに、いちいち元PC上でアクティベート解除してから新PCに移すのもあって面倒くさい。グラフィック系はそんなでもないのに曲ソフト関連は異常に面倒くさいの多いSinger Song WriterやM1 Leの次はCubaseやボカロ郡を移動するか それぞれどのPCでアクティベートしてたんだっけ? もうPC、4~50台くらいになってるから訳わからん(それでも容量すぐ足りなくなるのでまた買い足してる) とりあえずキーボード入力も出来る環境にまではした入力テストw …
おう! 「100秒一本勝負!」だ! 今回は、そのものズバリ、 タイトル通り、 『ニコニコQ を作れば Amazonギフト券10000円分が当たるかもよ?!』 という話だ!