コンピュータなどで使われる技術で、得られたデータ結果を音声で読み上げる表現手法。 その技術はカーナビ・交通機関の行先案内装置・翻訳機・ゲームなどでの自動応答システムに応用される。 あたかも人間が喋っているように聞こえるための『自然な音声列』を合成するための技術は、永遠の課題ともいえるほど難しいとされている。
音声のテキスト化(音声認識,自動字幕)で遅れを取っていることを報告した 音声認識から翻訳,そして字幕入りの動画制作環境にすっかり取り残されてしまっていた件 - jeyseni's diary (hatenablog.com) 2022/5/3。とりあえず,2つの方法について整理しておくことにする。 たとえばZoom会議の流れを,主催者が録画したファイルがあるとする。これをテキスト起こしして議事録に仕上げようとした場合は,自動字幕化ソフトのVrewが良さそうである。これまで,手で要点をメモっていたのだが,書き取ったキーワードがだれの発言だったか,結構迷うことがある。○○さんがコメントしたな,と思…
こんにちは。管理人のまるです。 近年、ボーカロイドという言葉を耳にする機会も増えてきましたね。 ボーカロイドといえば、初音ミクが頭に浮かんだ方の中には、 可愛らしいビジュアルや、人間では出せない音域やリズムで歌える初音ミクに魅了された方も多いのではないでしょうか。 音声合成業界では、ボーカロイド以外にボイスロイドと呼ばれる人間のような自然な喋りが可能になるソフトが開発されています。 河崎純真さんが紹介していた記事によると、人間の喋り声にしか聴こえない革命的な音声合成ソフト 「VOICEPEAK」 が誕生したそうです。 ■河崎純真さんが紹介していた記事 www.dtmstation.com 動画…
youtu.be 【CoeFont】ドブ声フォントに絶対に云わなさそうなコト云わせたった クソヒゲモヒカンブタゴリラ謹製ドブ声フォント、完成しました。 🤟🏻 予想通りのドブっぷりで納得の仕上がり。 😆 YouTube 動画に使うときは声の高さを上げてチートしたら、ドブが少しでも浄化されるかな。 🤞🏻 https://coefont.cloud/coefonts/09d3dd17-8d8b-4e20-9344-1a78d5116d6b それでは、聞いていただきましょう。 クソヒゲモヒカンブタゴリラが絶対に云わなさそうなコト。 『お前以外、興味ないから。』 『先にシャワー浴びてこいよ。』 Voic…
Yahooニュース・アクセスランキングの見出しをスクレイピングで取得し、それを合成音声で読み上げます。 pywin32(win32com)はPythonからWindowsアプリケーションを制御するためのライブラリです。win32comでWindows標準の音声合成機能Microsoft Speech API(SAPI)を制御することで任意の文章を音声合成できます。 関連記事 Yahooニュース・アクセスランキングの見出しを取得し頻出単語を調べる 環境 windows10 home Anaconda 3/ jupyter notebook 6.4.6 Python 3.8.12 requests…
Keywords: COEIROINK・コエイロインク・こえいろいんく・声色インク・声色いんく COEIROINKとは COEIROINKはWindowsで動作する無料のAIトークソフトです。 動作画面のデモはこちらを参考にどうぞ。 ✨COEIROINKリリース✨無料の音声合成エンジン「#COEIROINK」が登場!文章を読み上げます!■公式サイト⇒https://t.co/66YStrCYu0■COEIROINK開発:シロワニさん様 @shirowanisan■VOICEVOX開発:ヒホ様 @hiho_karuta第1弾は「#つくよみちゃん」!商用利用OK! アクセントも指定できます! pi…
v.1.2.0へのアップデートに関して つくよみちゃんトークソフトのv.1.2.0をリリースしました。下記のリンクより体験することができます。 https://shirowanisan.com/tyc-talksoft デモ音声はこちらです。 「シロワニさんのつくよみちゃんトークソフト」をバージョン1.2.0にアップデートしました。■シロワニさんのつくよみちゃんトークソフトhttps://t.co/EyKaowNjx0■動画イラスト素材:花兎*様 pic.twitter.com/6uHnNuydB0 — シロワニさん (@shirowanisan) 2021年9月4日 品質の変わったところ 音…
強みと特別をもっと外に! エスモットです。 24時間テレビにバーチャル若大将が出演したようです。 www.atpress.ne.jp 若大将とは加山雄三さんのことで、私自身もなぜ若大将?と思いました。 若大将シリーズ(わかだいしょうシリーズ)は、東宝が1961年から1971年まで製作した全17作から構成される加山雄三主演の青春映画のシリーズ名である。 ということらしいです。 さて、そのバーチャル若大将ですが、テクノスピーチのAI技術を用いて、音声合成をおこない、湘南乃風の歌を歌いあげました。 先日のテクノクロスとは別の企業の様ですが、音声合成による良いところを表現できたのではないかと思います。…
強みと特別をもっと外に! エスモットです。 テキスト音声技術について色々調べていると、音声合成のニュースにたどり着きました。 https://www.futurevoice.jp/ cloud.watch.impress.co.jp FutureVoiceは、これまでにない自然な音声を実現しているとのことです。 さて、詳細な技術については記事に任せるとして、音声合成技術が発達するにしたがって、どのようなメリットがあるか考えてみました。 メリット 毎回同じセリフを間違えずに発することができる 声が出せなくなっても、代わりに言葉を発することができる 動画などで自分の声が恥ずかしくても、代わりに発言…
今回やったこと 最新の音声合成手法「VITS」を用いて日本語音声合成を試してみました。 VITSとは VITSは2021年6月に発表された音声合成の手法です。論文はこちら。 [2106.06103] Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech この手法がなかなかすごくて特徴をざっくりまとめると以下です。 TTS(テキストから音声への音声合成)ができる 複数話者のTTSが1つのモデルで作れる(もちろん1話者のTTSも作れます) 従来のTTSは音響モデル(テキ…
v.1.1.0へのアップデートに関して つくよみちゃんトークソフトのv.1.1.0をリリースしました。下記のリンクより体験することができます。 https://shirowanisan.com/tyc-talksoft デモ音声はこちらです。 「シロワニさんのつくよみちゃんトークソフト」をバージョン1.1.0にアップデートしました。■シロワニさんのつくよみちゃんトークソフトhttps://t.co/EyKaowNjx0■動画イラスト素材:花兎*様 pic.twitter.com/OK2W3AiPGg — シロワニさん (@shirowanisan) 2021年6月2日 品質の変わったところ 学…
有料会員制ホームページの、 収益次第では、フリーソフト製作者の、 方々に、協力金を、お送りしようと、 考えております。 こちらも、生活があり、 正直、割合から出すことは難しいかと。 以下使用する予定のフリーソフト 3DCGソフトウェアblender ペイント系GIMP ドロー系inkspace 音声合成ソフトUTAU フリー音源重音テトさん お絵かきアプリsketchbook (予定)試作用に3DCGソフトDO-GA
Youtubeにはたくさんの朗読作品が投稿されています。その中から、とくに肉声で深みのある朗読をされているおすすめの朗読家のチャンネルを紹介します。 怪談を聴いて暑い夏の夜にひんやりした気分を味わったり、寝る前のリラックスタイムに聴いたり、文学作品の味わいを深めたりと、それぞれの楽しみ方で、朗読を聴く習慣をつくることはとてもオススメです。 1.巴の空 晴れのち晴れ 小泉八雲『貉(むじな)』 新美南吉『うた時計』 2.対馬てみ(角田周チャンネル) 太宰治『海』 3.石牟礼道子さんの作品を九州の言葉で聴く 石牟礼道子『苦界浄土(くがいじょうど)』 4.朗読の魅力は何?合成音声と何が違う? 1.巴の…
はじめに やらなければいけないことは手短に nikkieです🍨 この記事は、アイうた円盤発売アドベントカレンダー 2日目の記事です。 昨日はnikkieさんによる『カウントダウンなら、まかせて!! #アイの歌声を聴かせて Blu-ray & DVD 発売アドベントカレンダーを始めます』でしたね。 アドベントカレンダーが開幕しました!🎊 さて、今回は(別の記事で触れたこともあるのですが)、プログラムに読み上げてもらう簡単な方法を取り上げます。 「アイうたのシオンみたいなプログラムが作れないかな」と考えるようになった後、最初に試した実装です。 ‖◤#アイうた プロフィール帳①◢‖トップバッターは”…
part1 niconicouser.hatenablog.com VOCALOID dic.nicovideo.jp ボカロは今もニコニコを牽引する人気ジャンルです。ボカロでもマイリス等の数字の低下は顕著ですがこの辺の数字の変遷の考察はやる気があれば別で記事にするかもしれません。 www.nicovideo.jp 往年の有名ボカロPから近年勢いに乗ってきたボカロPまで色々な作者の作品が投稿されています。今だとボカロを収録したリズム、アドベンチャーゲームのプロジェクトセカイ(ソシャゲ)が人気みたいですね。投稿数が多いので是非検索から好きなボカロを探してください。 DECO_27 - ジレンマ …
はじめに 事前準備 ソースコード 実装の概要と動かし方 補助的に作成したモジュールの概要 おまけ:訓練済みモデルのリリース 環境音合成実験 音響イベントによる条件付けなし 音響イベントによる条件付けあり 実装の舞台裏とかTIPS おわりに 参考文献 はじめに 下記の雑誌論文が最近出版された。 Yuki Okamoto, Keisuke Imoto, Shinnosuke Takamichi, Ryosuke Yamanishi, Takahiro Fukumori and Yoichi Yamashita, "Onoma-to-wave: Environmental Sound Synthes…
続きです。 文法を覚えさせ、論理で精度を上げる取り組みは失敗。 自動翻訳で大量の常識の暗記と簡単な論理推論で答えるAIは失敗。 統計と確率で挑んだら結構当たった。 探し物を手伝っているに過ぎない。 文章を書く、絵を描く、作曲をする分野は確率が使われる。 水に落としたインク、たばこの煙、ブラウン運動はランダム。 次は何か、ドの音の次は何の音。確率分布の教科書はない。 同じジャンルを集めて観察。 ディープマインド社はロマン派のピアノ曲を学習させて作曲。 譜面ではなく、波形。 音声合成は交通機関のアナウンスやeラーニングの読み上げで使われる。 続きます。
そもそもこの記事について 以下の書籍の6-1の音声合成に挑戦したときの記憶です。 www.borndigital.co.jp 2022/5/20より長いことやったりやらなかったりしているため、記憶が薄れつつある箇所もございます。なお、あくまでも私の環境で発生したことしか記憶していないのでご容赦ください。また、この「そもそもこの記事について」は271108.hatenablog.comとほぼ同じものですが、対象の章が違うものになっています。 そもそもこの記事について そもそも 苦戦点 pyopenjtalkのインストール apexのインストール Tensorboard開きたいけど403エラーが出…
今週の記事を投稿する前に、第7回TOKYO6公式生放送を見ていました。 www.youtube.com その中で、今年4月から5月の小樽まちめぐりスタンプラリー第2弾で実施していた小樽潮風高校写真部コンテストの受賞作品が発表されました。自分も応募してたのですが、事前に連絡も無かったので、他の方の作品が受賞したのだろうと見てました。 そしたら、自分の作品が受賞作品として紹介されたので驚きました。 第一回 #小樽潮風高校写真部 コンテスト、TOKYO6賞を受賞しました。ありがとうございます!良い景色を探して歩き回った甲斐がありました。 https://t.co/3LF706SyWx — NAT(ナ…
2022年6月19日~2022年6月25日の間にマイリスしたボカロなど音声合成ソフトを用いた曲をご紹介します。今回は2曲です。どれもおすすめなので、良かったら聴いてみてください!※全て敬称略させていただいております。 ■sasakure.UK + 有形ランペイジ::フューチャー・イヴ::初音ミク独特な音の流れと展開が印象的な、ハーモニーがとても綺麗な曲です。随所に入るギターサウンドにグッときます。 ■ATOLS::カルマ::初音ミクカッコ良さとどこか不気味さを感じる曲です。クセになるリズムと音の流れがとても印象的。 以上です!何か気に入ってもらえるものがあれば、ぼくとしても嬉しいです。
6月13日(月) 仕事。ちょっとした会議があり、自分もそこでプレゼンをやることが決まっていた。 スライドは念入りに作って、一度職場内で発表練習もして、「まぁ何とかなるやろ」と気楽に思っていたのに、いざ本番になったら口の中がみるみる乾いていく。なんでや。 平静を装って何とかゆっくり喋ることだけは意識出来たけど、声がガッサガサなのが自分で心底気に食わなくて、後半何を話したのか全く覚えていない。台本を作っていたから変なことは言っていないはずだけど。 プレゼン後に質問が全く来ずに終わったので、「あ、これ全く理解されなかったな」と一瞬で分かった。もう知らん。あっさり終われてよかった、逃げ切れた、と考える…
【まだ書きかえます。いつどこを書きかえたかを必ずしも明示しません。】【この記事は個人的おぼえがきです。専門知識を提供するものでも、意見をのべるものでもありません。】 - 1 - おおぜいの人との約束があったのに、うっかり ねすごしてしまった。目がさめたのは約束の時間よりは前だったが、自分が会場にたどりつけるのは約束の時間よりも1時間ぐらいあとになってしまう。オンラインの会合ならば まにあう時間だったが、オンラインにきりかえる可能性の相談はできていなかった。延期にしていただくしかなかった。体調はわるくなく、前日には話す内容の準備をしていた。これまで、これとにた状況では、じゅうぶんはやい時間に目が…
逆ジオコーディング、ザックリ言うと緯度経度といった座標から住所を割り出す仕組みを作ります。もともと(ほぼ)自分のために作っている、くるまに乗るときに使うアプリで住所情報を割り出して表示する仕組みを用意していましたが、これまでYahoo! Open Local Platformのリバースジオコーダを使っていました。developer.yahoo.co.jpこのAPIは住所の他、いくつかの道路の路線名や愛称が返ってきます。道路名はあまり他のサービスにない便利な機能でしたが、最近できた高速道路*1を取得できないなど、情報が古かったりしました。 また、外部サービスであるがゆえにリクエストリミットの存在…
この度、音声合成ソフトに関する一般の方向けのアンケートを実施しました 全6問実施しています 50名の方にアンケートにご回答いただきました ※こちらの調査内容や画像は自由に引用いただけます 【調査概要】 クラウドワークスにてアンケートを依頼として1件33円で50件発注 1時間で回答が埋まりました アンケートタイトルは「(誰でも可)(選択のみ)(3分で終わります)「YouTube等での動画視聴に関するアンケート全6問」」とし、入口段階で音声合成ソフトに関心がない人もクリックするよう配慮しています (質問内容が全く理解できず画面を閉じた方もいるかもしれないので、若干の偏りは考えられます) (追記:反…
ツイート https://twitter.com/chifuyu_info/status/1538805816350113792?s=21&t=SFLu82vBKlnMeP3o0PjKTg いつも情報を得るのはまあまあ早い(学校でスマホ回収されてる)かもしれないのに記事を書くのはものすごく遅い超新星爆発です。 小春六花、夏色花梨の後輩である花隈千冬ちゃんのサンプル音声が公開されました。もともとTOKYO6 ENTERTAINMENTさんの生放送でSynthesizer VとCeVIO AIのサンプル音声が公開されていて、Synthesizer Vのサンプルは単体で動画化されていましたが、やっと…
目的 私がブログや同人誌の原稿を執筆するPCの執筆環境、および推敲手順についてまとめる。 私はこねくり回しながら執筆するため、エラー過多な文章になりがちである。そのエラーを取り除くのにいつも四苦八苦している。有能なライターならエラーがない文章を一発で書けるのかも知れないが、私には無理っぽい。そのため、なるべく人間の経験に頼るのではなく、機械を使ってエラー訂正をアシストしてゆくことを考えていた。 ところで、私は以前からアニメを語るPodcastに感想を投稿しており、その際に下記について注意してきた。 声に出して読める文章 冗長をなくした簡潔な文章(これは文字数制限があったため) 経験上この2点を…