コンピュータなどで使われる技術で、得られたデータ結果を音声で読み上げる表現手法。 その技術はカーナビ・交通機関の行先案内装置・翻訳機・ゲームなどでの自動応答システムに応用される。 あたかも人間が喋っているように聞こえるための『自然な音声列』を合成するための技術は、永遠の課題ともいえるほど難しいとされている。
ここ最近VOICEVOXを使用して音声合成を楽しんでいましたが、その中でよくOpenJTalkを使用すればもっと軽くリアルタイムにできるのに…ということも言っていました。以前は自分もOpenJTalkを使っていたのですが、インストールの手順が煩雑だったのでいまいち手が出ないというのが正直なところでした。 参考 uepon.hatenadiary.com それも2016年のこと、現在ではどうなっているか改めて調べてみたところ、Pythonから簡単にOpenJTalkが使用できるラッパーであるpyopenjtalkがある事がわかりました。あまりにも簡単に導入ができるので、今後は導入はこれ1つで良い…
AIが発達してきて、ここ数年で情勢変わりそうなので、 現状をなるべく色んなサイトURLと共に記録しておく。 音声AIの変化(キャラクター性の不要) AIの使用例のニュース 日常生活の中で 終わり 蛇足 音声AIの変化(キャラクター性の不要) 最近、 ネットのサブカルに興味ない人たちのスマホから、ずんだもんを始めとする合成音声による解説が流れてくるようになった。 視聴者は、ずんだもんがどういったキャラ設定なのかを知らない。 声オタ以外が声優を意識せずナレーションを聞くように、動画の一要素として音声合成を聴いているし、利用されている。 これは、初音ミクを始めとする、日本の合成音声の文化から見ると驚…
先日来使用しているVOICEVOXですが、PCであればかなり高速に処理をすることができるとはいえ、リアルタイム性?というところではやはり処理時間がかかるため会話というところには使用が難しいと思いました。そこで、他にもなにかないかなと思い探してみることにしました。結果的にOpenJTalk一択かもしれないのですが、それ意外の可能性も捨てたくないですよね。 今回はEdge-TTSを使用してみることにします。EdgeというとWindowsの標準ブラウザというイメージがあるので、Windows意外では使用できないのでは?と思われる方もいるかと思いますが、今回使用するEdge-TTSはWindowsでの…
がっちりマンデー!!儲かる!声ビジネス! 2021年6月20日放送 TBS進藤晶子 加藤浩次 天野ひろゆき(キャイ~ン) 森永卓郎 リードスピーカー・ジャパンの音声合成技術とは? リードスピーカー・ジャパンは、音声合成ソフト「リードスピーカー」を開発している会社です。このソフトは、テキストを入力するだけでAIが文章を解析し、自然な音声で読み上げてくれるのです。音声合成市場は古くから存在していますが、リードスピーカーはその中でもトップクラスのシェアを持っています。利用料金は用途によって異なり、月額数万円から数十万円と幅広い参入が可能です。国内の約1500社が既にこの技術を利用しています。以前の音…
前回のエントリではVOICEVOXをPCにインストールされたUbuntuへインストールしたという内容でしたが、今回はRaspberryPiにVOICEVOXをインストールするという内容です。ただ、RaspberryPiの運用ではモニタのないヘッドレス環境での使用の可能性もあるため、この設定ではVOICEVOXを構成する要素の1つであるVOICEVOX COREを導入し、CLIでの運用を行ってみたいと思います。 ネットで検索してもうまくいかないという話はあるのですが、成功例はなかなかないようです。自分も数日悩みましたがようやく解決できました。 【参考】 uepon.hatenadiary.com…
前から気になっていたVOICEVOXをUbuntuに入れてみました。WindowsやMacでは動くのは当然だよね~ってところで、Linuxにも正式に対応しているというのが割とすごいなという印象です。以前から気にはなっていたのですが、なかなかさわる機会がなかったので、今回少し時間ができたのでインストールしてみようと思います。 VOICEVOXの説明に関しては以下の通り ja.wikipedia.org VOICEVOXは、ヒホが開発した音声合成ソフトウェアである。 VOICEVOX で生成した音声合成を使用して自分の作品を公開する場合、クレジットを表記し利用規約に同意すれば、商用、非商用問わず無…
音楽を制作している方々に先入観なく触ってみてもらいたいですね Synthesizer Vを開発したのが、中国出身のフア カンル氏。1997年生まれで、2018年末にSynthesizer Vを発表し、2019年には日本でDreamtonicsを設立。2022年にはAHSの代表取締役兼CTO(Chief Technology Officer=最高技術責任者)に就任した。フォーブス日本版において日本から世界を変える30歳未満を選出する“30 UNDER 30 JAPAN”に選ばれるなど、音声合成分野において名実共にトップランナーと言える存在だ。インタビューから、彼の類いまれな頭脳を垣間見てほしい。…
booksch.hatenablog.com アカペラ×AI - 技術は人の声の再現にどこまで近づけるか? の実験と結果 https://note.com/books_channel/n/n98eed2ac24b7 に引き続き 人の声に焦点を当てました。今回は"アカペラ"。#SunoAI 他で何処まで引き出せるか?とさせていただきました。私が最も興味のあるトコロでもあります。近年、AI技術の発展により、アカペラ音楽の生成も可能になってきました。AIによって完璧に人の声を再現できるのでしょうか? 今回、音楽生成AI「MusicGenerationAI」主に #SunoAIを用いて 、アカペラ音楽…
「いまどこ」を実現する方法をさまざま試してきて,1ヶ月が経過した。とうとう,1つの解決法に行き着いたので報告したい。 まずこれまでの経緯から。①単独のアプリで実現する方法--断念 「Android 現在地 音声案内」といったキーワードで連日のようにアプリを検索し,それらしきアプリは片っ端からインストールして試してみた。唯一,「Lazario」というスペインのアプリが残ったが,情報の更新の頻度,情報の確度・必要性において評価できなかった。視覚障害者向けのアプリも片っ端から確認したが,筆者のニーズに合うものはなかった。②地図アプリをベースとする方法--断念 山登り向けの地図アプリに,現在の標高を定…
無料音声合成ソフトVOICEVOXを取り入れてみた VOICEVOXは誰でも簡単に音声を作成できる、無料のテキスト読み上げソフトです。 voicevox.hiroshiba.jp 動画編集に合成音声を使用しているのですが、 ずんだもんの声が可愛いなって思いましてこのソフトをインストールしてみました。 ↓↓↓こちらの動画で詳しく説明してありました。↓↓↓ youtu.be 私が参考にしたのはチャプターにもある『初期設定』の項目です。 保存、実験的機能、データ収集 このあたり設定しました。 次にこのソフトでは『声の調整』(チャプターにあります。) ができるので より自然な音声を作ることができるとい…
【2024.03.16更新】zasm(オンライン Z80用 クロスアセンブラ) 追加 【2023.12.05更新】マシン語・C言語による開発・プログラミング系アプリ、MSX BASIC向け開発アプリ 追加 【2022.07.30更新】画像作成・画像変換系アプリを別ページへ移動しました。 【2022.07.30更新】開発・プログラミング系アプリ 追加 ネットで見つけたMSX向け開発関連ツールをまとめました。嬉しいことに最近どんどん増えてきました。WebアプリでリリースされているツールはPCだけでなくスマホでも動くかもしれませんね!? 画像変換・スプライトエディタ等の画像編集ツールは別ページにてま…
今週の記事を投稿しました。今週の音声合成ソフトとキャラクターに関するニュースは、5件のニュースを取り上げました。 GUMI・がくぽ・ウナの誕生祭ライブ「Lively Paradise 2024」 #ライパラ2024 開催を目指すクラファンが発表された。開催は池袋 harevutai と 配信。支援が増えれば楽曲が増えて全18曲に 新しいAI歌唱キャラクター「凪乃ヒマワリ」を制作するプロジェクトが始まる。ネットレーベル「ゆくえレコーズ」が企画制作運営、AI歌唱エンジンに Melisma プラットフォームを使う 展示「ニコニコ動画と初音ミクのキセキ展」が熊本・グリーンランドで開催。アトラクション×…
【お知らせ①】あたらしい合成音声キャラクター「凪乃ヒマワリ(なぐのヒマワリ)」の公式Twitterを始めました!このアカウントではキャラクターに関する情報を発信していきますので、よろしくお願いいたします!🙇10分後に紹介動画を投稿するので、そちらもぜひチェックしてください👀 pic.twitter.com/caEv0Esw7U — 凪乃ヒマワリ🌻Official@5月1日クラファン (@NagnoHimawari) 2024年3月10日 キャラクター制作チームのクレジットはこちら!凪乃ヒマワリはボカロキャラによって創作活動を支えられてきたクリエイターやリスナーたちが、今度は自分がボカロキャラを…
近年、動画コンテンツの需要が急増する中、注目を集めているのが「しゃべるAIアバター動画生成」です。アバターに命を吹き込むように、自然な音声と表情で喋らせる技術は、視聴者を惹きつけ、エンゲージメントを高める効果があります。 この技術を活用すれば、 人手不足やコスト削減 専門知識やスキルなしでの動画制作 24時間365日対応可能な動画コンテンツ AI社長・AIキャスター・AI受付を制作 など、様々なメリットを得られます。 書いているのはこんな人 marcoporlo.hatenablog.com 書いているのはこんな人 AI動画生成のおすすめ3選 1. D-ID 2. HeyGen 3 Colos…
こんにちは!SmartHRプロダクトエンジニアのhimiです。 この記事ではプレースホルダーのアクセシビリティとユーザビリティについての課題と、その解決手段についての話を書きます。 プレースホルダーって何? Webアプリでよく見る、フォームコントロールに値が無いときに表示するテキストのことです。 主な用途としては、フォームの入力例や入力内容の説明テキストが設定されることが多いです。 HTML Standardでは The placeholder attribute represents a short hint (a word or short phrase) intended to aid …
今週の記事を投稿しました。今週の音声合成ソフトとキャラクターに関するニュースは、7件のニュースを取り上げました。 Nintendo Switchソフト「Fit Boxing feat. 初音ミク -ミクといっしょにエクササイズ-」が発売。書き下ろし6曲を含むボカロ曲で、ミク・リン・レン・ルカとエクササイズ 初音ミクとポケコンのコラボ「ポケモン feat. 初音ミク Project VOLTAGE 18 Types/Songs」全18曲が公開完了。sasakure.UKさんによる追加楽曲とCDアルバム制作も決定 初音ミク「マジカルミライ 2024」詳細が発表された。福岡8/17-18、幕張8/3…
VOICEVOXのソング機能対応記念で「ほぼ公式デモソング」を募集させていただきます(v´∀`)ハ(´∀`v)4月27日に動画投稿してもらえると、その動画をずんずんPJ公式サイトに掲載させていただきます(*ゝω・)ノ(動画が多い場合はランダムで切り替わるようになります)https://t.co/NjnLFfRGMW pic.twitter.com/5gGwfAFCF2 — 東北ずん子🫛ずんだもん🫛公式 (@t_zunko) 2024年3月6日 こちらのサイト、ボイボ広報さん「4月27日にみんなでの投稿企画やりたい」と伺ったのが3月3日の夜だったので、2日でつくって、本日公開させていただきました…
AIを使って楽譜から楽器音を生成する音声合成サービス『Melisma』β版リリースhttps://t.co/PDCX6LetV9このAIのために新たにレコーディングした学習データを使っており、商用利用が可能です。無料トライアルもありますので是非ご利用ください。#Melisma pic.twitter.com/tsRDJV8Vvb — Melisma 公式 (@melisma_kagura) 2023年12月8日 【お知らせ】この度 #Melisma は、ボーカルの合成に対応しました。第一弾は、合唱に最適な癖のないクリアな声質が特徴の女性歌唱音源です。併せてモデルのバージョンアップも行い、従来の…
CeVIO AI ソングボイスが存在する複数のキャラのVer.2.0およびVoiSona版が公開された。(#kzn、すずきつづみ、結月ゆかり麗、Ci flower) 音楽的同位体 裏命(RIME)TALK EXTENSION collaboration with VOICEPEAKが発売された。 VOCALOID6用ボイスバンク「式狼縁」が発表された。 SynthesizerV AI ROSA クラウドファンディングが終了した。目標金額は達成できなかったもののALL in形式でありソフトの作成は決定されている。 VOICEPEAK 商用可能ナレーターシリーズに新たな3つの話者(男性5、女性5、…
音声合成ソフトOpen JTalk 下記のURLを参考にインストールしてRaspberry pi zero 2Wで動かしてみました。 ラズパイでも動く音声合成ソフト3選(Open JTalk、VOICEVOX、VOICEPEAK) | ラズパイダ (raspida.com) まず、aptコマンドで下記のように入力してインストールします。 sudo apt install open-jtalk open-jtalk-mecab-naist-jdic hts-voice-nitech-jp-atr503-m001 インストールが完了したら、しゃべらしてみましょう。 まず、コマンドを実行するシェルス…
「マルハラ」 |画像生成と会話するAIの魅力と可能性https://note.com/chat_gpt777/n/nd998bfbeb09c 「マルハラ」ってご存知ですか?最近News23で知りました。それを見ながらそんなものかと思っていたのですが、中高年世代と若者世代の世代間ギャップで済まされない問題も含んでいるように感じました。 「マルハラ」とは、文章の最後に句点(。)を打つことに対して若者が感じる恐怖や圧を指す言葉です。この現象は「マルハラスメント」とも呼ばれ、若者が句点を感じることで怒っていると解釈したり、距離を感じたりする傾向があることが指摘されています。特に中高年世代と若者世代の間…
AIでコミックを作れるサービスが増えてきたのでまとめていきます。画像生成AIの進歩は目覚ましいです。その反面、漫画としてストーリー展開させるとなると、まだまだ大変です。しかし徐々に改善されつつあります。 AI漫画生成、おすすめは? Comic.ai Moerium Factory AI Comic Factory Lore Machine AI漫画生成、おすすめは? Comic.ai 1枚ごとに画像をAI生成し、手動でコマ割りレイアウトして漫画を作成させます。 既存の画像生成AIでは、同じキャラをポーズを変えて生成するのは案外面倒ですが、こちらのサービスでは作ったキャラクターを、いろんなポーズ…
ここはすべての夜明けまえ作者:間宮 改衣早川書房Amazonこの『ここはすべての夜明けまえ』は、第11回ハヤカワSFコンテストの特別賞を受賞したSF中篇(もしくは短めの長篇といえるかぐらい)だ。特別賞は長さが短めだったり一点突破の魅力があったりで受賞する作品が多いが(たとえば過去事例で代表的なのといえば草野原々の「最後にして最初のアイドル」など)、本作も「刺さる人にはこれ以上なく深く刺さる」、2100年代を舞台にした、問題まみれの家族の物語だ。とある理由からひらがなだらけの文章で物語が始まるので面食らうのだが、設定開示の順番は心地よく、すぐに作中世界へと入り込んでいくことができる。単行本になる…
※プロモーションを含んでいます 1. 生成AIの概要 生成AI(Generative AI)は、人工知能の一種であり、データから新しい情報やコンテンツを生成する能力を持ちます。生成AIは、ニューラルネットワークや深層学習モデルを活用して、画像、音声、テキストなどの様々な形式のデータを生成します。 2. 生成AIの応用例 画像生成: 生成AIは、写真やイラストの自動生成に活用されます。GAN(Generative Adversarial Network)などのアルゴリズムを用いて、リアルな画像やアートワークを生成することが可能です。 音声合成: テキストから自然な音声を生成する技術が進化し、音声…
Claude 3 は Toki Pona の知識があります。主の祈りを読ませてみます。