人間が喋った声を機械が文字に直すこと。
ヒトの話す音声言語をコンピュータによって解析し、話している内容を文字データとして取り出す処理のこと。キーボードからの入力に代わる文字入力方法として注目を集めている。
音声認識に関連が深い技術として、あらかじめ記録しておいた音声パターンと比較して個人認証等をおこなう、話者認識がある。
パソコンの場合、文章を入力する用途では音声入力またはディクテーション、アプリケーションの操作は音声操作と呼ばれる。
こんにちは!こーたろーです。 昨日は、データサイエンスのオンラインイベントに参加してきました。 皆さん、いろいろな現場での悩みなどがあり、データサイエンスの位置づけとは!みたいなことで盛り上がっていました。 データサイエンスは現場あって初めて価値がでますし、データがないと何も始まらないということが言われています。 早く現場でやってみたいですね。勉強だけでは技術的に身につかない部分が多いです。特にコンサルの部分。 それでは今回も【図解速習DEEP LEARNING】やっていきます! 今日は、Googleの深層学習のアート適用プロジェクトMagenta(https://magenta.tensor…
こんにちは!こーたろーです。 Deep Learning の2021年度の学習計画をそろそろ立てようかと思っています。 いい参考書などありましたら教えて頂けると幸いです。 それでは今回も【図解速習DEEP LEARNING】やっていきます! 今日は、「mimi」というWebAPIサービスを利用していきます。 こちらは、フェアリーデバイセズ株式会社が提供しているものです。 mimiのアカウント作成 アプリケーションIDおよびクライアントIDの発行 アクセストークンの取得 音声認識を試す mimi🄬 ASR 版 mimi🄬 ASR powerd by NICT版 機械翻訳を試す 音声合成を試す
こんにちは!こーたろーです。 今日から【図解速習DEEP LEARNING】のSection11の「音を取り扱う深層学習」を行っていきます。 昔から音楽好きのため、音に関する知識は結構勉強しました。 下準備はばっちりだと思います。 本日はまず、ブラウザから日本語音声認識ができるサイトでの音声認識の体験をしてみます。 それでは早速参ります。 ブラウザから日本語音声認識を試す Microsoft Azure Speech to Text Google Cloud Speech to text
みなさーん ひとりじゃないかもー 灯かりつけて「はい」、温度上げて「はい」、テレビつけて「はい」 音ちいさく「はい」、次の曲「はい」、 何かに夢中な時は、代わりに みんなやってくれる たのめば 歌もうたってくれる たまに 、、、、、、、、、「わかりませんでした」 えっ!\(◎o◎)/! 怒った? まさかね ヒヤー😅 【セット買い】Echo Show 5 サンドストーン + Nature スマートリモコン Remo mini メディア: セット買い
どうも、かわばっちゃんです。 今回はJR西日本がAIで故障予知しようとしていることをご紹介します。 どのようなAIか 新幹線の走行音を拾って、異常を見つけるAIです。 つまり、音声認識のAI技術です。 今後どのように導入するかは分かりませんが、実験段階では線路の近くにマイクを置いて、そのマイクが新幹線が走行した時の音を拾っています。 台車という新幹線の車輪がついている部分に亀裂が入っている時の走行音と正常な時の走行音を学習させ、亀裂が入っている時に異常と判断し、係員に情報が伝達される仕組みです。 AI導入するメリットは メリットは整備員の手間の低減、乗客の利便性低下リスクの低減の2つです。 一…
今年に入り技術書典11(?)へ新刊を出そうかと原稿を書き始めたところ。原稿を書き始める場合は、個人的なセオリーとして、とにかく思いついたことをアウトプットして残すことにしている。 ということで現在は大量に文章をアウトプットしている段階な訳だが、その際に問題となるのはタイピング速度である。 文章をキーボードから入力する場合、入力速度がネックになってしまい、1日の出力上限が決まってしまう。それに加えて、タイピングによる疲れも、やはりアウトプットに影響していた。 しかし最近は、もっぱら音声入力を活用している。これは音声認識の変換速度や認識率の向上が著しく、かなり使えるモノになっている、というのが大き…
文章をもっと早く入力したくて、スマホに搭載されている音声入力なるものに挑戦してみました。ちなみに私が使っているのはiPhone11です。 使い方 実際使ってみての感想 LINEで使って大失敗 まとめ 使い方 読んで字の如く、音声入力とはスマホに話しかけることによって入力する方法です。 私の使っているキーボードの場合、以下のように右下にあるマイクマークを押し、話し始めると入力が始まります。 複雑な設定などもいらないので、気軽に挑戦できるところも魅力的です。 実際使ってみての感想 これがかなり便利で慣れてくるとサクサク文章が書けます。はっきりゆっくりと発音しなければ認識してくれないんだろうなぁと想…
半年ほど前(2020年7月9日)に報告した、ラズパイ(ラズベリーパイ)を使って作った「声で運転する」装置です。その後、興味が別のことに移って、放ったらかしになっていました。 ラズパイや、ブレッドボードが、つないであって、そこにマイクやスピーカー、2種類の電源、線路への出力など、ごちゃごちゃした状態でした。このままでは、持ち運ぶのも使うのにも不便でした。 今回思い立って、電源などの直接つないであるところを、ジャックで取り外し式にして箱に入れました。少し大きいし透明で中が見えるのですが、それでもいいとしました。透明なのは工作しやすいという利点もあります。 写真はセットしたところですが、半年も経って…
どうも、かわばっちゃんです。 今回は日立製作所が工場での設備診断にAIを導入した事例を紹介します。 何にAIを導入したのか 工場でのセンサーで収集した音響データを解析するシステムにAIを導入しました。 工場での様々な音を収集する中で、製品不良が発生したり、設備の故障があったりした時の異常音を検知するAIです。 音声認識技術としての導入です。 製品を作る設備の稼働音や、加工音などから、対象となる検査音だけを抽出し、音の異常度を算出することで、検知することができます。 なぜAIを導入したのか 安定した製品品質を維持することや、遠隔での設備監視を可能にするためです。 工場での検査や点検の自動化や省人…
奥さんが自分のメディアを持っていて日々サステナビリティや育児について発信しており、その一環で色々な方にインタビューをしています。 www.misamisaz.com インタビューページ インタビューは録音した音源をもとに対話形式で書き起こすわけなのですが、これが毎回結構な手間らしい。既存のサービスもいくつかあるのですが、それなりにお金がかかる*1とわかりました。 で、ちょっと調べてみたところGoogle Cloud APIの一つであるSpeech To Textが使えそうだとわかったので、簡単なツールを作ってみることにしました。 実装 Speech To Textの導入 句読点 話者の切り分け…
よってらっしゃい、みてらっしゃい!!! 第76話のはじまりはじまりぃぃぃぃぃ!!! 最近、うちにクローバというスマートスピーカーがきました☆ CLOVA Desk ホワイト メディア: エレクトロニクス ⇑うちが買った物です これかわいいけど、、、個人的にはなんか見た目びみょ~です💦 ドラえもん AIスピーカー Clova Friens mini 音声認識技術とAI(人口機能)を用いて 音声による命令や指示、話しかけなどに 日本語で反応してくれ 音楽再生や他の機器のリモート操作などを 音声で指示することができ、動いてくれるスピーカーです🤩 YouTubeや一部機能に関しては 自分でタッチし動か…
前回、ユニフォアの製品についての説明を書きました。 各製品の機能がわからない場合は、ひとつ前のブログエントリを参照して下さい。 これら製品をどのようにコンタクトセンターへ適用していくべきでしょうか? ここでは、会話型サービス自動化プラットフォームをコンタクトセンターへ適用するにあたって、成熟度モデルという考え方を引用し、提案していきたいと思います。 CSA 成熟度モデル 各製品をコンタクトセンターへ適用する際、コンタクトセンターへの業務影響が少ない順番に適用していきます(順番は図の通りになります)。これは、AIによる学習プロセスをより効率的に行う為の道筋でもあります。 コンタクトセンターによっ…
サブタイトル:ハロウィンなんだし、おじさんも鬼殺隊に入って「全集中」したいんじゃ! 先日書いたエントリーの続きになります。前回のエントリでは、SnowboyをRaspberryPi上から動作設定を行うというものでしたが、今回はHotwordの音声認識を自分好みのものに変更してみようと思います。これで、自由な呼びかけができるようになります。 参考 uepon.hatenadiary.com
今回は、以前のエントリでも挑戦してみたいと思っていた、音声のホットワードを検知するSnowboyをインストールして、トリガー検知を行ってみたいと思います。 使用するSnowboyは以下のような説明になっていました。 Snowboy is an highly customizable hotword detection engine that is embedded real-time and is always listening (even when off-line) compatible with Raspberry Pi, (Ubuntu) Linux, and Mac OS X. 日…
Baplisca(@sooooouls) です。 先日、技育展で「ボイストラベラー」という音声認識と周波数取得を組合せた世界初のゲームを紹介しました。 内容や感想はこちらの記事で書きました。 baplisca.hatenablog.com ボイストラベラー アイコン ゲーム内では、音声認識をするパートと周波数取得するパートに別れています。 この2つの機能をどの様に実装したか書いていきます。 はじめに ゲームを作ってから結構時間が経っており、あいまいなところがあると思うので注意してください。 よって適宜調べながら、補完するのを推奨します。 それと、Unityの基礎的な話はここでは書きません。 技…
裏はこないだ勝ったんですけどねぇ、ちょっとぼくには裏を周回するのは無理なので、素直に表を回ってプラス集めしています。 魔廊の支配者 パーティ編成 セイナ@ウスイ武器 バレンタインソニア@火ネイ武器 クリスマスグレモリー@レムゥ武器 オウキチャン@ツクヨミカグヤ武器 アルラトゥ@ナコジャ武器 フレンドセイナ@猗窩座武器 攻略 1階:かばんちゃん 2階:木曜ダンジョン絶壊滅級 3階:ルーレットor暗闇落下、天使と悪魔の極端な2択。 4階:リストラされたリット軍団 5階:おーがぱんち。 6階:トイざら・・・トイドラゴンズ 7階:デバフギミックのお徳用パック 8階:忍者 前半戦終了 後半戦 ボス とい…
9周年記念でわんさか新情報が来た上、生放送で言ってなかった情報なんかも公式サイトでしれっと出てたりして、新情報把握すんの大変ですよね。 ぼくはそんなもの見向きもせず、魔廊と裏修羅を周回しています。 ※ 「裏修羅」=「裏・魔門の守護者」 撫子パ・裏修羅攻略編成 パーティ編成 フレ撫子@暗闇スキブ武器 マギー@シンモラのカード 木メノア@アルジェ武器 カエデさん@金時武器 ダークリーリア@風神の鍵 撫子@探偵のカード 攻略メモ 開幕~3階突破 4階ギア階~6階デネパジャマ 7階まけないたまぁ~9階お邪魔ギミック詰め合わせパック 10階ナナロク対策ゾーン~12階トトあんどソティス 13階、カラドボル…
Amazonの有料サービスは基本無料1ヶ月のお試し期間ですが、1ヶ月後に自動更新され有料会員に自動登録されるサービスがほとんどです。必ず登録する際にポップが表示され無料から設定の変更がなければ自動で有料サービスに移行するので気をつけてくださいね。ほとんどは登録時に自動更新の設定変更が可能です。継続終了にし忘れた場合は、Amazonのアカウントサービスからメールメールマガジン&その他の設定→メンバーシップおよび購読から現在登録されている有料サービスが確認できます。また、そこから設定の変更もできます。Fire TV Cube - 4K・HDR対応、Alexa対応音声認識リモコン付属 | ストリーミ…
DT-01とスマートフォンの音声認識機能 DT-01とOK Google起動 GoogleアシスタントとDT-01の相性 結局タッチパネル操作の改良に落ち着く Bluetoothインカム デイトナ DT-01 と Android端末との接続 在庫有当日発送 98913 デイトナ DT-01 BLUETOOTH INTERCOM 1個セット 価格:20,790円(2021/2/23 16:47時点)感想(2件) DT-01とスマートフォンの音声認識機能 Bluetoothインカムを購入した多く人はスマホと接続して、ナビに使いたいと考えると思います。で、実際やってみてグローブをした指でのスマホ操作…
なんと当たりがでませんでした!!1000円1枚 200円が10枚合計3000円残念また買ってみます。 たまにこういうのも入れて行きたいとおもいます。新登場 Fire TV Stick - Alexa対応音声認識リモコン付属 | ストリーミングメディアプレーヤー発売日: 2020/09/30メディア: エレクトロニクスMementononocアニメ¥255provided courtesy of iTunes
この手順はFire TV Stick のみで完結できる手順で、NASやPCの共有フォルダなんかは使わないです。 Amazonの便利ガジェット Fire TV StickにKodi19.0を導入する方法です。 Fire TV Stick - Alexa対応音声認識リモコン付属発売日: 2019/01/23メディア: エレクトロニクス Fire TV Stick にKodi 19.0を導入してISOファイルも再生できるDLNAクライアント?ネットワークメディアプレイヤー?化したので、手順をまとめた。 当然 Fire TV Stick 4Kでも同様の手順で導入できる。 Fire TV Stick 4…
www.youtube.com アンブレラがおくる対話ゲーム・ピカチュウげんきでちゅうより、 小畑幹作曲、『うみのむこう』。スオウかいがんとスオウじまで流れます。
オッス!オラ吐瀉夫! 普段、AmazonのFire TV Stickでネトフリ、アマプラ、dアニメ、AbemaTVなどを満喫してるエンタメ中毒者! そんな毎日お世話になっているFire TV Stickは我が家では2代目。 2018年に第二世代のFireTV Stickを購入した当初は第1世代のCPU(2コア)から第2世代のCPU(4コアで処理速度も向上)に驚きましたよええ…。 しかしながら、アプリケーンションも便利になり、様々な機能が追加されたり、本体の劣化なのか最近は時折動作が重いなーと感じてて。 そう思い、買い替えを考え始めた2021年1月の中頃。 初売りでFire TV Stickが4…
もう一年以上前の話になる。Nintendo Switch Onlineに加入したら、スイッチにYouTube on TVをダウンロードできた。 テレビでYouTubeを見ることができるようになった。 大画面でのYouTubeは楽しい。 自分としては、それだけでも加入してオーケー。 年間4,500円だが、スイッチ購入した時の3,000円クーポンがあるし、子どもたちに1,000円ずつお年玉から負担させた。 それで負担は無し。 大画面テレビでプレミアリーグのハイライトを見たら楽しい。 サッカーだけじゃない、Bloombergのライブニュースなども垂れ流すと英語のヒアリングに良さそうだ。 TED Ta…
AmazonプライムをやめてU-NEXTにしたら楽しすぎた 今私が主に使っている動画サブスクリプションサービスは U-NEXTです。 31日の無料期間があるのですが、すでに有料会員に突入しています。 1,990円(税込2,189円)の月額と、決して安くはありませんが、結論、満足しています。 その理由を説明したいと思います。 AmazonプライムをやめてU-NEXTにしたら楽しすぎた 見放題作品の豊富なラインナップ 雑誌読み放題 その他♡の豊富なラインナップ 月1200円分のポイント 31日間の無料期間 ビッグローブモバイルのエンタメフリーで見放題
AIボイスレコーダー「AutoMemo(オートメモ)」(ソースネクスト)の自動文字起こしの精度を高めるアイテムを、2000円台で入手しましたので、本日はそれを使って、自動文字起こしでブログを書きたいと思います。 ※以下の文章は、AIボイスレコーダー「AutoMemo」を使った音声認識によって書きました。録音データから自動的に文字起こしされたものを、なるべくそのまま載せています。ただ、読みやすいように句読点と改行と、「」などを加えています。 オートメモ の精度を高めるアイテムとは? ワイヤレスマイクの使い方と注意点 【性能紹介】フル充電で5〜6時間使用できる 【まとめ】文字起こし精度アップ、使え…
はじめに 前回、リップシンクするプラグインを作り直してみた記事を書きました。 tips.hecomi.com 色々とご反響を頂いたのですが、しかしながら母音推定の性能がいまいちでした。第 1 、第 2 フォルマントという周波数スペクトルの 1 つ目、2 つ目のピークを検出する方法を採用していたのですが、このピークの検出が周波数スペクトル包絡を得るために使っている LPC 解析のパラメタに大きく依存したり、またノイズや声の高さによって容易にピークが別の場所に移ってしまったりといったことが原因でした。 そこで手法を変え、MFCC(メル周波数ケプストラム係数)を求める方式へと変更しました。 spee…
ねんどろいどW やっと届きました(2020年7月注文) あけましておめでとうございます ようやく書く隙を見つけました 近況報告になります スマホゲーム アークナイツ ブルーアーカイブ アニメ 呪術廻戦 アズールレーン びそくぜんしんっ! 買い物 スピンバイク ELECOM Bluetoothハンディトラックボール SwitchBot スープセット 粉歯みがき 入浴剤 スマホゲーム アークナイツ 終了1時間半前に到達した限界 危機契約#2 お疲れさまでした 自分なりに出し切ったなーという感じで若干燃え尽き気味です 現在は新イベントが始まったところで ローグライクに嵌ってぽっちぽちやってます yo…
コンペのロゴはこんな感じでした 2/18までKaggleで行われていたRainforest Connection Species Audio Detectionに参加してました。 それに取り組む中で勉強した事を備忘として記録していきたいと思います。
破滅の純情ワルキューレアニメ¥255provided courtesy of iTunesFire TV Stick 4K - Alexa対応音声認識リモコン付属 | ストリーミングメディアプレーヤー発売日: 2018/12/12メディア: エレクトロニクス まずはAmazonのアカウントについて少しお話させていただきたいと思います。 Amazonのアカウントを作成する方法は大きく簡単に分けると2つです。アプリから携帯電話番号でアカウントを作成するか、PCサイト、モバイルサイトからメールアドレスでアカウントを作成する場合です。