コンピュータに対し、データを元に役立つ規則などを発見させる(すなわち学習する)こと。およびその方法。
ニューラルネットワークから歴史は始まり近年は確率統計の観点から研究されることが多い。 統計の観点から見た場合、与えられたデータに対してモデルを当てはめているだけである。 モデルが複雑である点で従来の統計学と異なっている。
以下、有名な確率モデル
はじめに カルマンフィルター(1),(2)に続いて本エントリーでは、非線形なモデルに対してカルマンフィルターを用いるための方法についてまとめます。本稿で述べる内容については、線形モデルの場合のカルマンフィルターの理解を前提とします。線形モデルの場合のカルマンフィルターについては、過去にまとめておりますのでこちらも是非ご覧下さい。 biocv.hateblo.jp 具体的には、非線形モデルを線形近似する拡張カルマンフィルター(Extended Kalman FIlter : EKF)およびサンプル点を用いて分布を近似する無香カルマンフィルター(Unscented Kalman Filter:UK…
AIコード生成への過信は禁物 Qiitaに投稿しました Qiitaに「AIで生成されたコードの品質は低い」を投稿しました。 qiita.com 得られた知見など 論文の本題よりも周辺知識調べたところが面白かったです。 Googleのエンジニアが50行/日、Microsoft、Facebookのエンジニアが70行/日でスタートアップのエンジニアが860行/日だとすると人生燃やしている感じはしますね。 スタートアップだとアーキテクチャの変更が多く単にファイルの移動が多いということなのかもしれないですが。 ランキング参加中プログラミング
この記事は、量子サポートベクターマシーンを利用して、MNISTから配布されているデータベースの分類を行う方法をある程度略して説明するものです。変分量子計算の方法論は、機械学習における分類問題にも応用されています。その1つがQuantum Support Vector Machine(QSVM)です[1]。これはクラス分類問題において、評価関数に現れるカーネルを量子状態の内積で代用して、それを解くというものです。この方法において、過学習が抑えられるということが報告されています。本来ならば、実装してデータを採りたいところですが、手書き文字の認識分類をさせるだけでも画像を取り込んだ上に数字とアルファ…
LightGBMのver. 4.0.0で登場した量子化ですが、今はLightGBMも4.3.0が出て量子化についての不具合修正もすすんで安定して動くようになってきました。 論文をベースに、「どういう計算をしているのか」という理論面の概要と、実際に動かして「どれだけ計算速度や予測精度やモデルのファイルサイズが変わるのか」を見ていきたいと思います。 個人的に特に気になっているのはモデルのファイルサイズの減少です。 量子化の概要 LightGBMのような最近のGBDTで使われている決定木では、葉の出力は誤差関数の2次のテイラー近似をもとに、以下のように計算されます(このあたりはChen & Gues…
はじめに 本エントリーでは、一般の多次元のカルマンフィルターについてまとめます。カルマンフィルターの概要や式の解釈については以前のエントリー「カルマンフィルター(1) - 1次元の場合」で投稿させて頂きましたので、こちらもご覧頂ければと思います。 本稿では、多次元の場合の予測モデルと更新モデルについて式の導出を行います。また、実装上課題となる数値安定性を解決するために一般的に用いられているUD分解による定式化についても捕捉します。 カルマンフィルターのモデル 1次元の場合と同様に状態遷移モデルから予測モデルと更新モデルを記述します(図1)。 図1:状態遷移モデルのグラフ 状態量:$\bf{y_…
はじめに 以前のエントリーにて2変数正規分布の場合の条件付き分布について期待値と分散の導出を行いました。式の変形において特別な知識を要さないので、条件付き分布についての理解をまず2変数の場合で式展開を追いながらつかんでもらうのがよいかと思います。 biocv.hateblo.jp 本記事ではより一般的な多変数の場合の条件付き分布について期待値と分散の導出を行います。途中、式の変形にてブロック行列の逆行列の知識を用います。式の展開については、以下のQiitaの投稿を参考にさせて頂きました。 qiita.com 導出 任意の次元 $n \in N$の確率変数$X$が平均:$\mu$、分散:$\Si…
この記事について バックグラウンド 本業はTypeScriptを主に書いているWebエンジニアで社会人5年目。副業ではデータサイエンティスト/機械学習エンジニアをやっていてこちらも5年目。 この記事を書いた理由 最近読んだ「科学的根拠に基づく最高の勉強法」という本の中に、「思い出す頻度が高ければ高いほど定着する」という話があった。 なので、読んだ本の内容を思い出し定着させるきっかけとするためにこの記事を書いている。 科学的根拠に基づく最高の勉強法作者:安川 康介KADOKAWAAmazon 紹介する本のラインナップについて 統計や機械学習の理論をガチガチにするのは難しいと判断して、理論寄りの書…
前回の記事で、「安全は創発性であり、創発性は要素の知識からは演繹されえない」、「演繹できないような問題に対するエンジニアリングは難しい」ということを書いた。 それを書きながら、AI(機械学習)のことを連想した。 機械学習の品質確認の難しさ 機械学習を「帰納的プログラミング」、従来のプログラム開発を「演繹的プログラミング」とする対比がよくされる。 「機械学習工学に向けて」(丸山宏, 日本ソフトウェア科学会第34回大会)では、摂氏を華氏に変換するプログラムを例にとり、以下のような分かりやすい対比を示している。 演繹的プログラミング: "F = 1.8 x C + 32" という変換式(先験的知識)…
はじめに 初めまして、ecbeingのふっきーです。 配属当初よりマイクロサービス開発統括部のAiReco(アイレコ、旧:LightningRecommend)チームに所属しており、4月で3年目となりました。 AiRecoとは、ecbeingが提供するレコメンドツールです。 サービス名称にもついているようにAiRecoではAIを活用しており、AIがお客様に合う最適な商品を提案してくれます! 今回はそんなAiRecoのご紹介と、レコメンドの仕組みを簡単に説明したいと思います。 目次 はじめに 目次 ECサイトにおけるレコメンドとは AiRecoについて レコメンドタイプ オプション 仕組み デー…
Hugging Faceの数学モデルを使おうとしたら以下のエラーに見舞われました。OSError: open-math-mistral is not a local folder and is not a valid model identifier listed on 'https://huggingface.co/models' If this is a private repository, make sure to pass a token having permission to this repo either by logging in with `huggingface-cli…
10連休が終わってしまう。 悲しい。 休みの間にやったことを記録しておく。 ・ホットヨガ2回 ホットヨガに通い始めてからなのか、体調を崩しやすくなったと思う。やめようかな。 ・実家帰省 生理でほぼ寝たきり。 ・友人と買い物 デート服を買おう、といいつつ、普段と違う可愛い感じの服を見せると、「似合わない」と却下されて終わった。なんだったんだろ。今まで購入したことがないRADYAZELやMISCH MASCHに入ってみたのだけど、全くダメだった。 ・微分積分の勉強 ちょっと飽きてきた。まだ微分しかやっていないけど、微分方程式の勉強に移ろうか悩む。そういえば、微積の単位はちゃんと取れているので、やら…
こちらです。受けようと思います。www.datascientist.or.jp 自分にとっての受ける意味・目的 データ分析や機械学習に関するスキルを体系的に習得し、専門知識を証明するため。 と、かっこよく書くとそのような感じですが、G検定(2024年3月取得)の学習で「Di-Lite」なるものが出てきたので、なんかその響きのかっこよさに憧れたため、が真の理由です。 www.dilite.jp 今の会社はAI領域に遅れがあります。 データサイエンティストと称する担当者もいますが、学術的領域の深耕が中心のため、自部署の領域である生産工程の改革につなげるため、諸々動いていきたいと考えています。 AI…
シラバスを眺めてみました。変更点が赤字で書いてあるものをみて、赤字のキーワードを調べてみました。 https://www.ipa.go.jp/shiken/syllabus/nq6ept00000014dv-att/syllabus_fe_ver9_0_henkou.pdf ・AI技術 ちまたで言われているAIとは何なのかについて考えてみます。だいたいの場合は、ChatGPTをイメージしてAIと言っているといっても過言ではないでしょう。 単に、知識データを機械に学習させて対応するには限界があり、単に知識を詰め込むだけでなく、いろいろな物事を判断できるように、出力を意識して入力を行う。こういうモ…
岡崎市でおすすめのマンション売却業者は? 1.センチュリー21不動産売却センター 700店舗を超える全国ネットワークを活用し、幅広い顧客層にアプローチ。 競争入札を促進し、より多くの買主候補から高値のオファーを獲得。 独自のマーケティング戦略で、お客様の物件の魅力を最大限にアピール。 過去の実績に基づき、適切な価格設定を提案。築10年の中古マンションを、希望価格よりも100万円高く売却。 経験豊富なスタッフが、お客様の物件に最適な販売方法を提案。 独自のネットワークを活用し、早期に買主候補を見つけ出す。 オープンハウスやインターネット広告などを積極的に活用し、多くの買主候補に物件を 毎週末に開…
AIマーケティングの活用は、現代のデジタル化社会においてますます重要性を増しています。AIマーケティングは、AI技術を活用して消費者の行動パターンや嗜好を分析し、より効果的な広告やキャンペーンを展開する手法です。これまでマーケティングの分野で培われた経験や知識だけでは到達できなかった情報やインサイトを提供し、ビジネスの成果を最大化することができます。この記事では、まずAIマーケティングとは何かについて解説します。その後、AIマーケティングの進化について触れ、中級者が知らない驚きのAIマーケティングテクニックについても紹介します。また、AIマーケティングの秘密武器となる要素にも着目し、その将来性…
はじめに 『トピックモデル』(MLPシリーズ)の勉強会資料のまとめです。各種モデルやアルゴリズムを「数式」と「プログラム」を用いて解説します。 本の補助として読んでください。 この記事では、ユニグラムモデルにおける経験ベイズ推定(ハイパーパラメータ推定)の数式の行間を埋めます。 【前節の内容】 www.anarchive-beta.com 【他の節の内容】 www.anarchive-beta.com 【この節の内容】 はじめに 2.7 ユニグラムモデルの経験ベイズ推定の導出:多様なハイパーパラメータの場合 経験ベイズ解の設定 不動点反復法の更新式の導出 参考書籍 おわりに 2.7 ユニグラム…
以前,何処かのインターネット上の記事で読んだのだが,一日に起こった悪かった事は一切記録せず,一日に起こった良かった事を,最低3つ意地でも見つけ,日記等に記録する日課を継続すると,精神状態の改善を図る事が出来るという.「一体,何を根拠にそんな事を言っているんだ?」と思う方も多かったのかもしれない記事だったのかもしれないが,私は,合理性を感じた.その科学的根拠を,以下に何点か提示しよう.・根拠1人間は認知科学的に言語化されていない事を認識出来ないと言う.上記は,トンデモ科学者としてネット上では有名な,苫米地英人大先生の受け売りだが,これは,個人的には非常に頷ける話だ.(※私は彼の事,結構好きですよ…
2024年5月5日読了 「虐殺器官」と「探偵はバーにいる」を読み終えた長男に、“あまり母親が渡す本ではなかったね“と話したら、“そうだね“とニヤリ。それでは、と次は穏便に“アルジャーノンに花束を」をわたしたところ、“途中まで読んでるけど、あまり面白くない“という。“後半が面白いから“と薦めながらも、とはいえいずれも現代の作品ではないなと反省し、書店の店頭で見つけたのが安野貴博「サーキット・スイッチャー」(ハヤカワJA)。長男に渡す前にと読み始めたら、めちゃくちゃ面白くて一晩で一気読み。 自動運転・AI・機械学習・Youtubeなどというまさにイマドキの技術に加えて、社会的なテーマ、魅力的な登場…
巷で話題の生成 AI を使ってみました。 今ではチャットや検索の様に気軽に使えるようになっています。 でも私が使うと日本語変換の誤変換の様に思った回答が得られません。 試しにある水栓の違いを聞いてみた結果を紹介します。 期待した結果にはなりませんでしたが、生成 AI なりのがんばりが見えてきます。
TCP/IP技術入門 ——プロトコルスタックの基礎×実装[HTTP/3, QUIC, モバイル, Wi-Fi, IoT] Tech × Books plus 作者:中山 悠,丸田 一輝 技術評論社 Amazon TCP/IP&ネットワークコマンド入門 ──プロトコルとインターネット、基本の力[Linux/Windows/macOS対応] Tech × Books plus 作者:西村 めぐみ 技術評論社 Amazon データモデリングでドメインを駆動する──分散/疎結合な基幹系システムに向けて 作者:杉本 啓 技術評論社 Amazon WEB+DB PRESS総集編[Vol.1~136] (W…
※本記事は、Geminiによる意訳+翻訳を活用し、レイアウト調整したものです。 ※感想は、オリジナルです。 原文 意訳+要約 革新的プロジェクトに機械学習を活用: 解き放たれる可能性 機械学習とは? 機械学習の利点 機械学習の活用例 まとめ GeminiへのQA Q:機械学習のスキルは、どうやって身につければいいですか? Q:Javaで機械学習はできますか? 感想+雑記 原文 Harnessing Machine Learning for Innovative Projects: The Potential Unleashed - DEV Community 意訳+要約 革新的プロジェクトに機…
AMD の Instinct MI300A APU は、従来のディスクリート GPU と比較して、HPC ワークロードのパフォーマンスを大幅に向上させる革新的な設計です。CPUとGPUを単一パッケージに統合することで、データ転送のボトルネックを排除し、電力効率を向上させます。 主要な特徴: CDNA 3 GPU アーキテクチャ 最大 24 個の Zen 4 CPU コア 最大 192 GB の HBM3 メモリ 5nm および 6nm プロセスで製造された最大 8 個のチップレットと 8 個のメモリスタック ユニファイドメモリアーキテクチャ 性能: OpenFOAM ベンチマークで、NVIDI…
2024年第1四半期の決算において、アマゾンはその歴史の中で特に注目すべき成果を挙げました。そして米国の企業で5社目となる時価総額2兆ドル以上の”2兆ドルクラブ”入りとなりそうです。 クラウド部門、特にAmazon Web Services(AWS)が驚異的な成長を遂げ、過去1年間で最も力強い売上高の伸びを記録しました。この成長は、企業が人工知能(AI)サービスを含む技術プロジェクトへの投資を再開したことによるもので、アマゾンにとって最も収益性の高い部門の一つが、これにより見事な回復を遂げたのです。 この四半期の成功は、AI技術とクラウドサービスの融合がもたらす新たな可能性を示唆しています。A…
sshを使ってリモートのサーバー上で開発を行っているとします。このとき、基本的にはほとんど全てのこと(コンパイルや機械学習など計算を伴うものや、ファイル操作など)はsshで入った先のリモート上(ターミナル、あるいはVS CodeならRemote SSH拡張機能)で行えばいいのですが、ファイルの一覧・リネーム(移動)などはlsやmvを手打ちするよりも視覚的にわかりやすい手元のファイルマネージャーでやりたいという需要があります。 そこで使われるのがrclone・sshfsなどのリモートのディレクトリをマウントしてくれるソフトウェアです。なおsshfsは開発終了になってしまったようなので現在はrcl…