コンピュータに対し、データを元に役立つ規則などを発見させる(すなわち学習する)こと。およびその方法。
ニューラルネットワークから歴史は始まり近年は確率統計の観点から研究されることが多い。 統計の観点から見た場合、与えられたデータに対してモデルを当てはめているだけである。 モデルが複雑である点で従来の統計学と異なっている。
以下、有名な確率モデル
はじめに タイトルの通り、正規分布についての記事です。最近、ベイズフィルタやカルマンフィルター、非線形最適化などを勉強していると何かと正規分布・カイ二乗分布辺りはとても頻出で、その際の式の意味を捉える際にちゃんと分布の式の成り立ちの理解が重要である事を実感したので、備忘録も兼ねてまとめたいと思います。本記事では、まず$n$次元正規分布の確率密度関数の式を導出までまとめます。 1次元の正規分布 確率変数$Z$が平均:0で標準偏差:1の正規分布$N(0, 1^2)$に従うとき、$Z$の確率密度関数:$f(z)$は以下のように書けます。 $$ f(z) = \frac{1}{\sqrt{2\pi}}…
AIの予想結果 今回の自作AIシステムの予想は このようになりました! HOMEAWAY予想102 新潟浦和016.7%46.2%37.1% 京都福岡225.1%26.7%48.2% 湘南町田233.1%29.5%37.5% 川崎F札幌137.8%31.9%30.3% 名古屋G大阪229.1%31.1%39.8% 磐田鳥栖142.2%37.8%19.9% C大阪神戸022.3%43.8%33.9% FC東京柏232.3%23.9%43.8% 鹿島東京V139.4%31.5%29.1% 熊本横浜FC024.3%37.8%37.8% 仙台群馬149.5%29.1%21.4% いわき山口023.9%…
はじめに 本エントリーでは、カルマンフィルターで用いる観測データの一貫性チェックについて説明します。実用において観測は非常にノイジーであり、時に異常値をを含んだものとなります。そのため、外れ値をそのまま統合してしまうと状態推定が不安定になってしまう恐れがあります。そこで、毎回の更新ステップ時に得られている観測を統合すべきか否かを判断し、大きく外れた観測が得られている場合はその観測を拒否することで安定したフィルター状態を保つような仕組みが一般的に採用されています。一貫性をチェックする方法は幾つか提案がされていますが、本エントリーではその中でもひろく用いられているNormalized Innova…
こんにちは、SREグループの 水口 です。 この記事では、スタディプラスが運営する「Studyplus Engineering Podcast」の公開までに行なっているPodcastのShow Notesを作成する過程について紹介します。 Show Notesと生成AI活用のモチベーションについて Show NotesとはPodcastのエピソード内で何が起こったかを詳細にまとめたもので、一般的には以下の内容が記載されます。 トピックの要約 言及された話題に関するリンク Podcastの聴取や購読などのCTA(Call To Action / 行動喚起) また、収録・編集ツールを提供するRiv…
はじめに カルマンフィルター(1),(2)に続いて本エントリーでは、非線形なモデルに対してカルマンフィルターを用いるための方法についてまとめます。本稿で述べる内容については、線形モデルの場合のカルマンフィルターの理解を前提とします。線形モデルの場合のカルマンフィルターについては、過去にまとめておりますのでこちらも是非ご覧下さい。 biocv.hateblo.jp 具体的には、非線形モデルを線形近似する拡張カルマンフィルター(Extended Kalman FIlter : EKF)およびサンプル点を用いて分布を近似する無香カルマンフィルター(Unscented Kalman Filter:UK…
AIコード生成への過信は禁物 Qiitaに投稿しました Qiitaに「AIで生成されたコードの品質は低い」を投稿しました。 qiita.com 得られた知見など 論文の本題よりも周辺知識調べたところが面白かったです。 Googleのエンジニアが50行/日、Microsoft、Facebookのエンジニアが70行/日でスタートアップのエンジニアが860行/日だとすると人生燃やしている感じはしますね。 スタートアップだとアーキテクチャの変更が多く単にファイルの移動が多いということなのかもしれないですが。 ランキング参加中プログラミング
この記事は、量子サポートベクターマシーンを利用して、MNISTから配布されているデータベースの分類を行う方法をある程度略して説明するものです。変分量子計算の方法論は、機械学習における分類問題にも応用されています。その1つがQuantum Support Vector Machine(QSVM)です[1]。これはクラス分類問題において、評価関数に現れるカーネルを量子状態の内積で代用して、それを解くというものです。この方法において、過学習が抑えられるということが報告されています。本来ならば、実装してデータを採りたいところですが、手書き文字の認識分類をさせるだけでも画像を取り込んだ上に数字とアルファ…
LightGBMのver. 4.0.0で登場した量子化ですが、今はLightGBMも4.3.0が出て量子化についての不具合修正もすすんで安定して動くようになってきました。 論文をベースに、「どういう計算をしているのか」という理論面の概要と、実際に動かして「どれだけ計算速度や予測精度やモデルのファイルサイズが変わるのか」を見ていきたいと思います。 個人的に特に気になっているのはモデルのファイルサイズの減少です。 量子化の概要 LightGBMのような最近のGBDTで使われている決定木では、葉の出力は誤差関数の2次のテイラー近似をもとに、以下のように計算されます(このあたりはChen & Gues…
はじめに 背景 タスクランナーを導入するモチベーション パラメータ管理ツールを導入するモチベーション 実現したいこと モデルや環境に依存しないタスクによるパイプラインの操作 共通部分と環境特有部分を分離したパラメータ定義 パラメータ定義の構造化 実装方法 利用するツール パラメータファイル 構造化パラメータのマージ処理の実装 おわりに はじめに enechain データサイエンスデスク エンジニアの藤村です。 enechainでは市場活性化を目的として、機械学習や最適化アルゴリズムを用いて電力や燃料などの商品に関する指標を算出し、社内外に提供しています。本稿では、これらを算出するモデルの構築・…
はじめに 本エントリーでは、一般の多次元のカルマンフィルターについてまとめます。カルマンフィルターの概要や式の解釈については以前のエントリー「カルマンフィルター(1) - 1次元の場合」で投稿させて頂きましたので、こちらもご覧頂ければと思います。 本稿では、多次元の場合の予測モデルと更新モデルについて式の導出を行います。また、実装上課題となる数値安定性を解決するために一般的に用いられているUD分解による定式化についても捕捉します。 カルマンフィルターのモデル 1次元の場合と同様に状態遷移モデルから予測モデルと更新モデルを記述します(図1)。 図1:状態遷移モデルのグラフ 状態量:$\bf{y_…
フローベース生成モデルは、データの分布を学習し、新しいデータを生成するための機械学習モデルです。 画像生成モデルには次のようなものがありますが、その中の一つフローベース生成モデルについて解説します。 GANやVAE フローベース生成モデル 拡散モデル フローベース生成モデルについてはこちらのページを参考にさせていただきました。 lilianweng.github.io フローベース生成モデル GANやVAEと比較 フローベース生成モデル、GAN(Generative Adversarial Networks)、そしてVAE(Variational Autoencoders)は、それぞれ異なる特…
解説する論文 タイトル: Probing Multimodal LLMs as World Models for Driving 著者: Shiva Sreeram, Tsun-Hsuan Wang, Alaa Maalouf, Guy Rosman, Sertac Karaman, Daniela Rus 論文のURL: arXivリンク 発表日: 2024年5月9日 専門外の人でも分かる解説 この研究は、自動運転の分野でマルチモーダル大規模言語モデル(MLLM)を世界モデルとしてどのように活用できるかを探求しています。ここでいう「世界モデル」とは、環境の動的なシナリオを理解し、適切な行動を…
どうもー!かいなっす! 今回は1年半ほど使ったiPhone 14 Proの魅力を 今更ながら語ろかなって思います!笑 今更感は出ますが、是非是非!!! 僕が使っているのはこんな感じ↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓ iPhone 14 Pro スペック デザインの洗練 「デザインの洗練」について詳しく説明しますね。 iPhone 14 Proのデザインの洗練は、Appleが長年にわたって培ってきた美学と技術の結晶です!! 1. スリムでエレガントな外観: iPhone 14 Proは、よりスリムで洗練された外観を持っています。前モデルに比べて薄くなり、手にフィットしやすくなりました!端正なラ…
新たな技術の進化と都市化の急速な拡大により、未来の都市は大きな変革を迎えることが予想されます!その中でも、スマートシティの概念が注目されています! スマートシティの基本概念 スマートシティは、先進技術を活用して都市のインフラやサービスを効率化し、住民の生活をより快適で持続可能なものにする都市の概念です! IoT(モノのインターネット)の活用: スマートシティでは、さまざまな物理的なデバイスやセンサーがインターネットに接続され、リアルタイムでデータを収集、分析、共有します。これにより、都市の様々な側面の状態や動向を把握し、効果的な意思決定を支援します! ビッグデータとデータ分析: 収集された大量…
本日の内容 先日AppleからiPad Proとともに搭載されるApple M4が登場しましたが、今回はその具体的な仕様を見ていくことにしましょう。
コンピューティングの文脈において「Kernel カーネル」には複数の意味があるが、CUDAやGPUプログラミングに関連して使用される場合は次のような意味を持つ。 GPUプログラミングにおけるカーネル GPUプログラミングにおいて「Kernel カーネル」とは、GPU上で実行される特別な関数またはプログラムのことを指す。このカーネルは大量のデータに対して同時並列的に実行されるように設計されており、各スレッドがデータの一部を処理する形で動作する。 カーネルの特徴 並列性: カーネルは、GPUの数千から数万のスレッドで同時に実行される。これにより、同時に多くのデータポイントを処理することができ、特に…
機械学習の基礎として大学数学を学び直しています。 コーシーの平均値の定理は、平均値の定理(ラグランジュの平均値の定理)を拡張した定理です。ラグランジュの平均値の定理では f(x) と x に関する定理だったところ、x を 新たに関数 g(x) と置いても良い、という内容だと理解しています。 この x を g(x) で置き換えることのイメージが出来るように、f(x), g(x), x の全てが登場する3次元のグラフを作成しました。 TL;DR コーシーの平均値の定理を、3次元グラフで理解する X軸をx, Y軸を f(x), Z軸を g(x) と読み替えてください。 灰色の直線が に相当し、紫色の…
※本記事は、Geminiによる意訳+翻訳を活用し、レイアウト調整したものです。 ※感想は、オリジナルです。 原文 意訳+要約 ゼロショット・テキスト分類 概要 ZSTCの仕組み ZSTCの利点 ZSTCの課題 まとめ 特に重要な部分 GeminiへのQA Q:どのような用途で使われるのでしょうか? Q:ZSTCを使うにはどうすればよいでしょうか? 感想+雑記 原文 意訳+要約 ゼロショット・テキスト分類 このブログ記事では、ラベルなしデータでテキストを分類する方法であるゼロショットテキスト分類(ZSTC)について解説されています。 概要 従来のテキスト分類では、高品質なラベル付きデータが必要で…
Webスクレイピングは、情報収集やデータ解析において非常に有用な手法です。近年、新しいツールやテクニックが開発されており、より効率的なスクレイピングが可能になっています。この記事では、Webスクレイピングで活用できる最新のツールとテクニックについて紹介します。 moun45.hatenablog.com 1. ヘッドレスブラウザを使用する ヘッドレスブラウザは、ブラウザのGUIを表示せずにWebページを操作できるツールです。これにより、JavaScriptが動作するページやログインが必要なページなど、従来のスクレイピングでは難しかったサイトからの情報収集が可能になります。代表的なヘッドレスブラ…
というNBER論文が上がっている(ungated版へのリンクがある著者の一人のページ)。原題は「Identifying Monetary Policy Shocks: A Natural Language Approach」で、著者はS. Borağan Aruoba(メリーランド大)、Thomas Drechsel(同)。 以下はその要旨。 We develop a novel method for the identification of monetary policy shocks. By applying natural language processing techniques …
やあ 甘口です 機械学習って楽しいですね 改めてですが,自分の考えたモデルがいい感じの結果を吐き出した時の達成感がたまりません さて,今日もマラソンを行ったのですが,例の如く春のオーラに満ち溢れていました なんか春になるとみんなえっちな気持ちになるんですかね... なんかそんな感じの雰囲気の人たちがいっぱいいました.むしろ変態が多すぎて自分が少数派のように思えます.僕が変態なのは顔だけでそのたは正常なので. Vtuber計画ですが,一夜にして女声,ゴホン,じゃなくて,バビにく転生することができました! ということでネット上で2つの人格を手に入れたということですねー素晴らしい ネットはリアルと違…
解説する論文 タイトル: Who Wrote This? The Key to Zero-Shot LLM-Generated Text Detection Is GECScore 著者: Junchao Wu, Runzhe Zhan, Derek F. Wong, Shu Yang, Xuebo Liu, Lidia S. Chao, Min Zhang 論文のURL: arXivリンク 発表日: 2024年5月7日 専門外の人でも分かる解説 この研究は、自然言語処理の分野で、人間によって書かれたテキストと大規模言語モデル(LLM)によって生成されたテキストを区別する方法に焦点を当てていま…
AI監視カメラ業界は、IPカメラ、アナログカメラなどいくつかのセグメントに分けることができる。 世界の主要プレーヤーは、Hikvision、Dahua、Huaweiなどである。 AI監視カメラは、監視エリアの3Dモデルを更新することができます。そのため、人間や動物のような3Dの動きだけがAI監視カメラのアラートをトリガーすることができます。 ディープ・マシーン・ラーニング(深層機械学習)により、AI監視カメラは大人、子供、ペット、見知らぬ顔を時間と共に認識し、本当の危険や特定のイベントが発生した時のみユーザーに警告を発することができる。 出典二次情報源とQYResearch、2021年 QYR…
2024年5月11日に、QYResearchは「機械学習オペレーション(MLOps)―グローバル市場シェアとランキング、全体の売上と需要予測、2024~2030」の調査資料を発表しました。本レポートは、機械学習オペレーション(MLOps)の世界市場について分析し、主な売上、動向、市場規模、主要企業の市場シェアとランキングに焦点を当てています。また、地域別、国別、製品タイプ別、用途別の分析も行っています。機械学習オペレーション(MLOps)の市場規模を2019年から2030年までの売上に基づいて推計と予測しています。定量分析と定性分析の両方を提供することで、企業がビジネス成長戦略を策定し、競争環…
2024年5月11日に、QYResearchは「機械学習の運用技術―グローバル市場シェアとランキング、全体の売上と需要予測、2024~2030」の調査資料を発表しました。本レポートは、機械学習の運用技術の世界市場について分析し、主な売上、動向、市場規模、主要企業の市場シェアとランキングに焦点を当てています。また、地域別、国別、製品タイプ別、用途別の分析も行っています。機械学習の運用技術の市場規模を2019年から2030年までの売上に基づいて推計と予測しています。定量分析と定性分析の両方を提供することで、企業がビジネス成長戦略を策定し、競争環境を評価し、市場位置を分析し、機械学習の運用技術関連情…