近似解を求める計算手法の1つ. 乱数を用いるシミュレーションを使う →マルコフ連鎖モンテカルロ
趣旨 ハミルトニアンモンテカルロ法(HMC)を理解する(執筆当時ではまだ理解できてないけど)。 注意 物理ど素人なので完全には理解できてない。情報の正確性には注意。 理解してないなら「理解する」とか書くなよ うるせーよ では解説する。 HMCとは Metropolis-Hastingsに代表されるこれまでのMCMCでは、あらかじめ与えられた初期値と初期提案分布からスタートし、棄却したりしなかったりしながらサンプリングを行うわけだが、提案分布が目的の分布と大きく外れていれば酷い出来になる。これを軽減するためにランダムウォークMetropolis-Hastingsがあるらしいのだが、あんまり探索的…
はじめに DLC後編 藍の円盤にて(アローラ)ナッシーが解禁されました。 このポケモンは「とおせんぼう」と「ねをはる」を覚えるため、吹き飛ばし持ちのディンルーやカバルドンさえもキャッチしてTODできます。 周知のとおりチオンジェンでも同じことができます。 さて、初手の起点作成ポケモンとしてはキラフロルも有名ですね。 チオンジェンは特防が高く、毒テラス+バークアウトで容易にTODできます。しかしながら、(アローラ)ナッシーの種族値はH95D75と高いとはいえず、残飯+根をはる+守るでは受けきれません。 そこで、夢特性の収穫を使って耐久したいところですが、 相手の攻撃の追加効果や急所に加えて、50…
強化学習とは 強化学習の基本要素 エージェント(Agent) 環境(Environment) 状態(State) 観測(Observation) 行動(Action) 報酬(Reward) 学習プロセス 価値(Value) 方策(Policy) 推論プロセス まとめ 強化学習とは 強化学習とは、機械学習の一つで、エージェントが環境とやり取りしながら報酬を最大化するための適切な行動を学習する仕組みです。 自動運転自動車の例を交えながら、全体像を捉えるために、強化学習の基本的な概念と学習プロセスを簡単に説明します。 強化学習の基本要素 エージェント(Agent) 自動運転車(自動運転制御システム)…
A Tour of Goを履修しました。練習として、モンテカルロ法で円周率を求めるシミュレーションをGoで実装したので、それをご紹介します。 モンテカルロ法による円周率の導出 シミュレーション 開発環境 サンプルプログラム 解説 おわりに 参考文献 モンテカルロ法による円周率の導出 モンテカルロ法というと難しい印象を受けるかもしれませんが、やりたいことは「乱数を使って点をばらまき、円の中にある点を数える」だけです。 いったん、円の面積を求める公式を振り返ります。 が円の面積、が円の半径、が円周率です。小学校では「円の面積=半径×半径×3.14」と習いますね。1 ここでは後述するシミュレーション…
ChatGPTにお願いするとプログラムを生成してくれるというので試してみました。なお、プログラミング言語としてはWScript *1 を指定しました。 ChatGPT が生成した円周率を計算するプログラム もう一度同じ質問を投げてみた 言い回しを変えて質問を投げてみた さらに言い回しを変えてみた 別のスクリプト言語を指定してみた アバウトな要望をしてみた Leibnizの公式を指定してみた Math.pow関数の使用を指定してみた ChatGPT による回答の画面キャプチャ 感想 脚注・コメント ChatGPT が生成した円周率を計算するプログラム"円周率を計算するWscriptを教えてくださ…
強化学習の観点 何を学習するか 状態や行動の価値を学習: Valueベース 戦略を学習: Policyベース 学習に使う環境をモデル化できるか できる: モデルベース できない: モデルフリー 学習に用いる実績情報はなにか 報酬のみから学習: モンテカルロ法 報酬と見積った価値から学習: TD法 価値を見積もる際に戦略を考慮するか する: On-Policy しない: Off-Policy 主要な手法をこれらの観点で分類するとこんな感じ Value/Policyベース モデルベース/フリー モンテカルロ/TD法 On/Off-Policy Value Iteration Value モデルベー…
円周率πと聞くと、多くの人は「無理数」であることや「円の直径に対する円周の長さの比率」と思いつくかもしれません。 しかし、その円周率を求める方法を知っている人は少ないのではないでしょうか? その答えは…ラマヌジャンの公式? 1π=√8992∞∑n=0(4n)!(4nn!)41103+26390n994n いいえ、点を書くだけです。 点を書く… 点を書くとはいっても紙にランダムに点を書いても意味がないので、その方法を伝授いたしましょう。 ↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓ ①一辺2r2rの正方形の中にぴったり入る半径rrの円を用意します。 ②この正方形の中に、ランダムに点を打ってい…
イアン・スチュアート 著 徳田 功 訳 「不確実性を飼いならす」メモ 不確実性を飼いならす——予測不能な世界を読み解く科学 作者:イアン・スチュアート 白揚社 Amazon 「不確実性を飼いならす」を読み終えた。 本を購入したときは、どんな内容の本なのか良くわかっていなかった。確率論や統計論からはじまり、非線型力学(カオス)、量子力学まで、不確実性に対処するために人間たちが生み出してきた方法(科学)を解説していた。 印象に残ったのは、15章の「量子の不確定性」で、決定論に基づく隠れた変数理論が、不気味な遠隔作用(互いに遠方にある二粒子からなる系で、一方の測定が他方に瞬時に(光速を越えて)影響を…
モンテカルロ法で『円周率π』の近似値を、サンプル数100~10,000で求める。 サンプル数100、1,000、10,000の分布図を円内と円外の点の色を変えて作成すると、サンプル数が多いほど半径1の円弧が分かりやすい。 サンプル数が多い方が、『円周率π』と近似値との誤差が小さくなる傾向がある。サンプル数が1,000を超えると誤差が小さくなり始めて、7,000を超えると通常使う3.14に限りなく近付いていく。モンテカルロ法の第一歩である『円周率π』の近似値の動きが分かりやすい結果となる。
モンテカルロ法で『円周率π』の近似値を求める。 円の面積の公式は『半径×半径×π』で、半径1の面積は『1×1×π』でπとなる。1辺の長さが1の正方形の中には半径1の円の4分の1が置ける。 故に、円の面積は『π/4』となる。 2つの乱数(x座標、y座標)で不規則に正方形の内に点を置いて、円の内部にある点の割合から円の面積を求める。不規則に点を置いていき、円の中に入るか入らないかで円周率πを求める。『円の内にある点の数(m)』が『全部の点の数(n)』の割合が円の面積と考える。円の内にある点かどうかは、原点からの距離が1未満を満たすかどうかで判断できる。 従って、円の面積と円の内にある点の比率から『…
アナニヨ・バッタチャリヤ 訳・松井信彦 みすず書房 2023.9.19読書日:2024.3.21 ハンガリー出身の数学の天才で、数学の力を量子力学、コンピューター、ゲーム理論、AIなど、純粋数学の枠を越えて貢献し、手がけた分野のすべてがその後大きく発展して、いまだに現代に大きな影響を及ぼして、未来から来た男と呼ばれたジョン・フォン・ノイマン(1903ー1957年)の評伝。 わしはなぜかジョン・フォン・ノイマンとクロード・シャノンをごっちゃにしてしまう。どちらも情報工学に関係があるからだろう。今回ジョン・フォン・ノイマンの評伝を読んだから、あとはシャノンの伝記を読めば、もうごっちゃになることはな…
書籍「ゼロから作るDeep Learning ❹ 強化学習編」を読んで強化学習について理解した内容を書いています。1章 バンディット問題 強化学習が他の学習と大きく異なる特徴は、エージェント(ロボットなど)が環境との相互作用の中で学習すること。 2章 マルコフ決定過程 3章 ベルマン方程式 4章 動的計画法 5章 モンテカルロ法 6章 TD法 7章 ニューラルネットワークとQ学習 8章 DQN 9章 方策勾配法 10章 さらに先へ ※強化学習について自分なりの解釈 強化学習は、人間が試行錯誤で色々な行動を試しながら、結果が良かった(成功した)行動は継続して、結果が悪かった(失敗した)行動は繰り…
たつきち 素数の研究は物理学にどのような影響を与えていますか 某AI 素数の研究が物理学に与える影響 素数の研究は、物理学の様々な分野に深い影響を与えています。以下、いくつかの例を挙げます。 1. 数論と物理学の融合 素数の分布や性質を研究する数論は、古くから数学の一分野として発展してきました。一方、物理学では、物質やエネルギーの性質を記述する数式を用いて、様々な現象を解明しようと試みています。近年、これらの二つの分野が融合し、数論的な方法を用いて物理学的な問題を解く研究が盛んになっています。 例えば、ランダム行列理論という分野では、ランダムな行列を用いて様々な物理現象をモデル化します。この理…
単純なモンテカルロ法は学部生でも習ったと思いますが,MCMC に到達するには結構な年月がかかりました.この本はコンパクトにモンテカルロ法やMCMCに関するオーバービューができる良書だと思います.ただ,HMC=hybrid/Hamilton Monte Carlo とか,呼び方が複数ある場合は,どちらかしか載ってなかったりするので辞書的に使うのにはちょっと向いていないかもしれません. ところで,産総研では発足時から20年にわたってグループ長という役目を務めさせていただきましたが,自分の人生の中で「長」と名の付くものにはほとんど縁がありません.まあたいていの人には「向いていない」という風に言われま…
1)統計学の現状 ここで、統計学と呼ぶ手法は、ベイス統計学です。 ベイズ統計学が市民権を得たのは、今世紀にはいってからです。 その理由は、マルコフ連鎖モンテカルロ法( Markov chain Monte Carlo methods、通称MCMC)が開発されて、任意の確率分布の計算が可能になったためです。 それまでは、正規分布以外の確率分布の計算は困難だったので、分布を無理に正規分布に当てはめて計算していました。古い統計学(頻度主義)の教科書には、その根拠は、大数の法則にあると書かれていますが、それは、誤りです。大数の法則は間違っていませんが、少数のデータの分布に、大数の法則を当てはめた点に無…
まえがき こんにちは、さつま芋です。 確証バイアスと呼ばれる偏向した情報の取捨のため、人間は都合の良い情報を集めるそうです。 逆に言うと、都合の悪い情報は退けることになります。 そのため、FXという勝負事では負け方を探究しようという気にはなりにくいのかもしれません。 実際に優位性を語る人は多くても、劣位性に触れる人は僅かです。 今回はスプレッドの劣位性に触れてみたいと思います。 モンキーテスト MT4のストラテジーテスターでは、スプレッドを指定してバックテストが行えます。 この機能を使って、ランダムなトレードをシミュレーションし、スプレッドの劣位性を観察したいと思います。 ドル円1分足のヒスト…
今週のお題「卒業したいもの」 こんにちは、ぽんです いつも訪問ありがとうございます 今回は、先日合格した統計検定3級で使用した私のマイ単語帳のご紹介です 各サイトさまより引用させていただいた用語集です 用語の一覧は、統計検定の公式HPに記載がある各級に求められる・知っておくべき語彙リストより引用しました この用語集がこれから受験される方の力になれば幸いです ※マイ単語帳のため語尾がそろっていない箇所が多数ありますので、予めご了承下さい ▼合格した統計検定3級の受験体験記はこちら▼ www.udablog.com データの種類 データのタイプの違いを理解し、それぞれのデータに適した処理法を理解す…
3/10から3/16で沖縄に行った記録である.また旅行記か.この記事を含めて直近6本の記事がすべて旅行記である.もはや何のためのブログなのかよくわからない.物理のスプリングスクールに参加するため,沖縄・那覇に滞在した.平日5日間,物理関係の講義や発表が続く.そのため観光をする時間はあまりなく,那覇市周辺を軽くまわれた程度だが,非常に面白い経験をたくさんしたので記事を書くことにする.スクールの内容自体について書くつもりはない.休み時間や放課後,および講義を抜け出しての食事や観光について書く.旅費は,スクール中にポスター発表をすることを条件に,研究室から補助を頂いた.ありがとうございます!いろいろ…