コンピュータに対し、データを元に役立つ規則などを発見させる(すなわち学習する)こと。およびその方法。
ニューラルネットワークから歴史は始まり近年は確率統計の観点から研究されることが多い。 統計の観点から見た場合、与えられたデータに対してモデルを当てはめているだけである。 モデルが複雑である点で従来の統計学と異なっている。
以下、有名な確率モデル
こんにちは.changです. 今回はAIを4名の自転車レーサー(マ○ュアン,ペ○ッキ,カ○ンディッシュ,カ○チェラーラ)に見立てて競わせてみました. 0. 自転車ロードレース 自転車レース戦術の必要知識については過去の記事*1*2をご覧ください. モデルにした選手についての知識があるとより楽しんでいただけると思うのですが,選手の特徴を比較しながら理解できるような情報元はなかなか無いです. あまり参考にならないと思いますが,彼らがフィーチャーされているYouTubeを紹介しておきます*3*4*5*6. 1. プログラム (1) フィールド 32×8の画像の上を上から下方向にレースさせます. プレ…
皆さんこんにちは!いつもCCC insideをご覧いただきありがとうございます。 CCC insideでも紹介しているように、CCCには幅広い事業・職種があります。色々あり過ぎてどれを読んだらいいのかわからないと悩んでいる方もいるのではないかと思い、、、今回は、マーケティングの部門に携わるメンバーの記事をまとめました! (記事がUPされ次第、随時更新していきます) データアナリスト(データサイエンティスト) ●ファッションコンサルティングユニットのデータアナリスト ●1年目からデータアナリストとして活躍する新入社員 ●データアナリスト3年目、様々な企業のデータを分析する若手 マーケティング・営…
興味本位で顔検出からの年齢や性別予測してみたいな🤔、 と思い立ち、さっそく実施してみることにしました!!AWSを用いればS3に保存された画像から顔検出、年齢、性別予測が出来ることは知っているのですが、、、 AWSの無料期間使い切ってしまっているし、どうせだったら無料の方法でやりたいよな。 と思い、さっそく調べてみることに。そこで、ローカル環境で年齢や性別予測することが出来る方法が見つかったので試しに使ってみることにしました!! ■利用環境 ■ローカルで年齢、性別を予測する方法 ■対策1 ■対策2 ■その他のエラーについて ■実行 (adsbygoogle = window.adsbygoogl…
「for カウンタ変数 in 繰り返す範囲: 繰り返し処理」 なんとなくなら使える。 が、「カウンタ変数」と「繰り返し処理」は具体的にどういう関係なのか。 インベントが必要な理由は・・?
HTMLは習ったことがないので、「プルダウンの書き方」などと出てきても なるほど、それを真似すれば書けるのか、という感じ。汗 「" "(ダブルクオテーション)」「' '(シングルクオテーション)」の意味するところなど 細かい部分のそれぞれの役割をきちんと理解しておかないと、この先使い回しが効かないのだろうな・・。
機械学習の概要 機械学習の定義 機械学習の定義は以下の2つが有名です。 1つ目は、Arthur Samuel(ア-サー・サミュエル) による定義で次のようなものです。 The field of study that gives computers the ability to learn without being explicitly programmed. (訳:明示的にプログラムしなくても、学習する能力をコンピュータに与える研究分野) 2つ目は、Tom Mitchell(トム・ミッチェル)の著書 『Machine Learning』(1997) の序文にあるもので、次のような見解です。 …
条件分岐・比較演算子、ループ処理にリストやディクショナリの基礎と学んできたが その時点ではクリアできた演習も数日あけて戻ってみると物の見事に忘れている。 コードを書くしかないと思うが、入るより出て行くほうが多い気がする。汗
はじめに 機械学習などをやっていると困るのはデータを集めることだと思います。私も音源分離の機械学習をやったことがあるのですが、データを集めるのに苦労しました。音楽データの音源分離をする場合は、データセットはMUSDB18が一番有名ではないかと思います。MUSDB18は150曲(約10時間)の音楽トラックデータセットで、曲ごとにボーカル、ベース、ドラム、その他の楽器に分けられたステムデータがあります。試しにモデルを動かしてみたいときはMUSDB18だけで十分だと思いますが、もっとモデルを学習させたいときがあるかと思います。 Cambridge Music Technology Cambridge…
昨日学習結果を保存するまでの処理をまとめました。 elsammit-beginnerblg.hatenablog.com今回はこちらの保存した学習データを用いてWeb上に着座中か否かの判定結果を表示させてみたいと思います!! ■学習結果を使用する ■学習結果を用いて赤外線アレイセンサから予測する ■webブラウザ上で予測結果表示 ■結果表示 ■最後に ■参考 (adsbygoogle = window.adsbygoogle || []).push({}); ■学習結果を使用する 学習結果はpickleにて保存いたしました。 では、保存した結果を使用してみます。使用する場合にはこちらのように、…
Rでのデータ分割の方法のメモ。 データ準備 rsample で分割 dplyr で分割 参考 データ準備 1500行の何の意味もないデータ。 ads <- data.frame(id=seq(1:1500)) rsample で分割 library(rsample) ads.sp1 <- rsample::initial_split(ads, prop=3/4) adtrain1 <- rsample::training(ads.sp1) #-- 訓練データ adtest1 <- rsample::testing(ads.sp1) #-- テストデータ initial_split関数で分割する…
はじめに 『ベイズ推論による機械学習入門』の学習時のノートです。基本的な内容は「数式の行間を読んでみた」とそれを「RとPythonで組んでみた」になります。「数式」と「プログラム」から理解するのが目標です。 この記事は、3.2.3項の内容です。尤度関数をポアソン分布、事前分布をガンマ分布とした場合のパラメータの事後分布と未観測値の予測分布の計算をPythonで実装します。 省略してある内容等ありますので、本とあせて読んでください。初学者な自分が理解できるレベルまで落として書き下していますので、分かる人にはかなりくどくなっています。同じような立場の人のお役に立てれば幸いです。 【数式読解編】 w…
はじめに 『ベイズ推論による機械学習入門』の学習時のノートです。基本的な内容は「数式の行間を読んでみた」とそれを「RとPythonで組んでみた」になります。「数式」と「プログラム」から理解するのが目標です。 この記事は、3.2.3項の内容です。尤度関数をポアソン分布、事前分布をガンマ分布とした場合のパラメータの事後分布と未観測値の予測分布の計算をR言語で実装します。 省略してある内容等ありますので、本とあせて読んでください。初学者な自分が理解できるレベルまで落として書き下していますので、分かる人にはかなりくどくなっています。同じような立場の人のお役に立てれば幸いです。 【数式読解編】 www.…
皆さんこんにちは、KHnodeです。 今回も「python初学者が競馬予測をしてみた」です。前回の記事はこちら kashiwapro.hatenablog.com まだ見ていない方は見ていただけると幸いです。それでは早速やっていこうと思います。################################################################## モデル作成 訓練用のデータとテスト用のデータを分割します。 これは、機械学習お馴染みの手法なので覚えておくといいと思います。 from sklearn.model_selection import train_test_s…
[祝] ポケモン25周年 〜推薦システムに詳しい方へ〜 本編 ステップ1. 基本的な集計をする ステップ2. ポケモンどうしの共起度を計算する ステップ3. ポケモンどうしをグループ分けする ステップ4. 推薦システムを作る まとめ 宣伝 ポケモン系 推薦システム系 補足など ツイートの収集 ステップ2の結果一覧 Matrix Factorizationの実装 [祝] ポケモン25周年 @tkanayama_ です。先日、ポケモン公式による投票企画「#キミにきめた」が実施されました。これは、Twitter上で以下のようにハッシュタグをつけてツイートすることにより、ポケモンの人気投票を行う企画で…
こんにちは!こーたろーです。 毎日忙しくしています。 しかしながら、ブログで技術的なことを発信するのは結構リラックスできて、続けられそうな気がします。 今日のテーマはコチラです。 ai-scholar.tech
先月末の営業日から機械学習による株価予測で実際の株は買っていません。まだまだ機械学習で当てれているかというと到底当てれておらず、もし今のまま機械学習が出した推論に基づき株を購入したとしても単なる半丁博打をやっているのと変わらず、また株価特有のランダム性から逃れられずギャンブルみたいなもんになります。 では、完全に諦めたのかというとそういうわけでもなく、いくつかのアイデアを実装してみたりしています。 機械学習による株式株価予測〜改善ポイント クラスタリングによる教師データの選択 よく機械学習エンジニアが「もっとデータがあれば」と言いますが、そのような話を聞くたびに私はちょっと違うかなと違和感を感…
×380 新型コロナ流行下の日本人の不安・抑うつの危険因子が明らかに – 医療政策学×医療経済学 ×165 MIT Press Journals ×121 Factors Associated with Serious Psychological Distress during the COVID-19 Pandemic in Japan | medRxiv ×15 財団生紹介 | 孫正義育英財団 ×14 一人10万円超も NTTが山田前広報官と谷脇総務審議官に高額接待 | 文春オンライン ×13 [DEIM2021] 企業法務を支援する契約書検索システムの設計と実装 - Speaker De…
はじめに 送信 受信 AWSのLambda その他 はじめに 以下記事の通り、AWS上のLambdaを使って機械学習モデルのAPIを立てたのですが、 Pythonでmultipart/form-dataのパースが大変だったので共有します。 tmyoda.hatenablog.com 送信 requestsモジュールを使用すればかんたんです。 以下記事が参考になります。 qiita.com files = {} mine_type = "image/jpeg" file_name = "input_image_quart.jpg" data = なんかバイト列 files = {'key': (…
Pythonを使い始めるところまでまず説明していきます。起動ができないとプログラミングが実行できませんからねwPC環境でPythonの実行環境を作成して実行できるまでを説明します。 Mac、Linuxはすぐ実行できます MacとLinuxは既に入っておりますので、ターミナルを開いてpythonと入力すると実行できます。Macですと以下のアイコンを開きます。 開くとCUIが開きます。そこで下の画像のようにpythonと入力すると起動します。 user_name ~ % python そうすると、以下のようなメッセージが出てきて実行できます。「>>>」が出てきたら、コマンドを入力する形で実行できま…
(↑from scikit-learn User Guide Gradient Boosting Out-of-Bag estimates — scikit-learn 0.24.1 documentation) 当記事では勾配ブースティング(Gradient Boosting)について簡単に確認を行います。 勾配ブースティングについては少々フォーマルな記載が多く理解が大変なのですが、上記の「scikit-learnとTensorFlowによる実践機械学習」の記述が比較的わかりやすいので、こちらを元に簡単に確認したのちにWikipediaの記載を簡単に確認します。以下、今回の目次になります。1…
機械学習のフレームワークを使ったアプリを作ってみたくなり、試しに作ってみた。ついでに最近、エジプトのヒエログリフが面白いなあ、と思っていたのでそれをアプリのテーマにした。 Egyptian Hieroglyphs PhotoDaisuke Tonosaki写真/ビデオ無料 Apple の review に提出する際に、かなり機能が単純なアプリだからリジェクトされるかと思ったが、大丈夫だった。 (審査にデモビデオは添付した) アプリを使って変換すると、こんな感じで写真 → エジプトのヒエログリフの壁画風の画像になる。 アプリの動作はこんな感じ。 www.youtube.com 精度はそんなに良く…
機械学習名古屋 第28回でLT発表をしました🦔 オンラインハンズオンの待ち時間中(学習中、デプロイ中)の発表です。 Pythonパッケージ版のMediaPipeの紹介的な発表内容です。 一昨日更新された内容も盛り込んでいます👻 いつものごとく動画多めなので、SpeakerDeckに加えYoutube版もあります。 speakerdeck.com www.youtube.com 以上。
随分と堕落した生活を送っている。 毎日が無計画でただただ浪費されていく。 そんな生活を送れるのももうこれが最後なのかもしれないけどね。 研究室に入ったらそれで忙しいだろうし。 でもこれではまずい気がしているから(少なくとも現在は)、明日から3日間はリアリスティックに過ごしてみようと思う。 現実的に。 正直なところ現実的な考え方というものがよくわかっていないのだけれど、何かしらの予定が詰まっていて、その一つ一つの行動に意味づけがされていて、尚且つ将来のことをちゃんと考えてたら現実的なことを考えている気がする。 イメージの問題だ。 よし、早速明日の計画を立ててみよう。 朝はちゃんと起きる。8時起床…
実行結果 captureディレクトリの画像データから顔検出して、faceディレクトリに検出した顔画像データを保存している。 DlibとはC++言語で書かれた汎用目的のクロスプラットフォームのライブラリで機械学習、画像処理、データマイニングなど幅広い分野の処理が可能。今回は顔検出に利用するが、opencvを用いた方法よりも誤検出が少ないのが特徴。 Dlibの顔検出に使用するインスタンス生成 detector = dlib.get_frontal_face_detector() get_frontal_face_detector()を実行することでインスタンスを生成できる。 captureディレク…
と言っても機械学習的な意味で。 単純に勾配降下法を適用すると、局所解に捕まる問題は先に述べた通り。 分かりやすくサンプルを考えてみると import numpy as np import matplotlib.pyplot as plt def func(x): return x*x*x*x + 2*x*x*x + -38*x*x + 2*x X = np.arange(-10, 10, 0.02) Y = func(X) plt.plot(X, Y) plt.show() 微分済みの関数は def delta_func(x): return 4*x*x*x + 6*x*x -76*x + 2…
Trend Micro Email Security メンテナンスのお知らせ (2021年2月27日):サポート情報 : トレンドマイクロ 以下の日程で、Trend Micro Email Security のメンテナンス作業を実施します。 ■メンテナンス日時 2021年2月27日 (土) 15:00 ~ 19:00※メンテナンス時間は予告なく変更されることがあります。■メンテナンス内容 機能のアップデートが行われます。主な新機能は以下の通りです。 送信保護設定のウイルスポリシーでも、検索条件として機械学習型検索が使用できるようになります。 Syslog転送機能において、URLクリック追跡ログ…
こんにちわ、ムッチーです( `ー´)ノ 早速、今日の体重を! 75.4kg 昨日からプラスマイナス0kg まぁ、徐々に・・・・。 今日の食事 朝:十六穀米 昼:パスタ 夜:ササミとホウレンソウを炒めたもの 本日の歩数:12504歩 働いた方です・・・ 本日の運動:背中のトレーニング(ベントオーバーローイング、インクラインダンベルローイング、懸垂) 知人と懸垂を30分もやっていました。流石に疲れましたね・・・(´・ω・`) (個人的なIPOメモ) ヒューマンクリエイションホールディングス 申し込み済み SMBC日興証券、SBI証券 ウイングアーク1st 見送りします T.S.I 抽選申し込み期間…
業務的にはいきなりの大波乱を乗り越えて、これを書いています。 例によってあまり詳細なことは書けませんが、急な要件変更があったということです。ただ、今回は予想以上に早く計画を立て直せたので、その点ではちょっと自慢してもいいのではないかと思っています(えっへん)。 さて昨日、レガシーコードには変更に対する柔軟性がないということを書きました。したがって変更に強い設計を行うべきでは、という思いを新たにしたわけですが、今回の急激な要件変更に耐えられた理由は、決して実装側で吸収できたからというわけではありませんでした。具体的には、管理していたドキュメントが現状を表すために機能していたので、それを元に素早く…
レイ・フロンティアのデータアナリスト久保です。 レイ・フロンティア株式会社では「人間の無意識を、行動データで見える化する」事業を展開しています。 2020年末、国土交通省が「PLATEAU」というプロジェクトを公開しました。これは日本全国の3Dデータをオープンに使えるようにするという物で、活性化のためにアイデアソンやハッカソンも行われています。 PLATEAUのビューアーは常に公開されていて、自前のデータと組み合わせて閲覧する事が可能なので、今回は弊社が持つ人流データを組み合わせてPLATEAUを体験してみる事にしました。 使用データ:弊社アプリSilentLogより収集したデータに匿名化処理…
matplotlib.pyplot: python機械学習等の図形描写用ライブラリmatplotlib.pyplot.scatter() scatterは「散乱」。散布図の描画。 import numpy as np import matplotlib.pyplot as plt # 50個の0~1のランダムな数値を取得 x = np.random.rand(50) y = np.random.rand(50) # 散布図を描画 plt.scatter(x, y)