コンピュータに対し、データを元に役立つ規則などを発見させる(すなわち学習する)こと。およびその方法。
ニューラルネットワークから歴史は始まり近年は確率統計の観点から研究されることが多い。 統計の観点から見た場合、与えられたデータに対してモデルを当てはめているだけである。 モデルが複雑である点で従来の統計学と異なっている。
以下、有名な確率モデル
機械学習の具体的な問題にPythonを使って、機械学習もPythonも同時に学んでしまいましょう。今回は分類問題を機械学習を使って解く際によく使われるロジスティック回帰(Logistic Regression)についてまとめました。ロジスティック回帰は、0または1(Yes/Noなど)の2値分類に適しています。この記事では scikit-learn(sklearn)ライブラリを用います。適宜 pip install scikit-learnなどによってダウンロード・インストールしてください。 ロジスティック回帰の実装 ロジスティック回帰の決定境界の可視化 (adsbygoogle = windo…
機械学習の具体的な問題にPythonを使って、機械学習もPythonも同時に学んでしまいましょう。今回は機械学習の基本的な予測モデルである線形回帰についてまとめました。この記事では scikit-learn(sklearn)ライブラリを用います。適宜 pip install scikit-learnなどによってダウンロード・インストールしてください。 線形回帰モデルの実装 線形回帰モデルの可視化 (adsbygoogle = window.adsbygoogle || []).push({}); 線形回帰モデルの実装 線形回帰モデルは、入力値 に対して予測値 を線形関数によってモデル化するもの…
LLMで中国語学習をブーストする TikTokでこれ中国語でなんて言うの?の動画がよく作られている HSKなどの中国語のテストにおいて級が上がるほど声調違いの漢字が増えていきます。 TikTok上でよく中国語の先生が中国語ムツカシイヨの例として声調違いの漢字を使った例文を読み上げてその難しさを表現しています。 @leechanch 🇨🇳中国語が難しい理由#hsk1級#hsk3級#hsk2級#hsk4級#中国語会話#中国語#shorts @李先生の楽しい中国語塾 ♬ オリジナル楽曲 - 李先生の楽しい中国語塾 一見ただのネタにも見えますが、こういった声調違いの例文は違いが浮き彫りになると言う点で…
機械学習の具体的な問題にPythonを使って、機械学習もPythonも同時に学んでしまいましょう。今回は機械学習の精度を高めるうえで重要となる、データ処理についてまとめました。この記事では scikit-learn(sklearn)ライブラリを用います。適宜 pip install scikit-learnなどによってダウンロード・インストールしてください。 データの前処理(標準化) 学習用・テスト用データへの分割 (adsbygoogle = window.adsbygoogle || []).push({}); データの前処理(標準化) scikit-learn を使って標準化(Stand…
機械学習の具体的な問題にPythonを使って、機械学習もPythonも同時に学んでしまいましょう。今回は応用先である機械学習を見据えて、Pythonの使い方のやや発展的な内容をまとめました。 NumPyのブロードキャスト NumPyのベクトル化と高速計算 Pandasによるデータ処理の基本 Pandasの基本操作 データの基本操作 Matplotlibでデータの可視化 Seabornで高度なデータ可視化 Seabornの基本 (adsbygoogle = window.adsbygoogle || []).push({}); NumPyのブロードキャスト NumPyはAI開発に欠かせないライブ…
こんにちは!📢KabuShineです。✨AIの進化は目覚ましく、最近では情報収集や分析の分野でも革新が進んでいます。🔍📊特に、**OpenAIの最新技術「ディープリサーチ(Deep Research)」**は、従来のAIを超えた次世代のエージェント技術として注目を集めています!🚀 今回は、この「ディープリサーチ」がどのように企業のリサーチ、投資判断、知識労働の効率化に貢献するのかを詳しく解説していきます!💡📈AIがどこまで進化し、私たちの情報活用をどう変えていくのか、一緒に見ていきましょう!✨ body { font-family: Arial, sans-serif; line-height…
皆さん、こんにちは!この連載では、データ分析を駆使して会社を成長させる方法を、難しい言葉を使わずに、誰でも理解できるように解説していきます。 「データ分析」って聞くと、なんだか難しそう…って思う人もいるかもしれません。私も学生時代は数字が苦手で、統計学なんて聞くだけで頭が痛くなっていました(笑)。でも大丈夫!この連載では、そんな私でも理解できたデータ分析の「おいしいところ」だけを、皆さんにこっそり教えちゃいます! 今回のテーマは、「データ分析にAIを活用するメリットと基本的な手順」です。最近よく聞く「AI」とか「機械学習」って言葉も出てきますが、一つ一つ丁寧に解説するので、安心して読み進めてく…
こんにちは!📢KabuShine です。✨投資やコンテンツについて、皆さんと一緒に学びながら成長していけたらと思っています!💡🚀 最近、AI業界でディープシークとOpenAIの対立が大きな話題 になっています。OpenAIは 「ディープシークがChatGPTの出力を不正利用した可能性がある」 と非難しましたが、ネット上では 「お前が言うな!」 というツッコミが殺到。 というのも、OpenAI自身も過去にインターネット上の膨大なデータを無断で学習 してきた経緯があるからです。この状況には「泥棒が泥棒を非難している」といった声も上がり、議論が白熱しています。 果たして、このAI業界の新たな論争の行…
お疲れ様です。 商用利用可能で性能のよいセグメンテーションモデルが必要になったので調査した内容をメモに残しておきます。 リンク 概要 実装 リンク 論文 arxiv.org 論文解説 speakerdeck.com 公式実装 github.com 概要 以下は生成AI(Gemini)に聞いた内容。 Mask2Former は、様々なセグメンテーションタスクを統一的なフレームワークで実行できる、非常に強力で汎用性の高い最新のセグメンテーションモデルです。 2022年に発表され、瞬く間にセグメンテーション分野で注目を集めました。 Mask2Former の重要なポイント 統一されたアプローチ (U…
こんにちは。研究開発室のエンジニアの東です。 今回はDatabricks環境で、1つのノードやGPUにおさまらないような巨大なデータセットやモデルの学習を、Rayを用いてMulti-node/ Multi-gpuで行う方法について解説します。 想定される読者は以下のような方々です。 機械学習についての基礎的な知識がある方 Databricksについての基礎的な知識がある方 DatabricksでMulti-node/ Multi-gpu学習を行いたい方