NumPyの中級編へようこそ!この記事では、NumPyのさまざまな高度な機能やテクニックについて詳しく解説します。 ブロードキャスト ブロードキャストは、異なる形状の配列間での演算を効率的に行うための強力な機能です。NumPyのブロードキャストを使用すると、配列の形状を自動的に調整して演算を行うことができます。以下は、ブロードキャストの例です。 python Copy code import numpy as np 配列のブロードキャスト a = np.array([1, 2, 3]) b = np.array([10, 20, 30]) c = a * b print(c) # 出力: [1…
Numpyとは Numpy(Numerical Python)は、Pythonで科学計算を行う際に非常に便利なライブラリです。Numpyを使うことで、高度な数値演算や配列操作が可能になります。 インストール方法 Numpyを使うには、まずNumpyライブラリをインストールする必要があります。以下のコマンドを使って、Numpyをインストールしましょう。 pip install numpy Numpyの基本的な使い方 Numpyを使うためには、まずimport文を使ってNumpyライブラリをインポートする必要があります。 import numpy as np 配列の作成 Numpyでは、多次元配列…
ChatGPTにNumpyを使う場合と使わない場合の計算速度を比較するPythonコードを書いてもらいました。 指示文(プロンプト): numpy を使った計算と、使わない場合の計算速度を比較するPythonコードを教えてください。 回答1: numpy を使った計算と、使わない場合の計算速度を比較するPythonコードは、以下のようになります。 import numpy as np import time # numpy を使わない場合 def calc_without_numpy(n): x = [[i for i in range(n)] for j in range(n)] y = […
私は定期的に本屋さんにいくのだが(医学書買いに) 最近は医学書買わずにプログラミングの本ばかり買っている。 しかし1冊読むのに途方もない時間がかかるので、どんどん積み本が増えていく。 というわけで積み本のうち1冊を読み始める。 それがこれ、 「AI・データサイエンスのための 図解でわかる数学プログラミング」 である。 特にこの本を選んだ理由は、、、特にない。目についたから。 統計解析、機械学習系の仕組みは少しわかってきたけど、実際にコードが書けるわけではないので、その辺の覚書をこのブログに書いていく。 というわけで第1部第1章「統計分布の可視化と分析」 この章ではホテル2年分の宿泊データを使っ…
Pythonを使ったデータ分析において、データの前処理は非常に重要です。Numpyは、Pythonでデータ分析を行う際に非常に便利なライブラリであり、データの前処理にも使われます。この記事では、Numpyを使ってデータを前処理する方法について解説します。 1. Numpyとは Numpyは、Pythonで数値計算を行うためのライブラリであり、配列を操作するための機能が充実しています。Numpyは、高速で効率的に配列を扱うことができるため、データ分析において非常によく使われています。 pydocument.hatenablog.com 2. データの前処理とは データの前処理とは、データを分析す…
NumPyは、Pythonの高速な数値計算ライブラリであり、大量の数値計算を効率的に実行することができます。NumPyは、多次元配列の作成や操作、数学関数、線形代数、乱数生成などの機能を提供しています。以下では、NumPyの基本的な使い方を説明します。 NumPyとは NumPyは、Numerical Pythonの略称であり、Pythonで高速な数値計算を行うための重要なライブラリです。NumPyは、多次元配列をサポートし、科学技術計算、データ分析、機械学習などの分野で広く利用されています。Pythonの標準ライブラリには含まれていないため、まずはNumPyをインストールする必要があります。…
Copy codeimport numpy as np # (640, 480) のアレイを作成data = np.random.rand(640, 480) # numpy アレイを csv ファイルに保存np.savetxt('data.csv', data, delimiter=',') 上記のプログラムで、numpyアレイのデータを「data.csv」という名前でCSVに保存することができます。データはカンマ区切りで保存されます。
python.atelierkobato.com まあ私が所属する予定の研究室はゴリゴリプログラムを書くらしく、主に線形代数を使うらしいので上記の記事をやっていこうと思う。 やってく中で疑問が生じた点や、メモを残す。主にサンプルプログラムのpythonの書き方についてを書くだろう。 ちなみに、pythonは全くの初心者ですので。 目次 目次 01ベクトル 02ベクトルの大きさと単位ベクトル ベクトルの大きさ 単位ベクトル 余談。HatenaBlogのTeX表記。 01ベクトル python.atelierkobato.com 例によって、以下の拡張パッケージが欲しいらしい。 ・NumPy ・S…
素数をPythonに計算させてみた。特に使い道はないけど、グラフ化すると不思議な気分になります。 Prime Numbers # -*- coding: utf-8 -*- """ #素数生成するだけ Created on Sat Oct 8 15:26:08 2022 @author: kzhat """ import math def is_prime(x): if x <= 1: return False for i in range(2, int(math.sqrt(x)) + 1): if x % i == 0: return False return True f = int(in…
AI(Python)の計算で、列ベクトルとか行ベクトルみたいな言葉はあまり使わないので、線形代数と違う計算をしているのかとも思うが、線形代数ですよね。 高校?大学の最初?に学ぶ線形代数では、 列ベクトルとか行ベクトルとかいう言い方があるが、 AI(Python)でのnumpyのdotとかは、適当に掛けときますわ。。。という感じで、およそ、「列ベクトル」とか「行ベクトル」とかの言葉を聞くことがない気がする。 でも、やってることは、行列の演算含め、線形代数ですよね。 コメント コメントなどあれば、お願いします。
目次 はじめに イメージ分類と物体検出の違い 物体検出ライブラリの選択 物体検出の手法とアルゴリズム Pythonでの実装例 まとめ 感想 1. はじめに 画像内の特定のオブジェクトを識別することは、コンピュータビジョンや機械学習の分野で重要な課題です。Pythonはそのようなタスクに取り組むための強力なツールやライブラリを提供しており、本記事ではその中でも物体検出に焦点を当てて解説します。 2. イメージ分類と物体検出の違い イメージ分類は、画像を特定のカテゴリに分類するタスクです。例えば、犬の画像を与えられた場合にそれが「犬」と分類されるかどうかを判断します。一方、物体検出は画像内の特定の…
こんにちは、AI活用研究チームのYuです。 昨今、AIツールが目覚ましい進化を遂げています。 Kaizen Platformでも、AI活用人材の育成や人材提供に力を入れています。 KaizenPlatform、国内のDXを加速させるAI-Readyな人材育成を目的に 「AI活用人材トレーニングプログラム」の提供を開始 Kaizen Platform、AIツールの活用スキルを持つエンジニアを提供する 新サービス「KAIZEN AI-READY TEAM」をリリース AI活用研究チームでは顧客体験を改善するための取り組みも始めており、AIチャットなどの検証もおこなっています。 そちらはまだ詳細には…
先程のentryの続きです。 交叉検証(Cross Validation)には、以下のような種類があるらしく、 https://www.codexa.net/cross_validation/ を写経しました。 sklearn.model_selection.train_test_split #ホールドアウト sklearn.model_selection.KFold #K分割 sklearn.model_selection.ShuffleSplit #シャッフル分割 sklearn.model_selection.StratifiedKFold #層化K分割 sklearn.model_se…
学習のまとめとして、Pythonデータ分析試験の公式書籍であるあたらしいPythonによるデータ分析の教科書を要約しています。 書籍内の記述にもある通り、Python認定基礎試験合格レベルのプログラミング、Pythonへの理解がある方に向けた資料となっています。 私自身は機械学習 / 数学 / データ分析はからきしです。 一章はひとつの記事にまとめましたが、二章以降は記事を複数にわける予定にしています。すべて完成したら(五章はとりあえず試験範囲ではないので入れません)、まとめてリンクを貼ります。 あたらしいPythonによるデータ分析の教科書 【本書の対象】・分析エンジニアを目指しているひと …
仮想環境 仮想環境 構築 1. 作成したいディレクトリに移動「cd」 2. 仮想環境 構築 仮想環境 確認 仮想環境 有効化/無効化 有効化 無効化 仮想環境 削除 ライブラリ インストール 最新 pip に更新 pip インストール 標準 複数 バージョン 指定 pip アンインストール インストール済みライブラリ一覧 確認 仮想環境各プロジェクトごとに必要なpytho使用バージョンがちがう為、専用環境をつくる。 venv:pythonで仮想環境が簡単にできるパッケージ。 ※python拡張ライブラリ(pandas、Numpyなど)は、対応するpythonバージョンが違う為、各プロジェクトご…
データ分析では定番のPython/Pandasですが、いろいろ便利な関数が最初から用意されています。以下はその一例。 sum(): 各列の合計値を計算します。 mean(): 各列の平均値を計算します。 median(): 各列の中央値を計算します。 max(): 各列の最大値を計算します。 min(): 各列の最小値を計算します。 std(): 各列の標準偏差を計算します。 ふと、関数を使う場合と使わない場合では、どの程度の差があるのか知りたくなったので、簡単な比較をしました。とりあえずmean関数だけ。 準備 数値集計用に適当なデータフレームを用意します。今回は1000万行×10列のデータ…
ChatGPTさんの答えはこちら AIエンジニアを目指す上で、大学と専門学校それぞれには異なるメリットがあります。 大学では理論的な知識や広範な分野への理解を深めることができます。例えば、コンピュータサイエンス、数学、統計学など、AIの基盤となる知識をしっかりと学べます。また、研究に携わる機会もあるため、最先端のAI技術に触れることも可能です。 一方、専門学校では実践的なスキルを習得することが可能です。プログラミング、データ解析、AIモデルの設計といった具体的な技術を、実際のプロジェクトを通じて学ぶことができます。 選択はあなたの目指すキャリアによります。研究職や深い理論知識を必要とする職種を…
Pythonは柔軟で使いやすい言語ですが、大量のデータや複雑な処理を扱う場合にはパフォーマンスの向上が求められることがあります。本記事では、Pythonの上級編として、さらなる高速化テクニックを紹介します。 マルチスレッドとマルチプロセス Pythonのグローバルインタプリタロック(GIL)の制約により、多くの場合、Pythonのスレッドはシングルスレッドとして動作します。しかし、GILを回避するためにマルチスレッドやマルチプロセスを活用することで、並列処理を実現しパフォーマンスを向上させることができます。以下は、マルチスレッドとマルチプロセスの例です。 python Copy code im…
Pandasの使い方のまとめ Pandasとは?呼び方は? Numpyとの違いは? Pandasの使い方 データの初期化 データの取得 データの抽出 ファイル操作 データの加工 変化率 移動 加工 欠損 欠けを調べる 欠けを削除 欠けを埋める Pandasとは?呼び方は? Pandasはデータを効率的に扱うためのパッケージです。 Pandaの正体は「PANel DAta=パネルデータ」。 「pip install pandas」でインストールできます。 呼び方ですが、海外の動画を見たりしていると「パンダス」と呼んでいるようです。 Numpyとの違いは? Numpyは「num」とあるように数字に…
前回に引き続き、マインスイーパーについて書く。今回は、実際に成功確率を計算するところまで実装して、結果を紹介する。 前回の記事:マインスイーパーの初手 (2) - pzdcの雑記
0.目次 1.背景 2.やりたいこと 3.PINNs(Physics Informed Neural Network) 3.1.PINNsとは 3.2.自動微分 4.マス-バネ-ダンパー系(1次の自由振動系) 4.1.解析解 4.2.NNによる解法 4.3.PINNsによる解法 5.まとめ 1.背景 業務でPINNs(Physics Informed Neural Network)を使用したいと思い、自身で実装する方法をまとめましたので備忘録がてらまとめてみます。 2.やりたいこと 1次元の自由振動系に対して振動するマスの変位を予測するPINNsを実装し、微分方程式を解くことにより得られる解析…
LinuCエヴァンジェリスト・Open Source Summit Japan 2022ボランティアリーダーの鯨井貴博@opensourcetechです。 はじめに 今回はWordCloudを使って、データ分析(長文における単語頻出度合い)してみます。 WordCloudとは WordCloudは、文章に含まれる単語の頻出度合い可視化してくれるPythonのライブラリです。 https://amueller.github.io/word_cloud/ 答えを予め出しておくと、こんな感じになります。 前提条件 作業の前提ですが、今回はUbuntu 22.04.2 LTS上でPython3が実行で…
Matplotlibはグラフを描くライブラリで、可視化しながら作業をしやすくなります。 Numpyの使い方 インストール セットアップ グラフ化 ファイル操作 Matplotlibのエラー 'matplotlib' is not a package? Numpyの使い方 Matplotlibはグラフ化の扱うライブラリです。 インストール インストールするには pip install matplotlib セットアップ 利用を開始するには import matplotlib.pyplot as plt グラフ化 ・配列を渡すだけで、シンプルなグラフを作成。 データを「plot」して「show」で…