RやPython、回帰分析の復習のために購入。
まだ機械学習の分野までは読み進められていませんが、当初の目的は十分に果たせました
上記2言語が全く分からなくても、今ではWeb上で簡単に学べますし、スクリプトの解説は同書内でしっかりとされるので迷っている方も安心ですよ
無料のKindleアプリをダウンロードして、スマートフォン、タブレット、またはコンピューターで今すぐKindle本を読むことができます。Kindleデバイスは必要ありません。
ウェブ版Kindleなら、お使いのブラウザですぐにお読みいただけます。
携帯電話のカメラを使用する - 以下のコードをスキャンし、Kindleアプリをダウンロードしてください。
RとPythonで学ぶ[実践的]データサイエンス&機械学習 単行本(ソフトカバー) – 2019/3/26
ビジネスの現場で活用するための最短コースです!
本書は野村総合研究所のシステムコンサルティング事業本部で実施している
「アナリティクス研修」をベースにした書籍で、
「統計的なモデリングとは何か?」
「モデルに基づく要因の分析と予測の違いとは?」
「具体的なモデルの作り方」
「結果を解釈する際の落とし穴の見分け方」
など、ビジネスの現場感を重視した構成です。
実務で遭遇するデータ品質や加工のポイント、さらにRとPythonを利用し、
データからモデルを作成して結果を得るという基本的な手順を体験できます。
これからデータ分析や統計解析、機械学習を学び、現場でそれらを活用したい方に最短学習コースでお届けします。
本書は野村総合研究所のシステムコンサルティング事業本部で実施している
「アナリティクス研修」をベースにした書籍で、
「統計的なモデリングとは何か?」
「モデルに基づく要因の分析と予測の違いとは?」
「具体的なモデルの作り方」
「結果を解釈する際の落とし穴の見分け方」
など、ビジネスの現場感を重視した構成です。
実務で遭遇するデータ品質や加工のポイント、さらにRとPythonを利用し、
データからモデルを作成して結果を得るという基本的な手順を体験できます。
これからデータ分析や統計解析、機械学習を学び、現場でそれらを活用したい方に最短学習コースでお届けします。
- 本の長さ432ページ
- 言語日本語
- 出版社技術評論社
- 発売日2019/3/26
- ISBN-10429710508X
- ISBN-13978-4297105082
この商品をチェックした人はこんな商品もチェックしています
ページ 1 以下のうち 1 最初から観るページ 1 以下のうち 1
商品の説明
出版社からのコメント
これからデータ分析や統計解析、機械学習を学び、現場でそれらを活用した方に最短学習コースでお届けします。
内容(「BOOK」データベースより)
RStudio&Jupyter Notebook対応。現場で活用するための最短コース!さまざまな分析の「理論」と「実際の考え方」をR/Pythonで体験学習。
著者について
有賀 友紀(ありが ゆき)
株式会社野村総合研究所にて、企業のIT活用動向に関わる調査・研究に携わる。
大学での専攻(心理学)で定量分析を扱った経験から、
データの適切な活用と課題解決が定着するよう施策検討を行っている。
データサイエンスに関する社内研修の企画・コンテンツ作成と講師も手掛ける。
修士(人間科学)。
大橋 俊介(おおはし しゅんすけ)
修士(工学)を取得後に株式会社野村総合研究所入社。
入社後はサプライチェーン領域でデータを活用したコンサルティングをきっかけにデータサイエンス業務に従事する。
現在は、幅広い業種・業務領域において機械学習や混合整数計画などの最適化を用いた業務の効率化・高度化を実施。
株式会社野村総合研究所にて、企業のIT活用動向に関わる調査・研究に携わる。
大学での専攻(心理学)で定量分析を扱った経験から、
データの適切な活用と課題解決が定着するよう施策検討を行っている。
データサイエンスに関する社内研修の企画・コンテンツ作成と講師も手掛ける。
修士(人間科学)。
大橋 俊介(おおはし しゅんすけ)
修士(工学)を取得後に株式会社野村総合研究所入社。
入社後はサプライチェーン領域でデータを活用したコンサルティングをきっかけにデータサイエンス業務に従事する。
現在は、幅広い業種・業務領域において機械学習や混合整数計画などの最適化を用いた業務の効率化・高度化を実施。
著者略歴 (「BOOK著者紹介情報」より)
有賀/友紀
株式会社野村総合研究所にて、企業のIT活用動向に関わる調査・研究に携わる。大学での専攻(心理学)で定量分析を扱った。データサイエンスに関する社内研修の企画・コンテンツ作成と講師も手掛ける。修士(人間科学)
大橋/俊介
修士(工学)を取得後に株式会社野村総合研究所入社(本データはこの書籍が刊行された当時に掲載されていたものです)
株式会社野村総合研究所にて、企業のIT活用動向に関わる調査・研究に携わる。大学での専攻(心理学)で定量分析を扱った。データサイエンスに関する社内研修の企画・コンテンツ作成と講師も手掛ける。修士(人間科学)
大橋/俊介
修士(工学)を取得後に株式会社野村総合研究所入社(本データはこの書籍が刊行された当時に掲載されていたものです)
登録情報
- 出版社 : 技術評論社 (2019/3/26)
- 発売日 : 2019/3/26
- 言語 : 日本語
- 単行本(ソフトカバー) : 432ページ
- ISBN-10 : 429710508X
- ISBN-13 : 978-4297105082
- Amazon 売れ筋ランキング: - 385,064位本 (本の売れ筋ランキングを見る)
- - 1,002位人工知能
- - 1,124位ソフトウェア開発・言語
- カスタマーレビュー:
著者について
著者をフォローして、新作のアップデートや改善されたおすすめを入手してください。
著者の本をもっと発見したり、よく似た著者を見つけたり、著者のブログを読んだりしましょう
-
トップレビュー
上位レビュー、対象国: 日本
レビューのフィルタリング中に問題が発生しました。後でもう一度試してください。
2020年7月25日に日本でレビュー済み
Amazonで購入
どの初心者用にも載っている回帰分析から始まり、機械学習まで説明されている本書は非常に読みやすく使いやすい。特に多重回帰分析を3Dマップで表現したのはあまり見かけず、視覚的にわかりやすいと思う。機械学習についても概念から説明されており非常にわかりやすい。
しかし、基本的にはほとんどRコードばかりが書かれており、STATAでは簡単にできるが、意外に実務で苦労する対数の取り方や、新しい列の作り方などが載っていないと思われる。また、こういった簡単な四則演算や回帰分析等で起こりやすいエラーなどへの対処なども掲載されていれば便利だった。機械学習、特にランダムフォレストやSVMについても、両者を比較するコードは書かれているが、例えばランダムフォレストで出てきた決定木の描画だとかについても説明が欲しかった。初心者には、両者を比較するコードと、その結果がどれほどの意味をもつだろうか。
しかし、基本的にはほとんどRコードばかりが書かれており、STATAでは簡単にできるが、意外に実務で苦労する対数の取り方や、新しい列の作り方などが載っていないと思われる。また、こういった簡単な四則演算や回帰分析等で起こりやすいエラーなどへの対処なども掲載されていれば便利だった。機械学習、特にランダムフォレストやSVMについても、両者を比較するコードは書かれているが、例えばランダムフォレストで出てきた決定木の描画だとかについても説明が欲しかった。初心者には、両者を比較するコードと、その結果がどれほどの意味をもつだろうか。
2019年9月17日に日本でレビュー済み
Amazonで購入
「現場で活用するための〜」と表紙に書いてある通り、各チャプターは実際にありそうなシナリオを
解いていくような構成になっています。
プログラム言語、特にRのような数学的要素の多いフレームワークは実践と解説が混ざりすぎて
読み心地を損なう資料も多いのですが、この本は実践の部分から筋がブレないのでイメージしやすいのが良いですね。
(もちろん専門的な概念も多く登場しますが、ちょうど過不足無い程度の解説がされていて読みやすいです。
Rが7割、Pythonが3割と言った配分になっています。
それぞれの言語の入門編を通ったくらいのユーザーが、実際の現場をイメージ出来るようになれそうな印象を受けました。
買ってよかったです。
解いていくような構成になっています。
プログラム言語、特にRのような数学的要素の多いフレームワークは実践と解説が混ざりすぎて
読み心地を損なう資料も多いのですが、この本は実践の部分から筋がブレないのでイメージしやすいのが良いですね。
(もちろん専門的な概念も多く登場しますが、ちょうど過不足無い程度の解説がされていて読みやすいです。
Rが7割、Pythonが3割と言った配分になっています。
それぞれの言語の入門編を通ったくらいのユーザーが、実際の現場をイメージ出来るようになれそうな印象を受けました。
買ってよかったです。
2020年3月11日に日本でレビュー済み
Amazonで購入
RやPythonの入門としても使えますが、統計分析に必要となる考え方のポイントを丁寧に説明してあります。日頃分析ツールしか使っていないと原理を知らずに使ってしまいがちなp値をはじめとした「今更聞けない」極めて基本的な用語についても腑に落ちる表現で書いてある良書です。
2019年3月31日に日本でレビュー済み
Rをメインに使用している技術者です。統計解析・機械学習を俯瞰的に学ぶために購入しました。
さすが野村総合研究所の研修がベースになっているだけあって、
本の内容は数式を可能な限り抑えて実務者にも分かりやすい内容となっていました。
「はじめに」に書かれている通り本書を通じて
・統計モデリングの概念、要因分析と予測の違い
・実際にモデルを作成したり、結果を解釈したりする際の注意点
といったほかの書籍にあまり書かれていない内容を学べ、大変参考となりました。
この内容が3000円で買えるのは破格じゃないでしょうか?
ただし、
①R・Pythonに関して全くの初心者
②統計学と機械学習を学んだことがない
①②の両方に当てはまる方が読み進めるのは難しいと思います。
自分のレベルに合致しているか確かめたうえで購入しましょう。
さすが野村総合研究所の研修がベースになっているだけあって、
本の内容は数式を可能な限り抑えて実務者にも分かりやすい内容となっていました。
「はじめに」に書かれている通り本書を通じて
・統計モデリングの概念、要因分析と予測の違い
・実際にモデルを作成したり、結果を解釈したりする際の注意点
といったほかの書籍にあまり書かれていない内容を学べ、大変参考となりました。
この内容が3000円で買えるのは破格じゃないでしょうか?
ただし、
①R・Pythonに関して全くの初心者
②統計学と機械学習を学んだことがない
①②の両方に当てはまる方が読み進めるのは難しいと思います。
自分のレベルに合致しているか確かめたうえで購入しましょう。
2019年10月26日に日本でレビュー済み
Amazonで購入
この本のレビューにGBDTとは書きましたがLightGBMとかXGBoostとかを書いてなくて恥を曝していたので書き直しました。
この本自体は増補改訂版が出ているので、この旧版についてのレビューだったということで御容赦いただければ幸いです。
データ処理の実務上不要と思われる統計学の解説はともかくとして、GBDTとかLightGBMとかXGBoostとかの勾配ブースティング決定木系のアルゴリズムの解説が一切ないには2019年の出版としては大問題ではないかと思います。
データサイエンスと持て囃されても(日本の大企業が)業務で使うのは結局は古典的な統計学だということがおぼろげながら分かってきたので本書の内容は仕方が無いもします。
しかしながら書名に大きく「機械学習」と銘打っている以上、勾配ブースティング決定木系のアルゴリズムが出てこないのは、現状では表形式データに真っ先に適用すべき機械学習モデルとされていることからすると容認し難いと思います(ランダムフォレストはいくらか出てきます)。
更に少し追加しますが生物系の統計の本を読んでいたところ、「多重共線」という言葉が出てきて全く意味不明だったのですが、この本に非常に分かりやすい図解があったのでそういう面では助かりました。
とはいえ改めてページをめくると説明に使われている例に日本の企業社会の情けなさが滲み出てるので評価を変える気には到底なれません。
更にちなみにですが、この本では「検定」はあくまでモデル評価の指標の一例として扱われています。またそのせいかも知れませんが、上述の「多重共線」は出て来ても「多重検定」は出て来ません。なので上に書いたとおり機械学習の入門書としては疑問がありますが、データサイエンスの入門書としては間違いなく良識ある一冊だと思います。
でも評価点は変更なしです。
この本自体は増補改訂版が出ているので、この旧版についてのレビューだったということで御容赦いただければ幸いです。
データ処理の実務上不要と思われる統計学の解説はともかくとして、GBDTとかLightGBMとかXGBoostとかの勾配ブースティング決定木系のアルゴリズムの解説が一切ないには2019年の出版としては大問題ではないかと思います。
データサイエンスと持て囃されても(日本の大企業が)業務で使うのは結局は古典的な統計学だということがおぼろげながら分かってきたので本書の内容は仕方が無いもします。
しかしながら書名に大きく「機械学習」と銘打っている以上、勾配ブースティング決定木系のアルゴリズムが出てこないのは、現状では表形式データに真っ先に適用すべき機械学習モデルとされていることからすると容認し難いと思います(ランダムフォレストはいくらか出てきます)。
更に少し追加しますが生物系の統計の本を読んでいたところ、「多重共線」という言葉が出てきて全く意味不明だったのですが、この本に非常に分かりやすい図解があったのでそういう面では助かりました。
とはいえ改めてページをめくると説明に使われている例に日本の企業社会の情けなさが滲み出てるので評価を変える気には到底なれません。
更にちなみにですが、この本では「検定」はあくまでモデル評価の指標の一例として扱われています。またそのせいかも知れませんが、上述の「多重共線」は出て来ても「多重検定」は出て来ません。なので上に書いたとおり機械学習の入門書としては疑問がありますが、データサイエンスの入門書としては間違いなく良識ある一冊だと思います。
でも評価点は変更なしです。
2019年3月30日に日本でレビュー済み
416ページと厚めの本で、機械学習やディープラーニングまで扱っていますが、数式はほとんど使われていません。せいぜい、y = ax+b のような線形モデルの式がアクセントに出てくる程度です。分析手法や、それを理解するための概念は、すべて言葉と図で説明されており、実装例としてPythonとRで書かれたコードが紹介されています。
本書は、NRI社内での研修資料をベースにしているそうですが、SIerの非理系エンジニアが「まずは動かして、大まかなイメージをつかむ」ためには最適な内容だと思います。エンジニアの中には、学生時代から理工系で、数学的素養があり、高度なアルゴリズムを自ら開発している人もいるとは思いますが、そうでない(文系採用)人もたくさんいて、その人達の底上げのための教材としてよくできた内容だと思います。
一方で、研修の目的が「分析人材育成のための入り口」だそうなので、ある程度理工系のキャリアがあって、数学的な概念の理解やアルゴリズムの詳細なチューニングをしたいという人のニーズは満たせないと思いますが、それは本書の企画意図どおりなのだろうと思います。
本書は、NRI社内での研修資料をベースにしているそうですが、SIerの非理系エンジニアが「まずは動かして、大まかなイメージをつかむ」ためには最適な内容だと思います。エンジニアの中には、学生時代から理工系で、数学的素養があり、高度なアルゴリズムを自ら開発している人もいるとは思いますが、そうでない(文系採用)人もたくさんいて、その人達の底上げのための教材としてよくできた内容だと思います。
一方で、研修の目的が「分析人材育成のための入り口」だそうなので、ある程度理工系のキャリアがあって、数学的な概念の理解やアルゴリズムの詳細なチューニングをしたいという人のニーズは満たせないと思いますが、それは本書の企画意図どおりなのだろうと思います。