プライム無料体験をお試しいただけます
プライム無料体験で、この注文から無料配送特典をご利用いただけます。
非会員 | プライム会員 | |
---|---|---|
通常配送 | ¥410 - ¥450* | 無料 |
お急ぎ便 | ¥510 - ¥550 | |
お届け日時指定便 | ¥510 - ¥650 |
*Amazon.co.jp発送商品の注文額 ¥2,000以上は非会員も無料
無料体験はいつでもキャンセルできます。30日のプライム無料体験をぜひお試しください。
新品:
¥3,300¥3,300 税込
ポイント: 198pt
(6%)
無料お届け日:
3月30日 土曜日
発送元: Amazon.co.jp 販売者: Amazon.co.jp
新品:
¥3,300¥3,300 税込
ポイント: 198pt
(6%)
無料お届け日:
3月30日 土曜日
発送元: Amazon.co.jp
販売者: Amazon.co.jp
中古品: ¥1,604
中古品:
¥1,604

無料のKindleアプリをダウンロードして、スマートフォン、タブレット、またはコンピューターで今すぐKindle本を読むことができます。Kindleデバイスは必要ありません。
ウェブ版Kindleなら、お使いのブラウザですぐにお読みいただけます。
携帯電話のカメラを使用する - 以下のコードをスキャンし、Kindleアプリをダウンロードしてください。
前処理大全[データ分析のためのSQL/R/Python実践テクニック] 大型本 – 2018/4/13
本橋 智光
(著)
{"desktop_buybox_group_1":[{"displayPrice":"¥3,300","priceAmount":3300.00,"currencySymbol":"¥","integerValue":"3,300","decimalSeparator":null,"fractionalValue":null,"symbolPosition":"left","hasSpace":false,"showFractionalPartIfEmpty":true,"offerListingId":"GHyqQqW1iohS45iJ8sh6UHrvZT5P4aoQinApxni2xKrrNOeeqQW86EYkY8chI1PH1qh4RWJ625IJSqX3OzsJsHDaoGi4%2FrcaO33wFxMvzbfo05N0klosq%2BXoMV%2BUFlUhRar0mf3xHUc%3D","locale":"ja-JP","buyingOptionType":"NEW","aapiBuyingOptionIndex":0}, {"displayPrice":"¥1,604","priceAmount":1604.00,"currencySymbol":"¥","integerValue":"1,604","decimalSeparator":null,"fractionalValue":null,"symbolPosition":"left","hasSpace":false,"showFractionalPartIfEmpty":true,"offerListingId":"GHyqQqW1iohS45iJ8sh6UHrvZT5P4aoQYDrEXq6XOoEw6OURbp9NyFxVNGuxo2c27p8biyJ6Xm68PIuj3d2COKwlpGZi%2B%2BGf9RUxVr7S9Zb95yJnXM2gC4L%2FlcpCx4u7KbGODXF6Ted158jyMI3IS1ay8qyJ5aSyt%2FskWca1mo%2F2WVBH%2FFxxoQ%3D%3D","locale":"ja-JP","buyingOptionType":"USED","aapiBuyingOptionIndex":1}]}
購入オプションとあわせ買い
Law of Awesome Data Scientist
データサイエンスの現場において、その業務は「前処理」と呼ばれるデータの整形に
90%以上の時間を費やすと言われています。
「前処理」を効率よくこなすことで、予測モデルの構築やデータモデリングといった
本来のデータサイエンス業務に時間を割くことができるわけです。
本書はデータサイエンスに取り組む上で欠かせない
「前処理スキル」の効率的な処理方法を網羅的に習得できる構成となっています。
ほとんどの問題についてR、Python、SQLを用いた実装方法を紹介しますので、
複数のプロジェクトに関わるようなデータサイエンスの現場で重宝するでしょう。
データサイエンスの現場において、その業務は「前処理」と呼ばれるデータの整形に
90%以上の時間を費やすと言われています。
「前処理」を効率よくこなすことで、予測モデルの構築やデータモデリングといった
本来のデータサイエンス業務に時間を割くことができるわけです。
本書はデータサイエンスに取り組む上で欠かせない
「前処理スキル」の効率的な処理方法を網羅的に習得できる構成となっています。
ほとんどの問題についてR、Python、SQLを用いた実装方法を紹介しますので、
複数のプロジェクトに関わるようなデータサイエンスの現場で重宝するでしょう。
- 本の長さ336ページ
- 言語日本語
- 出版社技術評論社
- 発売日2018/4/13
- 寸法18.3 x 2.3 x 23.1 cm
- ISBN-104774196479
- ISBN-13978-4774196473
よく一緒に購入されている商品
![前処理大全[データ分析のためのSQL/R/Python実践テクニック]](https://images-fe.ssl-images-amazon.com/images/I/71uyA0YhryL._AC_UL116_SR116,116_.jpg)
対象商品: 前処理大全[データ分析のためのSQL/R/Python実践テクニック]
¥3,300¥3,300
最短で3月30日 土曜日のお届け予定です
残り2点 ご注文はお早めに
¥3,300¥3,300
最短で3月30日 土曜日のお届け予定です
残り12点(入荷予定あり)
総額:
当社の価格を見るには、これら商品をカートに追加してください。
ポイントの合計:
pt
もう一度お試しください
追加されました
一緒に購入する商品を選択してください。
この商品をチェックした人はこんな商品もチェックしています
ページ 1 以下のうち 1 最初から観るページ 1 以下のうち 1
商品の説明
出版社からのコメント
前処理が適切に行われているかどうかで、データ分析の品質は左右されます。
本書でさまざまな前処理のテクニックを身に付けてください。
本書でさまざまな前処理のテクニックを身に付けてください。
著者について
本橋智光(もとはし ともみつ)
システム開発会社の研究員、Web系企業のデータサイエンティストを経て、
現在はデジタル医療スタートアップのサスメド株式会社のCTO。ホクソエム株式会社にも所属。
量子アニーリングコンピュータの検証に個人事業主として従事。
製造業、小売業、金融業、運輸業、レジャー業、Webなど多様な業種なデータ分析を経験。
KDD CUP 2015 2位。趣味でマリオのAIを開発。
システム開発会社の研究員、Web系企業のデータサイエンティストを経て、
現在はデジタル医療スタートアップのサスメド株式会社のCTO。ホクソエム株式会社にも所属。
量子アニーリングコンピュータの検証に個人事業主として従事。
製造業、小売業、金融業、運輸業、レジャー業、Webなど多様な業種なデータ分析を経験。
KDD CUP 2015 2位。趣味でマリオのAIを開発。
登録情報
- 出版社 : 技術評論社 (2018/4/13)
- 発売日 : 2018/4/13
- 言語 : 日本語
- 大型本 : 336ページ
- ISBN-10 : 4774196479
- ISBN-13 : 978-4774196473
- 寸法 : 18.3 x 2.3 x 23.1 cm
- Amazon 売れ筋ランキング: - 31,805位本 (本の売れ筋ランキングを見る)
- - 95位データベース処理
- カスタマーレビュー:
著者について
著者をフォローして、新作のアップデートや改善されたおすすめを入手してください。

著者の本をもっと発見したり、よく似た著者を見つけたり、著者のブログを読んだりしましょう
-
トップレビュー
上位レビュー、対象国: 日本
レビューのフィルタリング中に問題が発生しました。後でもう一度試してください。
2022年9月24日に日本でレビュー済み
Amazonで購入
他のレビューにあるよう、文面に傲慢さが感じられるが、内容は良い。
2021年5月12日に日本でレビュー済み
Amazonで購入
データ分析はモデリングなどに目がいきがちですが、実際にやるとテーブル結合・クレンジング・名寄せなど、データ前処理か非常に大変で、非常に苦労します。
そういう背景があるため、データ前処理を勉強するのはとても有効です。
誰でもモデリングできるAutoMLツールが流行ってきましたが、データ前処理は少なからず地道に手を動かす必要があります。
AutoMLが流行ってきた今だからこそ、改めてデータ前処理を勉強することに価値があります。
そういう背景があるため、データ前処理を勉強するのはとても有効です。
誰でもモデリングできるAutoMLツールが流行ってきましたが、データ前処理は少なからず地道に手を動かす必要があります。
AutoMLが流行ってきた今だからこそ、改めてデータ前処理を勉強することに価値があります。
2018年4月27日に日本でレビュー済み
Amazonで購入
製造プロセスデータの分析を主にやっております。
前処理関連は本当にめんどくさいものです。理由はケースバイケースですが、大体
・条件に応じてコードの使い分けを要する(joinまみれの横長か、unionまみれの縦長になる)
・処理が下手だとすぐメモリアウト(うまければ明日から数百億行を処理しろと言われるので結局無理)
・無茶ぶりに耐えられる人間が少ない
が、敬遠される原因かなあと考えております。
こうならないためには、まず
・全データを用いてトライアルやらなくていいでしょう、お客様のフルデータだと月1000万円単位の使用料ですが払えるんですか
・お客様の要求するレベルの自動データ分析には、最善でも月このくらいコストがかかります。みあいますか
・お客様の追加要求は、予約Webページが5分待たされる程度の負荷をかけるのですがいいですね
といった、演算コストを金銭的コストにして顧客に納得してもらう必要があります。
それは書かれていませんので、顧客のエンジニアと話し合ってください。
Awesomeなエンジニアがいないのであれば、さっさと手を引きましょう。
前処理関連は本当にめんどくさいものです。理由はケースバイケースですが、大体
・条件に応じてコードの使い分けを要する(joinまみれの横長か、unionまみれの縦長になる)
・処理が下手だとすぐメモリアウト(うまければ明日から数百億行を処理しろと言われるので結局無理)
・無茶ぶりに耐えられる人間が少ない
が、敬遠される原因かなあと考えております。
こうならないためには、まず
・全データを用いてトライアルやらなくていいでしょう、お客様のフルデータだと月1000万円単位の使用料ですが払えるんですか
・お客様の要求するレベルの自動データ分析には、最善でも月このくらいコストがかかります。みあいますか
・お客様の追加要求は、予約Webページが5分待たされる程度の負荷をかけるのですがいいですね
といった、演算コストを金銭的コストにして顧客に納得してもらう必要があります。
それは書かれていませんので、顧客のエンジニアと話し合ってください。
Awesomeなエンジニアがいないのであれば、さっさと手を引きましょう。
2023年3月19日に日本でレビュー済み
Amazonで購入
各項目が、以下のような構造になっているため、学習が進めづらい。
やりたいこと
└SQL
└R
└Pythton
やりたいこと
└SQL
└R
└Pythton
非常に煩わしかった。あと、本のビジュアルと中身が合っていない。
おそらく、従来あった逆引き時点的なイメージで購入される方も多いとおもうが、
ライトな入門書である・・・読み応えはなし。
コードもせめてnotebookで書かれていれば学習しやすかったが、pyファイルである。
中身は悪くないとは思うけれど、学習するという視点では人に勧めづらい。
他の方も書かれていたが、なにをもってAwsomeとするのか、ケースバイケースなのだが、
初学者に対して、言い切っちゃダメだろう・・・というところも散見される。
一通り学習して、抜け漏れがないかチェックするのには役立つかもしれないが、
価格には満たないというのが私の感想。
やりたいこと
└SQL
└R
└Pythton
やりたいこと
└SQL
└R
└Pythton
非常に煩わしかった。あと、本のビジュアルと中身が合っていない。
おそらく、従来あった逆引き時点的なイメージで購入される方も多いとおもうが、
ライトな入門書である・・・読み応えはなし。
コードもせめてnotebookで書かれていれば学習しやすかったが、pyファイルである。
中身は悪くないとは思うけれど、学習するという視点では人に勧めづらい。
他の方も書かれていたが、なにをもってAwsomeとするのか、ケースバイケースなのだが、
初学者に対して、言い切っちゃダメだろう・・・というところも散見される。
一通り学習して、抜け漏れがないかチェックするのには役立つかもしれないが、
価格には満たないというのが私の感想。
2020年9月12日に日本でレビュー済み
Amazonで購入
プログラムコードを動かそうとしてもなぜか動かない。コードが動かない原因のあたりはついているけれどもどう処理するのが一番ベストなのだろうか?そんな疑問に答えてくれるのが本書です。大抵の場合においては、エラーメッセージからググって、答えに近いサンプルコードを拾い出してくることになるけれども、本書ではそういった処理の方向性(小技)が体系的にまとまっています。ただし、一方で説明内容を詰め込み過ぎているきらいがあり、初心者には不親切なところもあるので、ある程度、コーディングの経験を積んだ実務者が利用するのがいいと思いました。
2018年6月21日に日本でレビュー済み
Amazonで購入
自身のような「(情報システムのプログラミング経験は豊富だが)分析のための前処理はうとい」人には非常に参考になると思います。
エッセンスを吸収したらすぐに手放すつもりでしたが手元においておくことにしました。(笑)
ただ、以下の様な点が気になったので次回作の期待を込めて☆1つ減らしました。
(1)レビューされていない
以下の様な単純なミスがあります。おそらく第三者のレビューはなかったのかと思います。そのせいか全体を通して表現の揺れやいいまわしが洗練されていない印象を受けました。(内容がよいだけに勿体無いなと)
『本書では次の4種類の補完方法について解説します。』→ 実際には6種類
『カテゴリ化に対応していないので、★カテゴリ化★の方法をしっかり身につけましょう』 ★部分は「ダミー変数化」 が正しい
(2)厳密でない
例えば「pythonでは、ブール型はbool、カテゴリ型はcategory型が提供されている」という記載がありますがpythonにはcategory型は存在せずライブラリ(pandas)が提供する型です。こういった混乱を招く雑な表現が少なくありません。
(3)コードの良し悪しの基準が恣意的
全体を通して「これは非AWESOME(もしくはAWESOME)なコード」という説明がなされていますが、判断基準が恣意的というか一貫性がないと感じました。
「計算量は多いけど簡潔で可読性が高いのでAWESOME」「簡潔でないが計算量が少ないのでAWESOME」という感じ。どっちやねん!と。笑
(4)Awesomeが微妙な場合がある
「改変が容易なのでAWESOME」と主張しているコードで何度も同じ列名をタイプしてたりします。この場合は、コードを関数化して列名を引数にして使い回すかつ汎用的(同じ処理を違う列でも適用できるようにする)にするのがAWESOMEですね。
(5)冗長
箇条書きや表形式にしたほうが簡潔に表現できることも文章で記述されているので無駄に長い。
本書の内容とは関係ありませんが、上述したような指摘はプログラマの世界では「曖昧・冗長・一貫性がない」と批判されても仕方がない恥ずかしい事ですが、データサイエンティストという職業では重視されない(=扱っているのが確率の世界なので厳密さを求められない=>曖昧さがむしろ「柔軟」として評価される)のかな?なんて思いました。
次回作に期待します。個人的には「外れ値の扱い方」が薄かったのでそのあたりの考え方や方法論・ノウハウを学びたいと思いました。
エッセンスを吸収したらすぐに手放すつもりでしたが手元においておくことにしました。(笑)
ただ、以下の様な点が気になったので次回作の期待を込めて☆1つ減らしました。
(1)レビューされていない
以下の様な単純なミスがあります。おそらく第三者のレビューはなかったのかと思います。そのせいか全体を通して表現の揺れやいいまわしが洗練されていない印象を受けました。(内容がよいだけに勿体無いなと)
『本書では次の4種類の補完方法について解説します。』→ 実際には6種類
『カテゴリ化に対応していないので、★カテゴリ化★の方法をしっかり身につけましょう』 ★部分は「ダミー変数化」 が正しい
(2)厳密でない
例えば「pythonでは、ブール型はbool、カテゴリ型はcategory型が提供されている」という記載がありますがpythonにはcategory型は存在せずライブラリ(pandas)が提供する型です。こういった混乱を招く雑な表現が少なくありません。
(3)コードの良し悪しの基準が恣意的
全体を通して「これは非AWESOME(もしくはAWESOME)なコード」という説明がなされていますが、判断基準が恣意的というか一貫性がないと感じました。
「計算量は多いけど簡潔で可読性が高いのでAWESOME」「簡潔でないが計算量が少ないのでAWESOME」という感じ。どっちやねん!と。笑
(4)Awesomeが微妙な場合がある
「改変が容易なのでAWESOME」と主張しているコードで何度も同じ列名をタイプしてたりします。この場合は、コードを関数化して列名を引数にして使い回すかつ汎用的(同じ処理を違う列でも適用できるようにする)にするのがAWESOMEですね。
(5)冗長
箇条書きや表形式にしたほうが簡潔に表現できることも文章で記述されているので無駄に長い。
本書の内容とは関係ありませんが、上述したような指摘はプログラマの世界では「曖昧・冗長・一貫性がない」と批判されても仕方がない恥ずかしい事ですが、データサイエンティストという職業では重視されない(=扱っているのが確率の世界なので厳密さを求められない=>曖昧さがむしろ「柔軟」として評価される)のかな?なんて思いました。
次回作に期待します。個人的には「外れ値の扱い方」が薄かったのでそのあたりの考え方や方法論・ノウハウを学びたいと思いました。
2018年4月25日に日本でレビュー済み
Amazonで購入
SQLを主に仕事で使っておりますが、そのSQLを別の言語に置き換える場合、知識のマッピングが出来るので重宝します。
SQL、R、Pythonと知識をそのまま移行できる点が素晴らしいと感じました。
この本は発売前から注目しておりました。発売日前なのにベストセラーとなっていたので驚きです。
それぐらいデータ分析の現場は前処理が重要で、かつ仕事の7割8割は前処理なんじゃないかと思うぐらいの時間を割いています。
その問題に対して、ダイレクトに突き刺す良い本だと感じました。
SQL、R、Pythonと知識をそのまま移行できる点が素晴らしいと感じました。
この本は発売前から注目しておりました。発売日前なのにベストセラーとなっていたので驚きです。
それぐらいデータ分析の現場は前処理が重要で、かつ仕事の7割8割は前処理なんじゃないかと思うぐらいの時間を割いています。
その問題に対して、ダイレクトに突き刺す良い本だと感じました。
2020年1月18日に日本でレビュー済み
Amazonで購入
様々なデータ処理のレシピを示し、SQLと対比してRやPython(Pandas)だとどう書くのか?非常に分かり易く解説している。また、各レシピごとそれぞれの言語で何種類かの方法を示し、更には、各々段階的により良いコードを明確な理由と共に説明している。他にないデータ処理の良書で、前処理に限らず使える。