k-takahashi's blog

個人雑記用

データサイエンティスト

最近のバズワードの一つ「データサイエンティスト」。
これについて、橋本大也氏が一般向けに書いた解説書。名前しか聞いたことのない人が読むための入門書的な位置づけのようなので、ある程度関心のある人が読む本ではないのかもしれない。


以前話題になった『その数学が戦略を決める』にも数学的分析の力は示され*1ていたが、それが一般化してきて、バズワード化したというのが現状なのだろう。
ビッグデータ活用をする専門家あたりで間違っていないから、『ビッグデータビジネスの時代』に書かれていたようなこと*2も触れられている。
入門解説書としては良いと思う。


例によって、自分用引用。

分析を提案につなぐという能力こそ、現代のデータ分析の専門職の新しさなのだと私は考えている。そういった意味では、データサイエンティストという言葉の代わりに、データアーティストという言葉を使ってもいいかもしれない。(p.32)

言いたいことは分かるけれど、うさんくささが増すような。


ヤフーの小間基裕氏のインタビューより

1つがすべての項目を処理対象にしないこと。もう1つが、すべてのデータ要素を処理対象にすることです。(p.52)

どの項目を使うかはよく考えて決める、決めたら変なサンプリングはしない、という意味。

業務改善のためのデータ分析では、分析を行う前に、営業マンや販売員にインタビューを行うのが正しい方法だ。
(中略)
仮説を得ることができる。
(p.85)

ここなんかも、上述の「提案につなげる」ための手続きと言うことなのだろう。


アブダクションの説明例としてこんなものがあった。

経営しているコンビニの売り上げが特別に高かった日があったら、経営者はそこにもっともらしい理由を想像してみることだ。
(中略)
アブダクションは説明すべき事実に対してたくさんの仮説を立てて、その中から正しい仮説を選び出す。基準は以下の4つだ。
1 もっともらしさ もっともらしい理に適った仮説
2 検証可能性 実験的に検証可能な仮説
3 単純性 より単純な仮説
4 経済性 実験に経費、時間、思考、エネルギーが節約できる仮説
(pp.93-94)

この仮説を立てるために上述のようなインタビューも有効ということだし、提案に繋がらないような仮説も有用ではないということだろう。


何がデータサイエンティストの両分では「ない」かについて、ヤフーの安宅和人氏のインタビューから

IT系のサービスというのは、世界のトレンドを眺めていれば見えてしまうモノです。ビッグデータを見ている暇があれば、むしろ、世界のトップベンチャーキャピタルが何に投資をし始めているかを見ていた方が絶対に早い。(p.181)

そりゃそうだ。

フィルターバブル問題

本書では触れられていないけれど、フィルターバブル問題も頭の片隅に置いておく必要があるな、と読みながら感じた。

*1:

その数学が戦略を決める (文春文庫)

その数学が戦略を決める (文春文庫)

*2:

ビッグデータビジネスの時代

ビッグデータビジネスの時代