Hatena::ブログ(Diary)

情報グラフィックス・ノート このページをアンテナに追加 RSSフィード

2013-02-06

インフォグラフィックの注意点

 インフォグラフィックというデザインの一分野がある。魅力的な色や形、イラストなどを使って、ある情報(データなど)に見る人を引きつけ、わかりやすく、あるいは面白く情報を伝えようとするものだ。

 ちょっと持て囃されているところがあるけれども、作る側も見る側もいくつか注意しないといけない点があるとわたしは思っている。

 たとえば、こんな例がある。1987年以降に倒産したアメリカの巨大企業の資産額を比較したものだ。縦軸が年、船の大きさが資産額を表している。

f:id:info-d:20130206135232j:image

→拡大はこちら

 一見してまずデータが非常に少ない。20社とその資産額、倒産年、事業領域を挙げているだけで、そのくらいの比較であれば表で十分に用が足りるだろう。

 資産額を表す船の大きさは強引に6つに限定している。資産額$1050億ドルと$3270億ドルでは資産額が3倍も違うのだが(しかも1000億ドル単位≒10兆円単位で)、同じ船の大きさになってしまっている。どういう基準で6つのデータの範囲を設定したのかはわからない。

 この図の作り手が言いたかったメッセージはこういうことだろう。「みんな沈没してしまいました〜(WAHAHAHA)! でも、巨大なものからそれほどでもないものまでいろいろあるんですよ。リーマンブラザーズはタイタニックでしたねぇ〜!!」。いわば、これはイラストを使った駄洒落である。

 きちんと見ると、雑でデータ量に乏しい図である。「インフォグラフィック」と名乗っているものにしばしば見られる特徴だ。

 注意すべきと書いたのはこの点だ。インフォグラフィックというのは情報の広告宣伝である。広告宣伝がたいてい製品やサービスのセールスポイントを絞り込み、誇張したり、イメージづけをしたり、ストーリーを恣意的に語ったりするのと同じように、インフォグラフィックも表出するデータを絞り込み、誇張したり、イメージづけしたり、ストーリーを恣意的に語ったりしようとする。広告宣伝と同じく、「こっちを見て!」と声高に叫ぶ。しかし、広告宣伝を見ただけではその製品やサービスを本当には理解できないように、あるいはそのほんの一部(たいていは作り手の意図した一部)しか理解できないように、インフォグラフィックもデータそのものの豊かさやそこから引き出せる解釈の多様さを捨てるところからスタートしている(なぜなら絞り込まなければ強いメッセージを打ち出せないからだ)。

 インフォグラフィックは、エドワード・タフティの著書や、マニュエル・リマの「Visual Complexity」が取り上げているような豊富なデータの面白さ、美しさとは全然別のものだ。タフティは、データを詰め込め、それがもし見にくいならばデザインの失敗である、と主張している。インフォグラフィックはそれとは逆の手法である。子どもに薬を飲みやすくするシロップ薬みたいなものでもある。

 あるいはこうも言える。インフォグラフィックはたとえるなら小説ではなく、小説のあらすじみたいなものだ。小説を読んでいるときのもやもやとして複雑な情動の起伏をあらすじで体験することはできない。

 インフォグラフィックを作る人は情報の広告宣伝をしているのだと意識し、見る人は広告を見ているのだと意識したほうがよいと思う。広告は、あらかじめ広告であると理解したうえで向かったほうが正しい理解に近づけるだろう。

Envisioning Information

Envisioning Information

Visual Explanations: Images and Quantities, Evidence and Narrative

Visual Explanations: Images and Quantities, Evidence and Narrative

Beautiful Evidence

Beautiful Evidence

2012-03-04

ミクロ・マクロのデータ表現手法

 データ・グラフィックスに「ミクロ/マクロ」のデータ表示という考え方がある。非常に細かくデータを掲載して細部のデータを子細に見られるようにする(ミクロ)と同時に、引いて見たときに全体的なパターンを認識できるようにする(マクロ)というものだ。

 例えば、アメリカのIRIS(Incorporated Research Institution for Seismology、地震学統合調査機関とでも訳せばいいだろうか)という研究機関が、地球全体のマグニチュード4以上の地震をまとめたデータ・グラフィックスを日々更新している。

f:id:info-d:20120304153427j:image

→ IRIS Seismic Monitor

 赤い円が今日、オレンジが昨日、黄色が過去2週間以内、紫が過去5年以内の地震である。2週間以内のものについては円の大きさでマグニチュードの規模を表している。

 非常に細かなデータの集積である。そして、全体を眺めたときに地球上の地震頻発地帯のパターンを見て取ることができる。地震が頻発するのはプレートの外縁部であり、地表は手製のつぎはぎのサッカーボールのように薄片が重なってできていることがわかる。

 しかし、この地震モニターはデータ・グラフィックスとして完成度の低いところがあるように思う。円周の幅が広すぎて、円と円の重なり合っているところが観察しにくいのだ。視認できるぎりぎりまで円周を細くしたら、細部まで観察でき、全体のパターンだけでなく、地域ごとの地震発生度もある程度見て取れたろう。ミクロ/マクロの視点からするとミクロの表現が不完全である。もう少し表現方法に気を配れば細部まで表現できるだろうに、もったいない気がする。

 こういう細かいデータを集積する際は、前回書いたスモーレスト・エフェクティブ・ディファレンスの考え方が役に立つ。

→ スモーレスト・エフェクティブ・ディファレンス(効果的最小差)とは

 視覚的な差異をぎりぎりまで切り詰めて表現することで、より細かなデータを一枚の絵に詰め込められるようになる。理屈は簡単で、たとえば、下記の画像を、データのプロットを拡大したものだと考えてみていただきたい。

f:id:info-d:20120310170056j:image

 上のように、データのポイントが小さければ、各ポイントの位置関係や、ポイント間の距離を捉えやすい。ミクロのデータを精細に表現できる。

f:id:info-d:20120310170058j:image

 しかし、ポイントを大きくすると、ポイントの正確な位置や、互いの関係を捉えにくくなる。

f:id:info-d:20120310170057j:image

 さらに大きくすると、重なり合ってしまい、どこがポイントなのやらわからなくなってしまう。

 グラフィックに大量のデータを盛り込むのなら、ひとつひとつのポイントを、きちんと視認できるぎりぎりの小ささまで絞ることが肝要だ。そうすることで、細部の観察も、全体のパターンの認識も可能になる。ミクロ/マクロのデータ表現を行うには、ひとつひとつのデータの違いを、認識できる範囲でなるべく細かく表現することが重要といえる。

 このブログで紹介したことのあるデータ・グラフィックスの中では、ブラジルの新聞Estado de S.Paulo紙の"Onde atuam os 736 jogadores da Copa 2010"がミクロ/マクロのデータ表現にあたる。サッカーのFIFAワールドカップの代表選手達がどこの国のリーグに所属しているかを表現したものだ。

f:id:info-d:20120304142910g:image

→ estadao.com.br - Onde atuam os 736 jogadores da Copa 2010

 上の段の国旗は各国の代表チーム、下の段の国旗は各国リーグを表している。ラインを上からたどれば、各国の代表選手が普段どこの国のクラブでプレーしているか、下からたどれば、各国のリーグがどこの国の代表選手を輩出しているかがわかる。ラインの処理が非常に細かいため、全体のパターンと同時に細部の細かな観察が行える。洗練されたデータ表現だと思う。

 

 スコット・マンリーの「Asteroid Discovery From 1980 - 2010」は、1980年以降に発見された小惑星を動画で見せている。

D

 細部のデータを見せるというよりは、全体のパターンを見せることに重点を置いているようだ。データの膨大さと、動画という限界もあるが、点の輝き具合や色などでもう少し細部を見せる工夫ができるかもしれない。

 ミクロ/マクロのデータ表示は、ミクロの部分をどれだけ細かく見せられるかにかかっている。見て取れる範囲でなるべくデータを「詰め込め!」というのがミクロ/マクロを実現する胆である。だからこそ、細かな部分まで見せるためのスモーレスト・エフェクティブ・ディファレンスの手法が大切となるわけだ。

2011-11-06

スモーレスト・エフェクティブ・ディファレンス(効果的最小差)とは

Excelのデフォルトの機能を使って表やグラフを作ると、随分と見にくい表やグラフができてしまうことがある。作った側が見にくさに気づいていないことも多い。見にくい表やグラフは、データの内容を読み取って考える妨げとなるから、なるべくなら見やすくするに越したことはない。

 表やグラフがちょっとしたデザインや配慮で随分と見やすくなることもある。毎度の受け売りで恐縮だが、アメリカの情報デザインの巨匠、エドワード・タフティの言う「スモーレスト・エフェクト・ディファレンス(the smallest effective difference;「効果的最小差」とわたしは訳している)」の考え方が参考になると思う。

 スモーレスト・エフェクト・ディファレンスとは、タフティの定義によると、「全ての視覚上の相違を可能な限り微妙に、しかし明瞭で効果的にする」デザイン戦略である。彼の著書「Visual Explanations」に短い一章がある。

 こういう表を例にして説明してみよう。


f:id:info-d:20111106134253j:image


 この手の黒々とした罫線を使った表をよく見かける。数字間の比較をしようとすると、太い罫線に邪魔されて考える力が落ちてしまう。表を作る側が数字の読みやすさに無頓着なのだろう。

 表で重要なのは中のデータであって、罫線ではない。この手の表は罫線を細くし、グレーにするだけでだいぶ見やすくなる。


f:id:info-d:20111106134249j:image


 Excelの罫線の設定で、最も細い実線を選び、線の色を「25%灰色」にした。ほんの一手間かけるだけで、数字の読みやすさは全然変わる。

 さらに、この表についていえば、縦の罫線は不要だろう。


f:id:info-d:20111106134252j:image


 なぜならば、数字の並びが揃っており、見えない縦罫線の役割を果たしているからだ。


f:id:info-d:20111106134250j:image


 横の罫線の多くもいらないだろう。


f:id:info-d:20111106134245j:image


 やはり、数字の並びが見えない横罫線の役割を果たしている。


f:id:info-d:20111106134251j:image


 ただし、このままでは表頭の項目「給与所得者数」「給与額」「税額」の範囲がわかりにくい。罫線にわずかなスペースを入れると、項目間の差を表現できる。


f:id:info-d:20111106134246j:image


 だいぶすっきりして数字を見やすくなったろう。罫線に思考力の何割かを邪魔されることもない。実は、これらの操作は全てExcelで行える。


 次のような類のグラフ表現もよく見かける。


f:id:info-d:20111106134248j:image

 やはり黒々とした罫線が邪魔をしている。また、データ量を伝えるということから言えば、棒のそれぞれを色替えする意味もない。

 罫線を細いグレーにし、棒グラフの背後に持っていく。縦罫はこのグラフでは意味がないので削除する。棒の色を揃える。文字もここまで黒々とする必要はないから、書体を変え、特に数字部分は容易に読み取れる程度の色、大きさとする。


f:id:info-d:20111106142709j:image

 繰り返しになるが、表やグラフで重要なのはデータそのものであって、罫線や派手な色づかいではない。

 スモーレスト・エフェクティブ・ディファレンスとは、データそのものを読み取って考えやすくするために、あくまでデータ表現の効果や明瞭さを保持する範囲内で、極力違いの表現を抑えることである。データのS/N比(信号対ノイズの比率)を上げるための手法と言ってもよい。データ以外の部分の表現をなるべく控えめにすることで、データ部分を相対的にクリアに表現できれば、見る人はデータの読み取りと思考に集中できるわけである。

 まあ、ややこしい理屈は置いておいても、罫線を細く、薄くするだけでたいていの表やグラフは見やすくなる。一度、お試しあれ。

Visual Explanations: Images and Quantities, Evidence and Narrative

Visual Explanations: Images and Quantities, Evidence and Narrative

2011-07-18

チャートジャンクとは何か

 チャートジャンク(chartjunk)とは、図表が情報を伝えるうえで不必要な視覚的要素、あるいは情報を読み取るうえで邪魔になる視覚的要素のことを言う。"chart"は図表、"junk"はガラクタ、くず物という意味で、わたしは「図ゴミ」と訳している。元々はアメリカの情報デザインの大先生、エドワード・タフティが提唱した概念で、彼の情報デザインに対する実質的な考え方がよく表れていると思う。見やすい図表を作るうえで参考になる視点でもある。見ている図表がわかりにくいとしたら、それはチャートジャンクのせいかもしれない。

 日本の名目GDPと実質GDPについてのこういう折れ線グラフを例にして説明しよう。


f:id:info-d:20110718175135p:image


 典型的なチャートジャンク=図ゴミは、データと実質的に関係のないイラストを入れることだ。


f:id:info-d:20110718175139p:image


 たとえば、このイラストは、データの内容についてほとんど何も伝えていない。伝えているとしたら、せいぜいGDPが上がった、下がったということくらいだが、もちろん、グラフを見ればそんなことは誰にでもわかる。お遊び、悪ふざけの類であって、見ようによっては読者の知的レベル(およびユーモアのレベル)を馬鹿にしているとも言える。たとえよくできたイラストであっても、見る人がデータではなくイラストに気が行ってしまい、データを丁寧に読み取ったり、それについて考えたりする機会を削いでしまうとしたら、本末転倒だろう。

 グラデーションも、たいていは情報を伝えるうえで役に立たない。


f:id:info-d:20110718175136p:image


 グラデーションがデータについて何かを伝えうるとしたら、量の連続的変化についてだろう。しかし、人間の視覚は、色の変化を量の変化として正確に認知できない。連続的変化を伝えるのなら、他の手法を使ったほうがいいと思う。

 イラストやグラデーションは、図表を作る側がやらなければいいだけの話だが、知らず知らずのうちに図表がチャートジャンク化してしまうこともある。

 たとえば、グラフの折れ線部分が太いと、量を正確に読み取る邪魔になる。下の例では、グラフの線(というより面)のどの部分が正しい金額を表しているのだろうか? 線が太すぎるせいで、重なっている部分も読み取りにくくなってしまっている。


f:id:info-d:20110718175138p:image


 基本的に折れ線はデータを違和感なく読み取れる太ささえあれば事足りる。太い折れ線は、データを読み取るうえで不必要な要素=チャートジャンクとなる。

 太い黒々とした罫も、グラフを読み取る邪魔になる。


f:id:info-d:20110718175137p:image


 この例では、太すぎる罫のせいで気が散ってしまい、落ち着いてデータを見たり、考えたりしにくくなってしまっている。グラフにおける罫の機能というのは、あくまで量を読み取るための補助だ。グレーの、読み取れるぎりぎりの細さがあれば十分である。

 ストライプの面もチャートジャンクになりやすい。目がちらちらして読みにくく、じっくり考えようとしても、気が散ってしまう。


f:id:info-d:20110718175140p:image


 PCによって作図が簡単になったせいか、最近は企画書などで立体化したグラフをよく見かける。


f:id:info-d:20110718175134p:image


 しかし、考えてみていただきたい。このグラフの立体部分やグラデーションが、何か実質的な情報を伝えているだろうか? むしろ意識の何割かをそうした図形表現のほうに振り向けてしまい、データを読み取ったり、考えたりする力を削いでいるのではないか。グラフの立体化は、PCと簡便なソフトウェアによって広まった現代の悪習のひとつだと思う。

 チャートジャンクには、太い折れ線や罫のように、作図する人の不注意によるものもある。しかし、イラストや立体化のように、意図して作られるものもある。なぜ図表の作り手はそうした余計な処理をしてしまうのだろうか? おそらく、最大の理由は図表のデータが薄くて、「間が保たない」と感じるからだろう。しかし、少々意地の悪い言い方をすれば、余計な処理をしないと間が保たないような図表というのは、そもそも間が保たないデータしか扱っていないのだと言える。イラストも立体化も、そういう意味では、糊塗あるいはごまかしである。イラストを入れたり、立体化している時間があったら、データを充実させることに振り向けるか(たとえば、別次元のデータを重ね合わせて比較を可能にするのもひとつの方法だ)、あるいはいっそ間の保たないまま表示して、間の保たないデータ量しか手に入っていないことを明示したほうがよほど実質的だと思う。

 チャートジャンク=図ゴミは、情報グラフィックスについて考えるうえで重要な概念だ。もし図表を扱う機会があるなら、ぜひ一度、チャートジャンクが含まれていないか、デザインを見直してみていただきたい。図表によって何を伝えるのか、あるいは図表をもとに何を思考するのか、それによってどんな仕事をしようとしているのかについて、あらためて考えてみる機会にもなると思う。

2011-06-25

ハルバースタムと単純化について

 デービッド・ハルバースタムの「静かなる戦争」(War in a Time of Peace)を読んだ。旧ユーゴスラビアの内戦を中心に、アメリカのブッシュ(父)〜クリントン時代の外交について取り上げた2001年のノンフィクションである。

 ハルバースタムの著作は、例えばベトナム戦争について取り上げた「ベスト&ブライテスト」もそうだが、「つまり、こういうことである」と簡単にまとめることができない。多くの人物の絡み合いが、人物像と豊富なエピソードとともに記され、結果として大きな歴史的出来事へと至る過程が描かれる。読む者は長いストーリーを読み終えて、いささか漠とした全体像をつかむ。いわば、細かな要素の積み重ねによって全体を描き出すという形である。教訓や結論のようなものを引き出すこともできないわけではないが、それはあくまでいささか乱暴な操作を経たまとめにならざるを得ない。

「静かなる戦争」を読み終えて、情報グラフィックスにもいささか関係する「単純化」について考えた。

 私の抱くハルバースタムの著作の印象は、図式化するとこんな具合である(あくまで概念を描いてみただけで、ハルバースタムの著作に実際に基づいているわけではない)。


f:id:info-d:20110625155506p:image


 多くの個人(円)のキャリアや人間性や行動が、豊富なエピソード(グレーの小さい四角)で肉付けされながら記され、個人と個人の関係が描かれる。そして、多くの個人がどのように関わって歴史的事件(白い大きな四角)が起きたかが記される。作品に登場する個人、エピソード、歴史的事件の数は豊富で、全体としてある歴史の流れが姿を現すという形になっている。情報デザインで言えば、ミクロなデータを積み重ねることによって引いて見たときにマクロの全体像が現れる「ミクロ/マクロ」的なデザインに似ている。

 個人やエピソードについては、ハルバースタムも単純化をしている。たとえば、1992年の民主党予備選挙を戦ったクリントンについてのこんな一節がある。

 クリントンの育った家庭は、アルコール中毒の義理の父親が原因で、崩壊状態だった。だから、クリントンは、争いが絶えない「崩壊家庭」の緊張を和らげる方法をはるか昔に学んでいた。したがって、同じ状態にあった民主党をまとめるくらい朝飯前であったろう。

 考えてみれば、生まれ育った家庭が崩壊していたからクリントンが民主党の緊張を和らげることができた、というまとめ方はいささか単純すぎる。当時まだ四十代だったと言っても、クリントンはほぼ政治畑だけを歩んできて政治経験がそれなりにあったはずだし、人間関係の処理の方法が家庭でだけ培われるわけでもない。逆に崩壊家庭で育った政治家なら誰でも民主党をまとめられたわけでもないだろう。こういう単純化はハルバースタムの著作の随所に見られ、おそらく、意図的に行っているのだろう。ハルバースタムの著作は膨大なソースに基づいており、単純化しなければある程度の量(といっても日本語版で900ページほどあるが)にまとめきれないということなのかもしれない。

 ハルバースタムの情報のまとめ方ははっきりしていて、エピソードや個人のある側面については思い切った単純化を行う。そして、それらを大量に集積し、要素間をつなぎ、安易な単純化のできない全体像を描き出す。丹念に描かれた油絵に似ている。そして、読む者は、豊富な取材に基づく要素と関係の積み重ねを追いながら、全体を理解していく。

f:id:info-d:20110625155508p:image

 それに比べて、こんな単純化をしている話をよく見かける。

f:id:info-d:20110625155507p:image

 エピソード、個人の数が乏しく、因果関係が非常に単純化されている。「○○が悪いから戦争になった」「○○がこうだから日本はこうなってしまった」という類の話である。一見、整理されていて「わかりやすく」見えるが、それは単に要素が乏しいからであって、ディテールはなく、それゆえに全体像は単純である。そこから引き出される結論もおそらくは薄っぺらく、浅くなりがちで、かなり間違っている場合が多いだろう。

f:id:info-d:20110625164925p:image   f:id:info-d:20110625155508p:image

左がよくある単純化した話の例、右がハルバースタム的な情報の積み重ねのやり方である。情報グラフィックスに即して言えば、やはり、右のように豊富なデータを用意することによって、リアリティがあり、現実に近似した全体像がつかめるようになるのだとわたしは思う。ディテールの積み重ねと結びつけが陰影に富む全体像を描き出すわけである。

 話は飛ぶが、右のハルバースタム的な形で、震災以来、政府や東電、あるいは原子力関係者の間で起きていることを描き出せないものだろうか。ハルバースタム的なノンフィクションは、日本のジャーナリズムでは、取材の慣行か何かで難しいのか。期待したいのだが。

2010 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2011 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2012 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2013 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |