「データ可視化」カテゴリーアーカイブ

[可視化] ヨーロッパ各国で「子供の恋人が○○人でも気にしないか?」を訊ねた結果の地図

reddit の地図セクションで bezzelford さん発表したヴィジュアライゼーション。

この地図は、「あなたの子供が黒人と付き合っていたとして、問題ない(comfortable)と思いますか?」に対する回答で、問題ない人の割合が高いほど緑に、低いほど赤に塗り分けられています。

緑が濃い国ほど、気にしていないということですね(あるいは「気にしてないように振る舞う」可能性もなくはないですが)。同じヨーロッパと言っても、8割は気にしないスウェーデンやイギリスの寛容さと、7割が気にするチェコ・スロバキア・ブルガリア等では大きく違うことが見て取れます。

ヨーロッパで黒人がどう扱われようと、日本人の自分には関係ない? ではこちらはどうでしょう

「あなたの子供がアジア人と付き合っていたとして、問題ない(comfortable)と思いますか?」への回答。

黒人とアジア人の許容度の差は平均で5%ぐらいなので、「子供の交際相手として黒人はだめだがアジア人ならOK」という人の割合は、ヨーロッパ人が20人いる中で1人ぐらいということなんでしょう。人種差別の少ない社会は、日本人にとっても助かる社会と言えるのでは。

reddit のコメント欄では、「国によってその国の言葉で訊ねただろうから、翻訳のニュアンスが違うせいでこんな差がついたのでは?」と言った意見も出ています。「さすがにこんなひどくないだろう」という人もいれば「私も○○人だが、○○人の多くはレイシストだ」みたいな人も。

また、「アジア人(Asian)と言っても国によってさまざまで、たとえばイギリス人ならインドやパキスタン人を最初に思い浮かべるのでは?」とか、「そんなことはない、中国人や日本人をまず思いつく」という議論もありました。

元の投稿では、イスラム教徒、ユダヤ教徒についての地図もあります。

元データについて

このデータ、適当なアンケート結果ではなく、EU が実施した「EU における差別 2015年」という大きな調査 [pdf] の中の一部のようです。

24ページ目に、地図を塗り分けた元データの表があります。

東欧諸国の方で興味深いのは、「子供の恋人が白人だったら?」という質問ですら、「問題ない」が90%を割るところがいくつもあるところで、仮定の質問でも子供の恋人なんて考えたくない、のかもしれません。(ちなみにEU平均でも92%)

トップ100万ウェブサイトのrobots.txtを解析した人とその結果

An Analysis of the World's Leading robots.txt Files(世界のリーダーたちの robots.txt ファイル)というブログで、世界の上位100万サイトの robots.txt を解析したベン・フレデリクソンさん(Ben Frederickson)の話が出ていました。

フレデリクソンさんは、解析結果から、3つの面白い気づきを紹介してくれています。

Googlebot にしか見せないサイト

Googleボット以外のすべてのボットを拒否する、という設定のサイトは意外に多いそうです。

大手サイトでは例えば、フェイスブック(robots.txt)が厳しいということ。実際に見ると Apple や Baidu など有名どころのクローラーはいくつか受け付けているのですが、基本的には「その他は不許可」という指定をしています。

アメリカ国勢調査のサイトも、Google, Yahoo, Microsoft の3社のbotしか受け付けておらず、例えば真剣にGoogle の対抗馬を目指しているような DuckDuckGo の bot はアクセスできません。

記事中に、主要言語ごとの人気サイトで DuckDuckGo のクローラを許すかどうかの表があるのですが、かなり多くのサイトがアクセスを禁止しています。DuckDuckGo を排除しているというわけではなく、よく知らないものやマイナーなものはすべて不許可、という態勢ですね。

今後、新しい検索エンジンや、その他のクローラーを使ったサービスが出てきても、多くのサイトはアクセスが禁止されているのが現状ということですね。

みんながブロックするクローラー上位ランキング

より多くのドメインで拒否されているクローラーは何だろう? という集計もしています。一番人気は MJ12bot 。続いて AhrefsBot, Baiduspider, Nutch… と続きます。

日本語のブログでも、このあたりの bot を止めたい、アクセスが多すぎて困る、という記事を見かけるので、いろいろなサイトの運営者が迷惑と思っているのでしょう。Google bot なら見に来ればその後の実ユーザーの来訪も見込めますが、ユーザーを連れてこないのにボットに絨毯爆撃のようにアクセスされても困るだけですからね。

サイトを丸ごとダウンロードするようなツールの bot も、禁止リストに入っていることが多いそうです。

robots.txt で求人

Pinterestなど、robots.txt のコメントで人間向けの勧誘をしているサイトも多いようです。

ピンタレストは採用中!(Pinterest is hiring!)

ロボット用のファイルを読んでいるあなたがもし人間なら、デジタルオーシャンで働くべきだ

私たちもロボットは好き。私たちとボットについて語り合いましょう(Angel.co)

HTMLのコメントにもこういうのありますが、実際これで採用につながることってあるんですかね?

ソースコード

Pythonで書かれた robots.txt クローラのコードは Github で公開されています。

via Hacker News

国別の旅行危険リスクを可視化した世界地図 Travel Risk Map

保険会社International SOSが公開した旅行リスク地図(Travel Risk Map)

保険会社として多くの事件事故データを持っていて、それを使って判定しているのでしょうね。OpenStreetMap ベースの世界地図の上で、医療(medical)、治安(security)、道路の安全(road security)の三つのリスクの多寡を切り替えて表示できます。

国によっては州や地域でさらに細かくリスクが分類されていたりもします。

さて、旅行先としての日本の安全性はどう判定されているのか、と見てみると、

  • 医療: リスク低(low)
  • 治安: リスク低(low)
  • 道路の安全: リスクとても低(very low)

と、ありがたいことに世界でもトップレベルのリスクの低さであることがわかります。

ただし、治安の地図で見ると上には上がいて、low の下に insignificant (とるにたりない。統計的に有意でない)、というカテゴリーがあります。この insignificant の黄緑色で表示されているのは、以下のような国々

  • ノルウェー
  • フィンランド
  • デンマーク
  • スイス
  • スロベニア

他にルクセンブルク、リヒテンシュタイン、サンマリノ、アンドラ、モナコ、なんかもこの「超安全」カテゴリでしたが、これらの小国はまあ小さいから可能なところはあるかと思います。

地図を紹介しているMaps Maniaでは、各国の政府が自国の旅行者向けにこういったリスク情報を流している(例: 英国)ので、それとの併用を勧めています。

日本の場合は、外務省の公開している海外安全ホームページがそう。より詳細な情報に日本語でアクセスできるので、目的国がはっきりしている場合はこれでもいいのですが、興味的につらつら見るには、冒頭のインタラクティブな地図の方が直観的で楽しそうです。

日本のサイトでは日本の危険情報は載せませんから、「世界の国や周辺の国と比べて日本の安全性はどうなんだろう」という興味が沸いた時は、前掲の地図や諸外国の政府の情報が役に立つかもしれないですね。

via Maps Mania

カリフォルニア大火災の前後を衛星写真で見比べるサービス

カリフォルニア州サンタ・ロサで発生した大規模な山火事、40人以上の死者を出し、一週間経ってもまだ完全に収束してはいないということです。約10万人が避難し、多くの家が焼けてしまったということで、被害の映像もいろいろと入ってきています。

10月12日、火事の後の衛星写真を使ってRobin Kraftさん(@robinkraft)が作ったのは、この被害地域の衛星写真を火災前と後で一つに並べ、マウス操作でオーバーレイされた二つの画像を見比べることができるサイトです。

左にスライドすると、火事の後の写真が見られます。デフォルトで表示される地域は、地域中の家が燃えて灰となってしまっていますが、画面の左端のあたりでは、延焼が止まって家々が残っています。

赤いところは木々の緑が赤方向にずれているためで、赤外線カメラでの撮影による影響ということです。家が次々と燃えても、家の間の木々は結構残っているものなんですね。

こちらのニュース記事には、山火事が起こった領域が地図に描かれていますが、複数の離れた箇所で発生し、それぞれが大きく燃え広がっていることがわかります。

画像比較スライダー(image comparison slider)などと呼ばれる、比較的新し目のUI、ニュースサイト等でもよく見るようになってきましたが、このような事件で被害の深刻さを見せるには大きな威力を発揮するようです。

via Maps Mania

人間の顔を、世界地図の「図法」で表すとこうなる、というコード

Projection face! は、人間の顔を世界地図の上に描いて、図法を変えたらどう歪んで見えるか、というのを見せてくれるウェブサイトです。

図法というのは、メルカトルとかモルワイデとかいうアレですね。代表的なものは社会科で習ったと思います。

D3.js を使って63もの図法で表示してくれますが、ソースコードも公開されています。

一個ずつ選択するのではなく全部を並べて見たい人のために一ページにおさめられたものがこちらになります。

球の表面を二次元で表そうとした時の図法、こんなにたくさんあってそれぞれ名前がついているんですね。

顔をマップしてみるというのは、元々は、1921年に書かれた論文 “Elements of Map Projection”に描かれていたものが初出だそうです。100年近く前ですから、この時のプロットは当然手書きでしょうね。

geojson形式のデータを用意すれば、別の絵についても簡単に同様のプロジェクションが作れます。さまざまな図法の違いの体感もできるし、架空の世界の地図で、真東がどこになるか、等距離の場所はどこになるか、等を考えるのに使えたりするかもしれません。

via FlowingData

デマが社会に広がっていくモデルを体験できるインタラクティブな図

Post-truth は、ポスト真実がソーシャルネットワーク上でどのように広がっていくかを、簡単なモデルでシミュレートできるサイトです。

図は人々がソーシャルネットワーク等でつながっている状態を示しています。丸が人で、丸と丸をつなぐ線がソーシャル上の友人関係。

濃い紫の人は詳しい人(Aware)、薄い紫の人は詳しくない人(Unaware)で、右下のスライダーで社会にいる人たちがどれぐらいその問題について詳しいか、を調整できます。

その上で、ネットワーク上のどこかにデマ(=「感情に訴えたポスト・トゥルース」)を投入すると、それをさらに自分の知人にシェアする人(赤色)と、シェアしない人(白色)に分かれます。

判っている黒紫の人が多い問題では、デマはなかなか広がりません。問題に詳しくない薄紫の人が多いと、あっという間に赤色が広まっていき、世の中の多くの人がそのデマに触れることとなります。その人本人が信じるかどうかはともかくとして、「友達が何人も言っていた」事になってしまうわけです。

このシミュレーターで何度か遊んでみると、デマを広げて社会を真っ赤にするためにはどうしたらいいか、もわかってきます。色が薄くて(=理解が浅くて)、色が薄い友人を多く持つ人にデマを投下すると良く広がっていくわけです。また、一度の投下ではあまり広がらなくても、別のところに2度、3度と投下し続けると、ある時うまく伝搬して広がっていったりもします。

社会の中で詳しい人を増やすことはもちろん対策になるのですが、どんな問題に対しても人を詳しくする、というのは実際問題不可能でしょう。となると、あとできることは「良く知らない事は広めない」かと思いますが、驚きをもって共有したい嘘ニュースが多数流れてくるソーシャルネットワークでそういう態度を取れる人は多くなく、その結果としてデマが途切れることは無いのかもしれませんね。