「データ可視化」カテゴリーアーカイブ

インターネットのどのページ間も19クリック以下で辿ることができるという研究成果が発表される

ネットワーク科学者のアルバート・ラズロ・バラバシ教授(ルーマニア生まれのハンガリー人)が18日に発表した論文によると、ウェブ上のあるページAから別のページBへは、どんなに遠くても19個のリンクを辿ればつながる経路があるのだそうです。

彼によれば、現在のウェブ上にはおおむね1兆個の文書があり、(ページ数が全部で140億ページだという別の推計と、)それらの中でもっとも遠いノードの間でも、せいぜい19クリックで辿りつくことができてしまいます。

あるネットワーク内でのノード間の最短距離については、6次の隔たりというのがよく持ち出されます。知り合いを6人辿れば世界の誰にでもつながる、というやつですね。6というのは最初に言い出した時の数で、マイクロソフトやミクシィFacebookなどが自社サービスのデータを使って実際に最短の仲介数はいくつなのか検証しようとしたりもしています。。

ハリウッドの役者の共演関係が非常に少ないリンクで辿れてしまうというケビン・ベーコン数では、いろんな映画に出るケビン・ベーコンがハブとなって無関係の俳優をつなげてしまうわけですが、インターネットの構造でこのケビン・ベーコンのような働きをするのは、検索エンジン・リンク集・まとめページなどです。

また、1兆個の一部分を、たとえば国単位とかで、切り出してそのネットワークを見ても、最も遠いものがせいぜい19クリックというのは変わらないのだそうです。全体のサイズの大小に関わらず、19ぐらいという数字が最長の経路となるのだと。これが本当だとすると、インターネット全体のサイズが今後もっと大きくなっても、二点間のリンクはせいぜいで19で変わらないということになりますね。

via Any Two Pages on the Web Are Connected By 19 Clicks or Less | Surprising Science

フェイスブックがスーパーボウルに向けてNFLファンの分布を解析

Facebookのデータ科学チームが、来週のスーパーボウルを前に、Facebook上でのアメリカンフットボールのプロリーグNFLのファン活動のデータを解析した結果を発表しています。

アメリカ合衆国のフェイスブックユーザーのうち実に3500万人(全人口の1/10以上)が、32個のNFLチームのFacebookページのどれかにイイネ!をしているということで、フットボールはアメリカ人にとっての国民的スポーツといっていいでしょう。

チームが勝っている時やプレーオフに進出している時は、通常よりもイイネ!の増え方が速い、ということで、それを除外した上でどの州・郡の人がどのチームを一番イイネ!しているか、という地図がこちら。

nfl-fans-on-facebook

アメリカのプロスポーツはどれもそうですが、それぞれのチームの根拠地(フランチャイズ)周辺では、そのチームのファンになって応援する人が多い、というのが現れていますね。

とは言っても、読売とかヤンキースみたいに全国的な人気の球団というのもあって、チームが無い州とかでは、ハワイのPIT(ピッツバーグ)とか、アラスカのGB(グリーンベイ)とか、あらゆる過疎地に現れるDAL(ダラス)などが人気を得ているようです。

Facebookはまた、プレーオフの進展にあわせて、勝ち残ったチームだけを残してプロットしたらどうなるか、という地図を見せてくれています。人気面からは、サンフランシスコ対ニューイングランド(ボルチモアに敗退)のスーパーボウルを期待してた地域が多かったと読むこともできるかと。

また、Facebookらしいソーシャルグラフ(友人関係)のデータを使った面白い分析も。あるチームのファンは、(同じチームのファン、というケースを除いて)どの他チームのファンの友達が多いか、というチャートです。

nfl-common-fan-friends

SF-OAK, NYJ-NYG, CHI-GBなど、フランチャイズが近かったりライバル関係があったりというチームのファンが、友人には多い、というのは自然ですね。また、STL, KCなどは、「どのチームのファンの友達としても少数(=上位5位に入ってこない)」という、孤立傾向があるのだとか。

大量の嗜好データを持つフェイスブックならではの分析記事ですね。日本のプロ野球でも計算してくれると、きっと面白い特徴が浮かび上がってくるのではないかと思うのですが。

via NFL fans on Facebook, based on likes

slitscanner.js – 動画をスリットスキャンして一枚の画像に収めるライブラリ/ブックマークレット

「スリットスキャン」とは、こちらで解説されていますが、時間軸のある動画などを、フレームを動画上の場所ごとにずらすことで作られる特殊な映像効果、のようです。

アナログの時代はカメラの前に置いたスリットを動かすことで、デジタルになってからは動画編集ソフトで、こういった効果をつけているそうです。

プロが人の手で編集を加えれば、独特の不思議な映像はもちろんできるのですが、VimeoやYouTubeなどの動画サービスで再生している動画を、ブラウザ上でそのままスリットスキャンしてしまおう、というのがSha Hwangさんによるslitscanner.js。HTML5のビデオプレイヤーで再生できる動画をスリットスキャンで一枚の画像にまとめてくれるライブラリ(とライブラリを使ったブックマークレット)です。

上記ライブラリページのブックマークレットをブックマークしておいて、Vimeoで適当な動画を開き、右下の”Switch to HTML5 Player”で(Flashプレイヤーではなく)HTML5プレイヤーを使うようにしてから、ブックマークレットを実行すると、動画の再生にあわせてスリットスキャンした画像が作られていきます。

上の動画から作ってみたスリットスキャン画像がこれ。

slitscanned-56902953

フレームを取り込む間隔はスライダーで調整できますので、多少は編集的なこともできるかと。

もう一つためしてみました。

slitscan-57463725

動きの早い動画だと細切れになりすぎて、よくわからない画像ができてしまいますね。Vimeoだけじゃなく、HTML5プレイヤーを使っていればYouTubeなどでも使えるのですが、YouTubeの場合は広告がFlash Playerで再生されるので面倒なことがあるとか。

うまくはまれば、長時間動画の雰囲気や盛り上がっているポイントを見つけるのに役立つかもしれません。

ブラウザで再生されている動画を、手元で加工することで面白くしたり発見したり、ということも、いろいろ出てくるのかもしれないですね。

via Slitscanning online videos

関連

マウスで操作出来るスリットスキャン – Flashで作られた、スリットスキャンを体験できるアプリ。横方向の動きがある動画と使うことで、ずらす感覚が簡単にわかるようになっています。

ウィキペディアで人気の単語で各国の歴史を表した世界地図

Laconic History of the World(簡潔な世界の歴史)は、世界の歴史を面白い切り口でまとめた地図です。

Google Maps風にタイル表示された世界地図は、それぞれの国のところが、英単語で描かれています。

laconic-history-of-the-world

その英単語は、その国の歴史を表すのに最も使われている単語ということです。英語版Wikipediaの
、”History of (国名)”のページで、ページ内で最も登場頻度の高い単語を、抜き出したらこうなったということ。

日本の場合、History of JapanのWikipediaページはこれですが、実際にページ内で”war “(戦争)を検索すると、出るわ出るわ。まあ、アメリカ・イギリス・フランス・ドイツなどもみんな、”war”な歴史の国なんですが。

作者による地図の解説ページでは、いろいろと興味深い発見が述べられています。

世界各国(この地図では176カ国)のうち16%の国では、”war”が一番使われていました。戦争にあけくれた歴史は日本だけではないようです。

4分の1の国では、一番使われる単語は植民地時代の宗主国です。最も多いのは、やはりBritish(大英帝国)。

20の国では、「スルタン」、「帝国」、「王朝」(中国)、「王国」、「ハーン」(モンゴル)、「金」(北朝鮮)など、支配者階級を表す単語がトップに。

いくつかの国では、近隣の他の国の名前がトップに出てきます。例として、「ハンガリー」と表示されている国はハンガリーではなくスロバキアだったり、パキスタンは「インド」だったり、東チモールは「インドネシア」だったり。隣の国との紛争や独立運動などで、自国の歴史が相手の国の記述だらけということですね。

また、マオリ(ニュージーランド)、ベルベル(モロッコ)、オグーズ(トルクメニスタン)、シルック(スーダン)など、先住民の名前がトップに出てくる国もいくつかあるということ。

「英語の」Wikipediaを使った分析なので、英語圏のWikipediaユーザーから見た歴史、という誤差はあるかもしれません。日本語のWikipediaで同じような地図を作ると、日本人の世界史観や日本との関係に絡んだ別の特徴的な単語が浮き上がってくるかもしれませんね。

via Map: Laconic history of the world

Googleマップを使った等時間地図(isochrone map)マッシュアップ

5hoursfromtokyotower
ある地点から、一定の時間で辿りつける範囲を描いた地図をアイソクローンマップというそうですが、それをグーグルマップを使って世界中の任意の地点から求められるというサービスが公開されています。Isochronous Application
上の地図は、「東京タワー」から「車で5時間」と入力して出てきた地図。高速道路沿いは速く移動できるでしょうから、それなりには正確そうです。ただ、山中など何時間使っても行けないところもあるはずなのに出ていないので、内部的にはあまり細かく求めているのではないように思います。描画にもかなり時間がかかるので、GoogleのAPIを呼び出しておおまかに当たりをつけて、多角形を描いているのではと思います。
これが公共交通機関の移動時間で動けばいいのですが、残念ながら車・自転車・徒歩での場合しか求めることができません。
以前に似たようなサービスMapnificentご紹介しましたが、こちらは公共交通機関もサポートしていたものの、おそらくデータの前処理が必須の構造であることから、アメリカやヨーロッパなどを中心に公共交通機関の公開データが入手できる都市でしか使うことができませんでした。
日本で電車を含めてこの手の等時間地図がどこからでも作れると便利だろうなと思うのですが。
via Google Maps Mania: How far can you get with Google Maps?

Mapnificent – ある場所から一定時間でたどり着ける範囲を見せてくれるサービス

Mapnificentは、Googleマップで移動にかかる時間を視覚的に教えてくれるというサービスです。

残念ですが日本の都市は対応していないようなので、昔サンフランシスコで働いていた時のオフィスの場所で試します。

まず、住所を入れるか、出発地点のベージュのマーカーを手で好きなところに置きます。

Mapnificent1

すると、そこから15分でたどり着ける範囲が明るく表示されました。左下の方向に飛び地のように明るくなってるのは、鉄道(BART)の駅ですね。左側とか左上方面は、バスが頻繁に走っている方向です。(1,2,3とか、30番とか)

Mapnificent2

右下のスライダーで、時間を変更することができます。スライダーを動かすのに応じてリアルタイムで明るい範囲が変わっていくのがとても楽しい。鉄道、路面電車、フェリーなどで行ける先が小さい円を作ります。

Mapnificent3

今週、「片道45分以上の通勤では離婚率が40%高くなる」というスウェーデンのニュースを読みましたが、その45分だとこうなります。

Mapnificent4

これ東京で使いたいなあ。昼ご飯に10分でどこまで食べにいけるか、みたいなのも調べられますね。

Mapnificentで表示できる世界の都市はトップ画面の地図から選ぶことができます。それぞれの都市で、公共交通機関のサイトから駅の位置や時刻表などの情報を集約しているGTFSというサイトのデータを使っていて、日本が無いのはそこにデータが無いからのようです。

不動産サイトで家を探す時に、駅を指定して「○○駅から20分」みたいな検索は見たことがあって、これでもまあ、会社から○○駅までの徒歩時間を足せば、トータルで「家から会社まで30分以内」みたいな探し方はできます。しかし、Mapnificentのように任意の地点から、徒歩でも交通機関でも組み合わせて、行ける範囲を見せてくれるインタフェースというのは、僕は見たことがなかったです。

via Flowing Data