「データ可視化」カテゴリーアーカイブ

手書き風グラフを描けるライブラリ xkcd.chart

英語圏でエンジニアに人気の線画コミックサイト xkcd には、グラフを使ったジョークネタも頻出します。こんな感じ。

xkcd に出てくるようなグラフは、だいたい手書き風のテイストで描かれているのですが、その手書き風グラフを再現できるグラフ描画ライブラリが xkcd.chart です。


日本語も出ますね。日本語入れると凡例の枠がはみ出てしまうので、ソースの調整が要るかもしれません。xkcd 風のフォントも同梱されていますが、日本語ではデフォルトフォントになるでしょう。

円グラフ、折れ線グラフ、棒グラフ を描くことができます。


ウィンドウズグラフの元ネタ

アメリカ銃乱射地図

Voxメディアが公開している、インタラクティブな銃乱射記録地図です。

2012年のサンディー・フック小学校乱射事件以降の銃乱射事件のデータが使われていて、新しい乱射事件が起こるたびに更新されているようです。今日の時点、2012年からのたった7年弱で、2178件の乱射事件が記録されているということ。

州別に人口比の発生頻度で塗ったもの。マウスカーソルを当てると件数が見られます。ほとんどの州で乱射事件が起こっていることがわかります。

横軸が人口100人あたりの銃の数。アメリカは一人に銃一つなんですね。縦軸は10万人あたりの銃による死亡者数。アメリカは1万人に一人以上。国別でみるとダントツに他の先進諸国を離して右上に君臨しています。日本は左下、ほぼゼロに近いところ。

他にも、乱射事件で亡くなった人数は全体からみるとわずかで、その他の殺人や自殺に銃が使われていること、2012
年から乱射事件のある日に色をつけたカレンダー、など、パッと見るだけで異常な状態がわかる資料がよく可視化され、まとめられています。

銃事件の元データは、銃暴力アーカイブ(Gun Violence Archive)というサイトのものを使っているようです。こちらのサイトでは、今年2019年に銃乱射で亡くなった被害者が既に253名とわかります。

via Maps Mania

🎬Film Map of the World – 地名に関係した映画を配置した「映画世界地図」

🎬 Map of the World は、世界のそれぞれの国について10本、最もウィキペディアで閲覧された映画を抽出し、その都市や地名の場所にプロットした地図です。

日本を拡大したのがこれ。

東京の「キル・ビル」はいいとして、「パール・ハーバー」で福岡、「(七人の侍ではなく)荒野の七人」で神戸、「もののけ姫」は埼玉、と、よくわからないプロットもあります。英語版ウィキペディアの記述の中に地名があったら、それを使っているということなのですが、英語版のもののけ姫の項目、今見ても埼玉とか書いてないんですよね。

最近閲覧数の多い項目で、日本の地名を含むもの、という条件、さらに英語版のウィキペディア、ということで、日本人から見るとよくわからない選定にも見えますけれど、英語版の世界から見ればこれが日本の映画で、その映画に縁の深い場所、ということになってしまうのでしょう。

日本の10選がこんな感じなので、他の国についても推して知るべし、という程度のいい加減さではあるかもしれません。地図の作り方は面白いけれど、データの取り方にもう一工夫必要なのではと思いました。

via Maps Mania

Remember the Fire – ビリージョエルの”We Didn’t Start the Fire”の歴史的事物をグラフ化

Remeber The Fire は、ビリー・ジョエルの1989年のヒット曲 “We Didn’t Start the Fire”(ハートにファイア) の歌詞をグラフにしたものです。

歌詞をグラフに? どういうこと? と思われるかもしれませんが、この曲はとても変わった曲で、メイン部分の歌詞はほとんどが歴史的な事件や有名人などの固有名詞の羅列なのです。時代的には、第二次世界大戦後からベルリンの壁崩壊までの冷戦時代、彼が生まれてからそれまでの世界の歴史を彩った事柄を、若干アメリカ中心ではありますが、並べて歌ったものでした。

今回のグラフは、それらの事件や人物を「ウィキペディアで検索された回数」という観点でグラフにしています。

2019年1月と2014年1月の二つを同時に表示させると、この5年間で検索回数が増えたキーワード・減ったキーワードを見つけることもできます。

それぞれの事件や人物の解説は、ハートにファイア – Wikipedia がやはりわかりやすいでしょう。

ロンドン地下鉄文学地図

Literary Tube map of London (文学ロンドン地下鉄地図)は、In the Book が公開した、ロンドン各地の小説に登場した場所を、地下鉄路線図に書き入れた文学地図です。

中央部をちょっと見ただけでも、「シャーロック・ホームズ」「101匹わんちゃん」「ドラキュラ」「ジキル・アンド・ハイド」「二都物語」「大いなる遺産」など、錚々たる有名小説が並んでいますね。さすがはロンドン。

東京でも似たような路線図を作ると面白いかもしれませんね

metro-clojure – gitリポジトリで地下鉄路線図を作るClojure製ツール

gjhenrique/metro-clojure は、鉄道路線図をgitのコミット/ブランチログで再現するためのオープンソースツールです。

路線と路線に所属する駅名を並べた json ファイルが入力となります。サンプルとしてサンパウロとニューヨークのデータがついてきてるので、それを参考にします。


[
{
"name": "銀座線",
"stations": [
"渋谷",
"表参道",
"外苑前",
"青山一丁目",
"赤坂見附",
"溜池山王",
"虎ノ門",
"新橋",
"銀座",
"京橋",

データをツールに食わせると、git コマンド群を発行するシェルスクリプトを作ってくれます。


$ boot generate-git-commands -c tokyo -f tokyo.sh

大江戸線のような循環があると、git グラフが作れないためツールはエラーで止まります。そりゃそうですね。

都庁前の循環を外して再度挑戦するも、東京のいたるところの乗換駅でエラーが… あちらとこちらで乗り換えができれば、循環だらけにもなりますね。


# 渋谷 銀座線 半蔵門線 副都心線
git checkout --orphan "銀座線"
git commit --allow-empty -m "渋谷"
git branch -f "副都心線" HEAD
git branch -f "半蔵門線" HEAD
# 代々木上原 千代田線
git checkout --orphan "千代田線"
git commit --allow-empty -m "代々木上原"
# 代々木公園 千代田線
git commit --allow-empty -m "代々木公園"
# 明治神宮前 千代田線 副都心線
git merge --strategy=ours --allow-unrelated-histories --no-ff --commit -m "明治神宮前" 副都心線
git branch -f "副都心線" HEAD
# 北参道 副都心線
git checkout "副都心線"
git commit --allow-empty -m "北参道"
# 方南町 丸ノ内線分岐線
git checkout --orphan "丸ノ内線分岐線"
git commit --allow-empty -m "方南町"
# 中野富士見町 丸ノ内線分岐線
git commit --allow-empty -m "中野富士見町"
# 中野新橋 丸ノ内線分岐線

「赤坂見附-永田町」のような別名の乗換駅の同一化を諦め、さらにエラーを起こす乗換駅を同一にしないよう入力データを修正していって、やっとなんとかエラーを出さなくした結果のスクリプトを、新しい git レポジトリに突っ込むことで、部分的には正しいところもあるぐらいの、東京の地下鉄gitグラフ(東京メトロ+都営地下鉄)を作ってみました。

git log で見るとこんな感じ

東京の路線図は循環しすぎなので、使用例としてはあまり良くないかもしれませんね。

もともとパリの路線図をGitHub 上で再現した2015年の作品があり、metro-clojure はこのような作品を簡単に作れることを目指して制作されたようです。

このツールを使えば、地下鉄の路線図以外の何か身近な有向グラフを git グラフで表現することができますね。

via From metro connections to a git graph