ツイッターのつぶやきの言語と座標から作られた、世界の生きた言語地図

ツイッターのつぶやきの言語と座標情報を集めて、言語ごとに異なる色でプロットした世界地図
Language communities of Twitter
作者はEric Fischerさん。この人は、2010年にデジカメ画像の位置情報を集めて「旅行者」と「現地人」をプロットし、世界各都市の観光地を可視化する、というのをやって話題になった人ですね。
ヨーロッパの様子。言語の切れ目でぼんやりと国境が見えてきます。
Twitterbylanguageseurope
カタランとかスイスとか旧ユーゴとか、面白いですね。
こちらが日本周辺を切り出したもの。
Twitterbylanguagesjapanese
海上の座標でつぶやかれた日本語のツイートがけっこうあるような。GPSの精度の問題か、漁船やフェリーとかからつぶやく人がそんなにいるのか、理由はわかりませんが。
あと台湾の中国語の色が日本語の色と似てるのがまぎらわしいです。
つぶやきの言語を判定するには、言語判定のライブラリを使っているそうです。
ちなみに、文字列からそれがどの言語かを推定する言語判定ライブラリとしては、サイボウズ・ラボでも中谷さんが開発しているLanguage Detectionライブラリがあり、これ検出精度もかなり高いようです。もし上記のような地図など作ってみたい方がいたらぜひ試してみてください。
via Language communities of Twitter

「ツイッターのつぶやきの言語と座標から作られた、世界の生きた言語地図」への1件のフィードバック

  1. 確証ないですけど,東北沖が多いから,地震情報ボットのつぶやきを拾ってるんじゃないでしょうか.

コメントを残す

メールアドレスが公開されることはありません。

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください