ロンドンで一番ひどいバス停を見つける – ビッグデータ活用事例

ビッグデータ解析サービスの英コグニシオ社(Kognitio)が公開している、ロンドン最悪のバス停(The worst bus stop in London)は、ロンドン交通局の運営するバス運行に関する膨大なデータを使って、運行状況に関して優秀なバスやひどいバスを見つけるというプロジェクトです。 対象となるデータの規模は以下。 データ数 4,938,534,706 バス停の数 19,687個 バス路線数 675本 バスの台数 9,641台 ロンドン交通局のオープンデータというページがあるので、ここから入手できるのでしょうね。 これらのデータから、たとえば、7つの運行ゾーン毎に、「バスがとても遅れるバス停」「時刻表より前にバスが来がちなバス停」などのランキングが求められています。 これは「ロンドンで最も出発が遅れる路線」。走ってて遅れるのではなく出発が遅れるってどういうこと? と思いますが、運転手が遅刻するとかそういうのもあるんでしょうか。 こちらなんかは良い方の結果で、最も時間に正確なルート。路線のバスのうち85%が時刻表から外れずに走っているそうです。 郵便番号でランキング バスが正確な地域、不正確な地域をランキングするには、郵便番号(の上3桁)が使われています。 なんで郵便番号?

CSSスクロールで(マリオ風)横スクロール、(マリオカート風)キャラクター操作

CSSだけで(JavaScript無しで)動くページを作る、というお題でこんなものが AキーとDキーで車が左右に動いています。 こちらが作者のステファン・クックさん(Stephen Cook)による解説ページで、13行のhtml以外はすべてCSS、画像ファイルも使っていないということです。 CSS内に定義したデータから絵を描くのは、グラデーションとbox-shadow を使っています。1ピクセルごとに色を指定しているんですね。 キー入力の方はというと、こちらのCSSだけで検索エンジンを作るという記事(デモはこちら)にあるように、inputフィールドの value 属性に反応させればと思ったそうですが、ユーザーの入力に応じて value の値がアップデートされるということは無く、こちらの検索デモでは1行のJavaScriptを使っていることがわかりました。 クックさんは数週間前に間違ってブラウザのJavaScriptをオフにしてしまい、未だに戻す方法を見つけられていないということで、JavaScript を使わない方法を探さざるを得なかったよう。たいへんですね。 疑似セレクタ :valid, :invalid で、フォームフィールド内のタイプ内容がaを含むかどうかを場合分けし、さらにフォームフィールドにプレースホルダーを表示してるかどうかの :placeholder-shown と併せて、キー入力に応じて3値を見分けることにしたそうです。 レースゲームとして背景が動くところは、アルシデス・ケイロスさん(Alcides Queiroz)が公開していたマリオ風横スクロールにヒントを得たということです。 See

学生の小論文を代筆してくれるサービスがYouTuberで宣伝しすぎてBBCに見つかる

宿題の小論文を代わりに書いてくれる、という EduBirdie というサービスがあるそうです。 どんな感じで小論文を発注できるのか、注文画面を見てみました。 「推薦入試用」「研究」「ビジネスプラン」「書評」などから種類を選び、書くタイトルと分野を指定します。 分量(ページ数/単語数)、納期(短いと高くなるんでしょうね)、一から書くか・既存の何かをリライトするか・編集だけ頼むか、他の論文をどこから何本参照するか、関連する画像や図などがあればそれらもアップロードし、送信すると、この注文を受けたいという代筆者達が料金を提案してくる、という仕組みですね。 YouTuber を多数起用したプロモーション BBC が先日報じたのは、この EduBirdie をいろいろな有名 YouTuber が動画の中でオススメしている、という現象。BBC が調べただけでも250名以上が動画の中で EduBirdie を薦めていて、これらはたぶん EduBirdie からお金が出ている動画内宣伝なんでしょうね。 それらの宣伝コーナーの動画を、EduBirdie

子供の歌声を腕のイレズミにした母親

腕の刺青に対してスマートフォンをかざすと、スマートフォンから子供のかわいらしい歌声が再生される、という動画がありました。 https://www.youtube.com/watch?v=xxzaEtrmdBI 見た目のインパクトはあるし、音声波形らしき入れ墨なのでイレズミとして実際の声の波形を彫り込んだのかと最初思ったのですが、どうもそうではなさそう。これは、Skin Motionというサービスが生成した「波形風のバーコード」で、このサービスのスマートフォンアプリを使って認識させて、サーバ側にアップロードしておいた音楽/音声を再生させているということのようです。 二次元バーコードの刺青で参照先のコンテンツを再生する、という話だとそれほど珍しいわけでもなくて、QRコードのイレズミが5,6年も前のものがいくつも見つかります。 https://www.youtube.com/watch?v=hWQDq4mMMaQ https://www.youtube.com/watch?v=aDhqgZjP_Yk 普通の一次元バーコード刺青となると、それこそスマートフォン以前からありますし。 この手の「実体はインターネット上などにあって、そこをポイントしているだけ」の情報の体への埋め込みは、リスクが高そうな気がしますねえ。サービス提供者が停止したらどうするんだ、とか。イレズミの場合は、皮膚に傷がついたり、シミやシワが増えたりしただけで、読み取りできなくなりそう、というのもありますし。 さらに、このSkin Motion、アプリの登録に39.99ドル、毎年のサービス料も9.99ドル掛かるようです。 背中のイレズミに財宝のありかが隠されている、だと伝奇小説によくありそうな話ですが、毎年お金を払って維持するようなもの、となると刺青を彫るのが普通という文化の人にとっても、賢い選択とは言いにくいのではないかなあ... via

太陽発電だけで国中の電気を支えようとしたとき必要な面積を可視化したインタラクティブな世界地図

Area of Solar Panels Needed to Power a Countryは、世界各国の消費電力を賄うために必要な電気を、もし全部ソーラーパネルで発電しようとしたら、どんな広さになるか、というのを可視化してくれるページです。 下の世界地図から国を選ぶと、その国の地図と、その上に必要なソーラーパネルが占める面積が正方形の集合で表されます。 人口密度が高いのか、電力消費が多いのか。一番効いてるのは日照量の少なさかもしれません。 大きな国はいいですね。 人口が少なかったり、そもそも電気を使わないライフスタイルの国だと、こんな割合でも電気が賄えてしまうんですね。 87%の国は、国土の5%以下の広さで、すべての電力を賄えるそうです。このサイトの調査では日本は8%ということ。山だらけの日本で8%はかなり困難かも。 また、国土すべてにソーラーパネルを敷き詰めても足りないのは、シンガポール、香港、バーレーンの3国だということ。 もちろん、これから先の発電効率の進化もあるので、消費電力が増えすぎないように気を付けていけば、必要な面積は漸減していくことが期待できるのでは。 # 計算に使われたデータ、発電効率等の数字は、リンク先記事の末尾で提示されています。 via Maps

The Waiting Game – 入国収容所の難民を追体験できるブラウザゲーム

ProPublica と ニューヨーク公共ラジオ(WNYC)の制作によるブラウザゲーム The Waiting Game は、アメリカに入国して難民申請を出している人たちの体験をできるゲームです。 まずはプレイヤー選択。選べるのは5人。 エルサルバドルで、家庭内暴力(DV)から逃げてきた母子 バングラデシュで、信仰の異なる相手と結婚していた人 コンゴ民主共和国で、抗議活動に参加した学生 ネパールで差別に遭ったチベット人 国籍のせいでエチオピアからエリトリアに追放された人 ゲームの選択肢は基本的に「続けるか」(Keep going)、「諦めるか」(Give up)の2択しかありません。自国を脱出するまでは匿われている場所でじっと潜伏していなければいけない日々だし、拘置所や米国に移ってからの収容所では、毎日毎日なんの変化もないまま、刑務官らに人扱いされなかったりまずい食事を出されたりがひたすら続きます。 今回選んだ「デモで政府から目をつけられた学生活動家」の場合は、一度拘禁されて拷問を受けた後、親戚の手配でなんとか釈放されるものの、そのあとさらに学生たちへの弾圧が強まる中で偽造パスポートを入手してアメリカへと逃げることになります。 アメリカに着いてから難民収容所に移されてからも、自国で逮捕された時ほどひどい扱いではなくても、手続きも遅々として進まず、自由のない暮らしは続きます。 あまりに毎日の進捗がなく、陰鬱な描写が続くことから、Give upすると、これまで何十日が経過していたか、そしてこの実話の難民が実際に難民認定を受けるまでに何日かかったのか、が表示されます。ゲームならGive upできますが、この待ち続ける生活の中で実際に諦めることができるとしたら、甘んじて逮捕されるとか収容所で狂うとかですかね。 読んでいるだけでも辛いこの体験は、すべて実際に体験してきた難民たちの聞き取りから再構成された内容です。ゲームとして考えると、自由度もなければ嬉しくないイベントばかりのダメなゲームなのかもしれませんが、その自由のなさや辛さこそが、実際に難民の人たちに起こった/起こっている事だ、という意味で、リアルなゲームとも言えます。 共同でこのゲームを制作した WNYC ラジオの関連ニュースはこちら。 via

POLAR BEAR BLOG のアキヒトさんと昼飯

POLAR BEAR BLOG のアキヒトさんとランチ。オフィスが非常に近いことがわかり、一度会ってみたいですねということで。

アキヒトさんのブログとうちのブログとは、しょっちゅうネタが被っているので気になっていた。英語圏でのネットサービスに関する紹介エントリをよくやること、さらにそのネタを拾ってくるネタ元も近いので、書いた後向こうのブログに行くと、同じネタでもっとよい記事が書かれてたり、というのはしょっちゅう。

特にここ数週間は、怒涛の勢いで一日に何件も書かれているし、僕のブログでのそういった紹介記事が好きな人にはおすすめだ。

会うのははじめてとはいえ、トラックバックやコメントでなんとなく通じている感があり、実際に会ってお話すると情報交換の速度がさらにあがって面白いな、と感じた。ということで、また昼飯食いましょう。

この記事は移転前の古いURLで公開された時のものです

  • ブックマークが新旧で分散している場合があります。
  • 移転前は現在とは文体が違い「である」調です。(参考)
  • 記事の内容が古くて役に立たなくなっている、という場合にはコメントやツイッターでご指摘いただければ幸いです。最新の状況を調べて新しい記事を書くかもしれません

GBO – Google Base 最適化

サービス開始して一日も経ってないだろうに、Google Base で検索をかけると大量に登録データが出てきてびっくりだ。

JAPAN で検索すると、トップに知り合いのところの求人広告が出てくる。(仕事が早いね、しかし)

なぜ他の396件を抑えて一位表示なのかはまだ謎だが、普通の検索と同様、Google Base でいかに上位検索されるか、というのがすぐに盛り上がるとみたね。SEO ならぬ GBO (Google Base Optimization) と名づけよう。

もし Google Base サービスがヒットしたら、「GBO 解説サイト」、「GBO 入門書」が出て、やがて「株式会社GBO」が設立されるね。きっと。

追記: 今朝みたら知り合いのところは4位に落ちていた。すでに過酷な順位競争が発生している? 単に登録件数が増えているだけ?

サイボウズ・ラボの募集広告もとりあえず書いてみた。 詳しいのは自社サイトにあるわけだけど。

この記事は移転前の古いURLで公開された時のものです

  • ブックマークが新旧で分散している場合があります。
  • 移転前は現在とは文体が違い「である」調です。(参考)
  • 記事の内容が古くて役に立たなくなっている、という場合にはコメントやツイッターでご指摘いただければ幸いです。最新の状況を調べて新しい記事を書くかもしれません

Google Base が使えるようになってる

Google Base

トップから辿れる、すでに格納されているデータの例

映画レビュー

中古車販売 – ベンツ

求人 – 化学

求人 – プログラマー

登録されたアイテムは、Google Base 内にある場合もあれば、直接外部のサービスに飛ぶときもある。

新しいベースの作成については、トップページの右側からスタートできるようになっている。既存のテンプレートとして、仕事やレビューなどが選べるようになっているのは以前に流出した画面と同じ。ただし、独自のアイテムを作ることもできる。

一つ登録したアイテムは、「公開まで 15-60 分かかります」という状態になっている。Google が人力審査をやるはずがないと思うので、プログラムによるチェックをしているということなんだろうか。

既に公開されている他のアイテムにも、スパム等を報告するためのモデレーション機能が組み込まれており、ユーザが自由に情報を集積できる、というのと、それによる場の荒れや違法なコンテンツを排除する仕組みが準備されているようだ。

さて、自分としては、RDB をそのままマップしたようなサービスを予想していたのだが、ちょっと違っていて、新しい項目を作る際に、きっちりとしたフィールド設計をする必要はない。

データには日本語が入るが、フィールド名のところに日本語を入れようとすると入力エラーになってしまう。item と label に英語しか入れられない。また、タグのほうも、スペルチェックで英単語以外ははじかれる。folksonomy みたいな新語は受け付けなかった。

ここから考えると、Google Base は、自由に増減できるフィールド名をタグとした Folksonomy + データベースなんだろうか? item や label を英語に限定する理由は、やはり集合操作、ばらばらなデータの再利用をしやすくするためのような気がする。

フィールドは自由に設定できる、とはいえ、プルダウンにはお仕着せのフィールドセットが多数あり、レビューや売買広告を書く分には、わざわざオリジナルのフィールドセットを作成する動機は無い。そうすると、同じジャンルのアイテムは自然と検索/抽出できるようになっていく。

また、フィールド名さえ合致していれば、異なる設計で作られたアイテムでも関係なく検索できる。

多数のデータをまとめて流し込むこともできるので、すでに自分のサイトで持っている求人や不動産の情報を大量登録した業者がいるようだ。今 Google Base 内を検索すると、それらがひっかかってくる。

(参考) Google Base サービスイン関連の日本語記事


Google Base、ついに姿を現す–実態は「何でも共有サイト」か – CNET Japan

My RSS 管理人 ブログ: Google Base 公開:早速レビュー

HepCat Dev and Test: 不動産物件情報とXML(Google Base)

[mini速報] Google Base登場! – Speed Feed [ITmedia オルタナティブ・ブログ]

Google Base、ついにスタート

この記事は移転前の古いURLで公開された時のものです

  • ブックマークが新旧で分散している場合があります。
  • 移転前は現在とは文体が違い「である」調です。(参考)
  • 記事の内容が古くて役に立たなくなっている、という場合にはコメントやツイッターでご指摘いただければ幸いです。最新の状況を調べて新しい記事を書くかもしれません

Web 2.0 新語集

via threadwatch.org

「おいおい、Wikipedia に advercasting (広告キャスティング?)なんて新語が登録されてるよ」、というブログ記事を受けて、「だったらこんな新語はどうだ」とヤケクソ気味にいろいろ提案している。

Reblog リブログ

他のブログへの内容を、追加も洞察も意見もなしに反復するだけのブログ

Splinks スプリンクス

ブログに置かれた/張られたスパムリンク

Stags スタグス

タグを使ったタグ検索に対するスパム

Blag ブラグ

コンピュータ自動生成によるブログ

Alog アログ

A list ブロガー (A ランクブロガー)

Gaagle ガーグル

Google 教信者

Blord ブロード

ブロガーを大勢抱えたブログ領主(lord)たるパブリッシャー

Blerf ブラーフ

Blord のためにブログを書くブログ奴隷(Serf)

Advercasting を持つ主要ドメインはあらかた取られている。ほとんどはこれらのブログ記事を見て最近取得されたようだが、.com は前から取られているので、この advacasting.com のオーナーが自分で Wikipedia に登録したんじゃないの、という気もする。

Web2.0 自身もそうだし、Ajax や Podcasting などもだが、新語を作ってその新語で商売する、みたいなビジネスが流行ってるといえるかも。Arax とかもそう?

大々的に打ち上げても広まらない新語のほうが圧倒的に多いだろうけどね。

# 今現在、Wikipedia から Advercasting は消えている。Advercasting を定着させたい勢力と、消したい勢力のせめぎ合いが起こっている模様

この記事は移転前の古いURLで公開された時のものです

  • ブックマークが新旧で分散している場合があります。
  • 移転前は現在とは文体が違い「である」調です。(参考)
  • 記事の内容が古くて役に立たなくなっている、という場合にはコメントやツイッターでご指摘いただければ幸いです。最新の状況を調べて新しい記事を書くかもしれません

del.icio.us が見つけた Web2.0 の定義

いいかげん飽きてきた気もするが Web2.0 の話題。

del.icio.us の中の人ブログで del.icio.us でつけられたタグの統計を基に Web2.0 とは何かの分析をしている

del.icio.us のブックマーク全件の中で、23万件の URL が、7000 個の他のタグと共に “Web2.0″ で登録されている。”Web2.0” タグと同時に出てきた他のタグを多い順に並べると、

  1. ajax 9.9%
  2. blog 6.1%
  3. social 4.2%
  4. tools 4.1%
  5. software 3.3%
  6. tagging 3.3%
  7. javascript 2.8%
  8. internet 2.6%
  9. programming 2.5%
  10. rss 2.5%

ということで、「タグが付けられて、RSS を提供するソーシャルブログを、Ajax を使ってプログラムしたソフトウェアとして提供。便利ツールも同時に公開」すれば Web2.0 間違いなし!

この記事は移転前の古いURLで公開された時のものです

  • ブックマークが新旧で分散している場合があります。
  • 移転前は現在とは文体が違い「である」調です。(参考)
  • 記事の内容が古くて役に立たなくなっている、という場合にはコメントやツイッターでご指摘いただければ幸いです。最新の状況を調べて新しい記事を書くかもしれません

Java One で気になったトピック (1) サーバサイド編

JavaOne Tokyo 2005 でいろいろ仕入れてきた知識のまとめ。

全体的に、「Java SE 5 の Annotation 取り込みました。結果楽チンになりました」というものが多いけど、実際にコードサンプルを見せられると、威力は明らか。C# の人とかからすれば「いまさら」なんだろうけど。

EJB3.0

  • Annotation で、すごく簡単に書けるようになった -> コードサンプルを見た感じ同意
  • Hibernate などからいいところを見習った

Shale

JSF の拡張。Struts の反省を生かし Struts の McClanahan が作っている新フレームワーク

JAX-WS2.0, JAXB2.0

StAX

  • DOM, SAX に続く第三のパーザ
  • 軽い処理、一部だけを抜き出す処理が楽に書けそう

Java EE 5

EJB3.0, JSF1.2, JAX-WS2.0, JAXB2.0 なんかを含む。これまでの反省から、各技術要素のばらばら感を減らすようにインテグレーションを深めているとのこと。20061Qリリース予定。

Project GlassFish

  • Sun がメインで作るオープンソースアプリケーションサーバ
  • Java EE 5 を先取りして遊べる

Sun Java Studio Enterprise 8/Sun Java Studio Creator 無料公開

こんなん無償にしちゃっていいのかね。

この記事は移転前の古いURLで公開された時のものです

  • ブックマークが新旧で分散している場合があります。
  • 移転前は現在とは文体が違い「である」調です。(参考)
  • 記事の内容が古くて役に立たなくなっている、という場合にはコメントやツイッターでご指摘いただければ幸いです。最新の状況を調べて新しい記事を書くかもしれません

akky's work blog