「検索」タグアーカイブ

TERRAPATTERN – 航空写真地図の類似画像検索サービス

アルファ版として公開された TERRAPATTERN は、航空写真地図を使った類似画像検索サービスです。

GoogleマップやOpenstreetMapなどでおなじみの、航空写真をスクロールして閲覧できるUIの上で、適当なブロックを指定してみます。

たとえば、とあるテニスコートのところをクリックすると、同じ都市の中から、似たような場所を列挙してくれるというわけです。

terrapattern-tenniscourt-in-sf

こちらはとあるマリーナを選んだ時の結果

terrapattern-marina

なお、現在は、タイル状の航空写真をその形で機械学習に掛けているということで、人間が認識する「目立った構築物」がすべて見つかるわけではなく、タイルの中の形や色のパターンが似ているものが出てくる仕組みということです。

TERRAPATTERN は今のところ、ピッツバーグ、サンフランシスコ、ニューヨーク、デトロイトの4つの都市だけに対応していますが、ソースコードはMITライセンスでGithub上に公開されているということなので、自分の見たいデータを入れて動かしてみることもできるでしょう。

via FlowingData

住所から、その近くのYouTube動画を検索する

YouTube の API では、動画に関連した座標情報が取得できるようですね。YouTube 本体の検索ではどうやるか見つけられなかったので、API でだけアクセスできる情報なんでしょうか。

Google 自身による API 利用サンプルのデモとして、geoサーチサービスが公開されているのを知りました。座標や住所を入れると、その近くの動画を列挙してくれます。

こちらが、「東京都中央区日本橋」で検索した結果

youtube-geo-search-screenshot

これ、最初見たときはアップロードした動画の中にある情報を使ってるのかと思って驚きましたが、さすがに本人が知らないのに住所と関連づけられたりはしていないでしょう。東京の真ん中で検索してもあまり密度濃く出てこないですし。

YouTube の動画管理ページの方に、位置情報を入れるフィールドがあり、そこで明示的に座標を入れている動画が出てくるようです。

自分で「場所を出しても良い」と判断している投稿者の動画だけがあるなら、まあそんなに危険はないんでしょう。旅行先での動画とか、お店の宣伝動画とかは、むしろ積極的に位置情報を入れていくのが良さそうですね。たまに個人 YouTuber が家で撮ってるような動画も出てくるのはわかりませんが。

YouTube上で東京都中央区日本橋という言葉で検索した場合とは、明らかに異なる結果です。こちらは、住所「名」で検索したら、当然ながらタイトルに「日本橋」とか入っている動画がたくさんでてきます。

Google 自身によるサンプルのデモサイトなので、ソースコードも入手できます。ソース中でなぜか車のメーカーの名前をフィルタしたりしてるんですが、取り除かないと車名が入った動画がたくさん出てくるんでしょうか。

via Hacker News

World White Webプロジェクト – 手足など人物の画像検索に人種的多様性を持たせようという活動

World White Web 、World Wide Web のワイドとホワイト(白)をかけたキャンペーンでは、”hand” や “foot” といった体のパーツ名で画像検索した時に、白い写真ばかりが出てきてしまうのでは、というのを問題として提起しています。

world-white-web

試しに”hand”でグーグル画像検索してみると、以下のようになりました。

hand-image-search-on-google

確かに白っぽい手ばかりです。

世の中には色々な色の手や足があるのに、画像検索でそれが出てこないとすれば、何かしらの理由はあるのかもしれませんね。

英語をメインで使っている国の中で白人の割合が多いことが、白人モデルの写真の多様と画像検索トップの占拠につながっているということかもしれません。たとえば、「顔」とか「腕」といった漢字での検索では、英語での画像検索に比べれば、アジア系の顔や腕が多く出てきます。

nose-in-japanese-google-image-search

とはいえ、広告等で白人が良く採用されるからか、あるいは西洋文化が幅を利かせているからか、白人の写真もちらほらと出てきます。黒人の画像はなかなか出てきません。

World White Web がこの「問題」を解消する方法として提唱しているのは、彼らのサイトに置かれた非白人の手や足の画像にリンクしたり、ソーシャルでシェアを勧めたりというもの。要するに画像SEO になるのですが、このやり方で実際にトップページに彼らの希望する画像が入ってくるかというと、ちょっと難しいような気がします。

ブログや新聞記事を書くときに、多様な肌の色の写真を使いましょう、という呼びかけは、テレビドラマの配役で人種の多様性の配慮が求められるアメリカらしさを感じますね。

via TheNextWeb

グーグル検索に見つかったら、ただちに自身を削除する自動消滅掲示板

Matthew Rothenbergさん(@mroth)によってGithub上に公開されているUnindexed (=インデックスされない)は、markdown形式などで書き込めるシンプルなウェブ掲示板のスクリプトですが、ページがグーグルの検索結果に登場したことを検知したとたんに自分自身を削除してしまいます。

unindex

グーグル検索が気づいた瞬間に「この掲示板は自動的に消滅する」ように作られていて、このスクリプトのデモとして実際に公開されていた掲示板は、公開後22日で検索結果に現れるようになり、デモサイトも410エラーで終了となっています。

掲示板にコメントした利用者は、積極的にそれをシェアすることを勧められますが、シェアすることによってグーグルのインデックスに載りやすくもなり、最終的にはサービスごと、すべてのコメントが消えてしまいます。

そもそもグーグルに「インデックスしないでくれ」と指定することは可能なので、本当にそれが目的であればこんな作り方をする必要は無いのですが、ご本人によるプロジェクトの解説によれば、「ウェブの持つ儚さとしつこさという性質の実験」ということだそうです。

via Waxy via Boing Boing

Googleサジェストをネタにしたボードゲーム Query

query-the-game-2.png

ウェブ上のフォームで何かを入力しようと時、それまで打ち込んだ内容をみて、「あなたはこれを入力しようとしているのではないですか?」という提案が出てきますね。これはautocomplete という機能で、自分や他のユーザーが過去に入力した内容などから推測して出されているものです。

グーグルが「Googleサジェスト」という形で、検索ワードを入力する時に出してくるものもその一つですね。

Query the Game は、クラウドファンディングのKickstarter を利用してカナダの姉妹が作成したのは、このGoogleサジェストをモチーフにしたボードゲームです。

query-the-game-3

  • 危険なことですか? カビの生えたパンを食べるのは
  • 危険なことですか? 夢遊病者を起こすのは
  • 危険なことですか? ガムを飲み込むのは
  • 危険なことですか? 雷雨の時にシャワーに入るのは

ゲームには上のようなサジェスト風の質問(query)が、600セット同梱されています。

The real deal!

A photo posted by Query The Game (@querythegame) on

親となったプレイヤーは、この質問カードを1枚引き、冒頭の黒い部分までを読み上げます。

子プレイヤーは、その後に続く正しいフレーズ(=Googleサジェストで実際にサジェストされるフレーズ)を考え、自分のボードに書いて(誰にも見えないように)親に提出します。

親プレイヤーの方は、4つ示されている本当のフレーズから1つを選び、これも子から提出された回答と一緒にし、ランダムな順番で全部の回答を読み上げます。

子プレイヤーは、読み上げられた回答から、どれが本当のフレーズかを予想し、当たれば2ポイントを獲得。自分の書いた回答で他のプレイヤーを騙せたら1ポイントを獲得します。

親プレイヤーは、子プレイヤー全員が外れたら3ポイントをゲットします。

辞書やトリビアを使った類似のゲームとして、フィクショナリー(Fictionary) や ボルダーダッシュ(Balderdash)、日本ではたほいやなどがありますね。

ゲームのルールとしては新しいものではないですが、グーグルの検索結果を使うことで、「正しい、正しくない」ではない、別のゲームになってるように思います。Googleサジェストが時たま出す変な提案フレーズは、よくネット上でも笑いのネタになるところで、同梱された問題には、そのような意外なフレーズが多数含まれていそうです。

query-the-game-1

http://www.amazon.co.jp/dp/4594012582/

via The New Yorker

wが二つ重なった文字「ʬ」がバイラビアル・パーカッシブだと調べる方法

もともと2ちゃんねるで回答されたものみたいですが、「wが縦に二つ重なった文字の出し方教えて」という質問に対して、「ʬ」を出したり、その読み方が「バイラビアルパーカッシブ」だと回答した人はどうやって調べたんでしょうね。

その回答者がこれを使ったかどうかはわかりませんが、ユニコード内の文字だと、ShapeCatcherというサイトで調べられます。

左側のボックスに、マウスで探したい文字を書き、”Recognize”(認識せよ)をクリックすると、下にそれに近い文字が列挙されます。wを縦に二つ書いてみましょう。

bilabial-percussive-on-shapecatcher

コード 0x2ac のラテン文字 bilabial percussive と出ました。

これが難しい漢字とかなら、日本語IMEの手書き入力モードでも調べられます。しかし、Windows 7の標準IMEの手書き入力では、バイラビアル・パーカッシブは出てきませんでした。

Unicodeに限らず、いろいろなシンボルの検索、ということだと、以前はSymbols.com というサイトに記号の形の特徴(線対称かとか、記号の線に閉じた部分があるかとか)から記号を調べてくれる検索機能があったのですが、今は無くなっていて、あまり使えるサイトではなくなっていました。