「検索」タグアーカイブ

フェイスブックで「女性の友達の写真」は出るのに「男性の友達の写真」は出ない

友達の検索ではなく一般の検索の方ですが、検索ボックスで「女性の友だちの写真」(Photos of my female friends)と入力するとつながっている女性の友人のアップロードした写真が出てくるのに、

「男性の友だちの写真」(Photos of my male friends)と打っても男性の友人の写真は出てきません。

代わりに、何らかの検索した結果の写真が表示されました。

ベルギーの Facebook ウォッチャー、Inti De Ceukelaire さんがツイッターで紹介したこの謎現象

TheNextWeb も書いてますが、Facebook が今の形になる以前の大昔(2004年)、まだ名前が Facemash だったころ、ハーバード大の女子学生の顔に点数をつけるサービスだった、という過去を思い出させるバグです。さすがに今わざとやったわけではないでしょうけど。

… たぶん。

via TheNextWeb

書籍「エラーメッセージでググれ」「Stack Overflowからコピペ」

いつもの動物の写真の表紙なので、本当にオライリーが出してるのかと思いそうになりますが、ウェブに流れているパロディ表紙です。

“Googling the Error Message”(エラーメッセージをグーグル検索する)

出版社のところが “O RLY?”(Oh Really? 本当に?)となっています。

このツイートに対して、「こっちも忘れるなよ」と出されてるのがこちら

“Copying and Pasting from Stack Overflow”(スタック・オーバーフローからコピー&ペースト)

こちらの表紙は”O’Reilly”と書いてあってちょっとやりすぎ感がありますね。

エラーメッセージを検索するのはトラブルシューティングの基本中の基本だと思いますし、いろいろ調べてわからなかったら質問サイトで同じ問題に捕まっている人やそれへの回答を見つけるもの有用なのは間違いないので、パロディですが良いアドバイスですよね。

と思ったら、後者については表紙に触発されてタリク・アリさん(Tariq Ali, GitHub@tra38)が本文を書いちゃってます

そんなに長い電子書籍ではないですが、Stack Overflow などの質問サイトで回答されているコードを利用したい時のライセンスについて、著作権保護の対象外となる「コード片(snippets)」とCC-BY-SA 3.0で保護される「もっと大きなコード」について、この二つの間の境界は曖昧であることや、それぞれを製品等に組み込むとした時にどのようなライセンス上の問題が起こりうるか、安全側に倒したい際の手段(クリーンルーム手法)、などまでを解説しています。

Stack Overflow 上のコードが著作物とされるだけ長い場合でも、CC-BY-SA 3.0 から CC-BY-SA 4.0 への自動アップグレード経由で GPL 3.0 や Aertistic license として扱える、と書いてあり、そんなことになってたのか、と勉強になりました。

他にも、「オリジナルコードの作者への言及を消していい、あるいは消した方がいいのはどれぐらいコードを自分で書き変えた時か」とか「Stack Overflow に書いてあるコードをただ適当にコピーすることの危険性。複数の回答がある中で間違いや質の低いコードをいかに見分けるか」といった実践的なアドバイスがまとめられています。

TERRAPATTERN – 航空写真地図の類似画像検索サービス

アルファ版として公開された TERRAPATTERN は、航空写真地図を使った類似画像検索サービスです。

GoogleマップやOpenstreetMapなどでおなじみの、航空写真をスクロールして閲覧できるUIの上で、適当なブロックを指定してみます。

たとえば、とあるテニスコートのところをクリックすると、同じ都市の中から、似たような場所を列挙してくれるというわけです。

terrapattern-tenniscourt-in-sf

こちらはとあるマリーナを選んだ時の結果

terrapattern-marina

なお、現在は、タイル状の航空写真をその形で機械学習に掛けているということで、人間が認識する「目立った構築物」がすべて見つかるわけではなく、タイルの中の形や色のパターンが似ているものが出てくる仕組みということです。

TERRAPATTERN は今のところ、ピッツバーグ、サンフランシスコ、ニューヨーク、デトロイトの4つの都市だけに対応していますが、ソースコードはMITライセンスでGithub上に公開されているということなので、自分の見たいデータを入れて動かしてみることもできるでしょう。

via FlowingData

住所から、その近くのYouTube動画を検索する

YouTube の API では、動画に関連した座標情報が取得できるようですね。YouTube 本体の検索ではどうやるか見つけられなかったので、API でだけアクセスできる情報なんでしょうか。

Google 自身による API 利用サンプルのデモとして、geoサーチサービスが公開されているのを知りました。座標や住所を入れると、その近くの動画を列挙してくれます。

こちらが、「東京都中央区日本橋」で検索した結果

youtube-geo-search-screenshot

これ、最初見たときはアップロードした動画の中にある情報を使ってるのかと思って驚きましたが、さすがに本人が知らないのに住所と関連づけられたりはしていないでしょう。東京の真ん中で検索してもあまり密度濃く出てこないですし。

YouTube の動画管理ページの方に、位置情報を入れるフィールドがあり、そこで明示的に座標を入れている動画が出てくるようです。

自分で「場所を出しても良い」と判断している投稿者の動画だけがあるなら、まあそんなに危険はないんでしょう。旅行先での動画とか、お店の宣伝動画とかは、むしろ積極的に位置情報を入れていくのが良さそうですね。たまに個人 YouTuber が家で撮ってるような動画も出てくるのはわかりませんが。

YouTube上で東京都中央区日本橋という言葉で検索した場合とは、明らかに異なる結果です。こちらは、住所「名」で検索したら、当然ながらタイトルに「日本橋」とか入っている動画がたくさんでてきます。

Google 自身によるサンプルのデモサイトなので、ソースコードも入手できます。ソース中でなぜか車のメーカーの名前をフィルタしたりしてるんですが、取り除かないと車名が入った動画がたくさん出てくるんでしょうか。

via Hacker News

World White Webプロジェクト – 手足など人物の画像検索に人種的多様性を持たせようという活動

World White Web 、World Wide Web のワイドとホワイト(白)をかけたキャンペーンでは、”hand” や “foot” といった体のパーツ名で画像検索した時に、白い写真ばかりが出てきてしまうのでは、というのを問題として提起しています。

world-white-web

試しに”hand”でグーグル画像検索してみると、以下のようになりました。

hand-image-search-on-google

確かに白っぽい手ばかりです。

世の中には色々な色の手や足があるのに、画像検索でそれが出てこないとすれば、何かしらの理由はあるのかもしれませんね。

英語をメインで使っている国の中で白人の割合が多いことが、白人モデルの写真の多様と画像検索トップの占拠につながっているということかもしれません。たとえば、「顔」とか「腕」といった漢字での検索では、英語での画像検索に比べれば、アジア系の顔や腕が多く出てきます。

nose-in-japanese-google-image-search

とはいえ、広告等で白人が良く採用されるからか、あるいは西洋文化が幅を利かせているからか、白人の写真もちらほらと出てきます。黒人の画像はなかなか出てきません。

World White Web がこの「問題」を解消する方法として提唱しているのは、彼らのサイトに置かれた非白人の手や足の画像にリンクしたり、ソーシャルでシェアを勧めたりというもの。要するに画像SEO になるのですが、このやり方で実際にトップページに彼らの希望する画像が入ってくるかというと、ちょっと難しいような気がします。

ブログや新聞記事を書くときに、多様な肌の色の写真を使いましょう、という呼びかけは、テレビドラマの配役で人種の多様性の配慮が求められるアメリカらしさを感じますね。

via TheNextWeb

グーグル検索に見つかったら、ただちに自身を削除する自動消滅掲示板

Matthew Rothenbergさん(@mroth)によってGithub上に公開されているUnindexed (=インデックスされない)は、markdown形式などで書き込めるシンプルなウェブ掲示板のスクリプトですが、ページがグーグルの検索結果に登場したことを検知したとたんに自分自身を削除してしまいます。

unindex

グーグル検索が気づいた瞬間に「この掲示板は自動的に消滅する」ように作られていて、このスクリプトのデモとして実際に公開されていた掲示板は、公開後22日で検索結果に現れるようになり、デモサイトも410エラーで終了となっています。

掲示板にコメントした利用者は、積極的にそれをシェアすることを勧められますが、シェアすることによってグーグルのインデックスに載りやすくもなり、最終的にはサービスごと、すべてのコメントが消えてしまいます。

そもそもグーグルに「インデックスしないでくれ」と指定することは可能なので、本当にそれが目的であればこんな作り方をする必要は無いのですが、ご本人によるプロジェクトの解説によれば、「ウェブの持つ儚さとしつこさという性質の実験」ということだそうです。

via Waxy via Boing Boing