Tag Archives: Google

ランダムなアルファベット4文字x2で、Google画像検索が謎の抽象画を返してくる

グーグル画像検索を乗っ取るサイト?

reddit/whatisthisthing(これは何?)で質問されて話題になった謎の現象がこれ。

グーグル画像検索で”jwsr ljxb”のように、アルファベットで単語になってなさそうなものを2個入れると、出てくる候補が謎の図形画像だらけになります。

どんな4文字でも出るわけではありません。まず辞書にあるような4文字はダメです。その単語に関する画像が出てきます。略語として成立してるものもだめ。子音ばかりを読めないような並びで並べると出やすいように思います。

画像のサイトを開いてみると、どの画像も c0d3.attorney というドメイン上のページにあることがわかります。その内容はというと、

謎の画像二つに、ごく短いプロジェクト紹介、そしてその後ろには長々と、デタラメにも見える読めないテキストが続いています。

難解プログラミング言語 Malbolge を使ったプロジェクト

プロジェクト紹介の内容はこちら

c0d3.attorney は Malbolge, 1998年にベン・オルムステッド氏が作成したパブリックドメインな難解言語, で書かれたプログラムを表示することに特化したプロジェクトです。言語は使うことがほぼできないように設計されています。(しかし)設計上の弱点がこれまでに発見され、使えるプログラムを書くことが可能となりました。これを共有できることは喜ばしいことです

とても短い紹介文で、これ以外には情報がありません。

ページのほとんどを占めるデタラメ風テキストが、そうすると Malbolge 言語のコードだということなのでしょう。

画像もコードも、URLに与えたパラメータに応じて変化しますが、あるページで数えてみると、約5万語、61万文字ありました。

オンラインの Malbolge実行環境(あるんだ…) に最初の一行を食わせてみましたが、エラーとなってしまいました。1行だけ入れても動かないのかもしれません。

ちなみに、サイトにサンプルとしてある Hello, World はこれ

('&%:9]!~}|z2Vxwv-,POqponl$Hjig%eB@@>}=

うん。まったくわからん。

Google は「知らん」と

TheNextWeb が Google にこの現象に関して問い合わせしてくれていますが、これは Google のイースターエッグではないし、同社は c0d3.attorney とは何の関係も無い、という回答が来たそうです。

「一般的な話」として、画像のあるページにある文字で検索したら出るよ、ともコメントにあったということで、ごくごく当たり前のつまらない結論になってしまうのですが、この自動生成っぽい Malbolge 言語のコードの中にアルファベット4文字のセットが大量にでき、その中の2組の4文字をウェブの他のサイトで2つ同時に使ってる他のサイトがほとんど無いために、検索で出てきてしまう、ということでしょうね。

今の時点でも、この謎のサイトを作ったのは誰か、などは判明していません。

純粋なプロジェクトか、意図のあるSEOスパムか?

ドメインの世界では、 .com 以下は、ランダムだろうと意味がなかろうと 4文字のドメイン名はすべて誰かに取得されていることが2013年には報告されています。打ち間違いでもなんでも、4文字.com を入れた人を待ち構えて、広告を見せたりドメインを売りつけたりという商売をしてる人たちがどこかに存在するわけです。

となると、今回のサイトもそういう「迷い込んできた人」を捕まえるために作られた可能性も消し去ることはできません。とはいえ、今のところサイトに来ても、広告があるわけでもなし。単に人が来たからといって得になることなんてあるのかなとも思います。

いろいろな文字列でGoogleから推薦される、と聞くと人によってはたいへん魅力的に感じるかもしれませんが、そのデタラメな文字で迷い込んでくる人が分量としてどれほどのものか、という話もあります。総量としては見つけてやってくる人はそれほど多くないかもしれません。

ですが、今回の件で興味を持った人は、単語になってない日本語の文字の組み合わせを大量に配置するサイトでも作れば、同様の結果を得られたりするかもしれませんね。

via reddit and TheNextWeb

[動画] 現在の人気ネット企業が、もし1980年前後に存在したら

レディット, インスタグラム, グーグル, アマゾン, サウンドクラウド, ユーチューブ, ツイッター, フェイスブックらのネットの人気企業が1970-1990年代にもし存在していたとしたら、こんな企業ロゴを作っていたのでは、という動画です。

作者は、このようなレトロ風デザインを専門に請け負うデザイナーFuture Punk氏。

80年代から持ってきたような作品群ですが、現在作成されているものです。当時はいろんなところでこういうロゴを見たものですが、今の道具でこれを作ろうとすると、却って再現が難しいかもしれませんね。

動画はいい感じににじんだり、ノイズがのったりしています。音楽のほうも、当時のテレビ番組のオープニングにありそうな曲になっています。

via Geekologie

書籍「エラーメッセージでググれ」「Stack Overflowからコピペ」

いつもの動物の写真の表紙なので、本当にオライリーが出してるのかと思いそうになりますが、ウェブに流れているパロディ表紙です。

“Googling the Error Message”(エラーメッセージをグーグル検索する)

出版社のところが “O RLY?”(Oh Really? 本当に?)となっています。

このツイートに対して、「こっちも忘れるなよ」と出されてるのがこちら

“Copying and Pasting from Stack Overflow”(スタック・オーバーフローからコピー&ペースト)

こちらの表紙は”O’Reilly”と書いてあってちょっとやりすぎ感がありますね。

エラーメッセージを検索するのはトラブルシューティングの基本中の基本だと思いますし、いろいろ調べてわからなかったら質問サイトで同じ問題に捕まっている人やそれへの回答を見つけるもの有用なのは間違いないので、パロディですが良いアドバイスですよね。

と思ったら、後者については表紙に触発されてタリク・アリさん(Tariq Ali, GitHub@tra38)が本文を書いちゃってます

そんなに長い電子書籍ではないですが、Stack Overflow などの質問サイトで回答されているコードを利用したい時のライセンスについて、著作権保護の対象外となる「コード片(snippets)」とCC-BY-SA 3.0で保護される「もっと大きなコード」について、この二つの間の境界は曖昧であることや、それぞれを製品等に組み込むとした時にどのようなライセンス上の問題が起こりうるか、安全側に倒したい際の手段(クリーンルーム手法)、などまでを解説しています。

Stack Overflow 上のコードが著作物とされるだけ長い場合でも、CC-BY-SA 3.0 から CC-BY-SA 4.0 への自動アップグレード経由で GPL 3.0 や Aertistic license として扱える、と書いてあり、そんなことになってたのか、と勉強になりました。

他にも、「オリジナルコードの作者への言及を消していい、あるいは消した方がいいのはどれぐらいコードを自分で書き変えた時か」とか「Stack Overflow に書いてあるコードをただ適当にコピーすることの危険性。複数の回答がある中で間違いや質の低いコードをいかに見分けるか」といった実践的なアドバイスがまとめられています。

GoogleのChromebook宣伝動画、YouTube にスパムとしてはねられる

ツイッターにおけるヘイトスピーチ投稿の規制や、プログラムによる自動的なスパム判定がニュースとなっていますね。

そんな中、同じくスパム投稿や違法コピー投稿がなかなかなくならない YouTube で、有名企業によるプロモーション動画が誤判定でスパム扱いされた、と TheNextWeb が伝えています

今回、スパム判定されてしまったのは、新しい Chromebook の宣伝動画(おそらく Pixelbook )、作ったのは Google 社です。YouTube を運営している会社ですね。自社サービスに自社動画がブロックされてしまったと。

スパム判定された状態の動画はすぐに撤回されてしまったようですが、消される前に Android 上の YouTube アプリで撮影された証拠動画というのがこちら

この動画はユーチューブのスパム・不正・詐欺行為に関するポリシーに違反したため削除されました

“This video has been removed for violating YouTube’s policy on spam, deceptive practices, and scams,”

ユーザー投稿がスパムや不正なものでないか、プログラムで機械的に判定するのがいかに困難か、という証拠のようにも思えます。

僕としては、「自社のアカウントは絶対スパム判定されないよう、特別扱いでホワイトリストに入っている」といった管理をしてないのはむしろ好感を持ちましたし、疑陽性で止められる経験によって機械学習等によるより正確なスパム判定をできるようにしなきゃ、と中の人も思ってるのではないかと思いました。

via TheNextWeb

Google Homeがディズニーの新作「美女と野獣」の頼まれない広告を流す

家庭用の音声アシスタントとしてAmazonエコーと競争中のGoogleホームですが、ユーザーが望んでもいない新作映画の宣伝を勝手に始められた、という話がネットに流れて問題となっているようです。

あるユーザーが撮影した動画がツイッターに上がっています。

「OKグーグル、今日の僕の予定は?」と語りかけると、時刻、天気予報、職場までの予想通勤時間、を話した後に、「ところで、ディズニー映画『美女と野獣』は本日公開です。今回は(父親の)モーリスではなくベルが発明家です…」から、ベルについてもっと知りたければ質問して、と続けています。

ユーザーがディズニーや美女と野獣について質問した結果話しているのではなく、今日の予定の後に勝手に宣伝を始めているように見えます。reddit では、これに不快感を覚えた人たちが議論しています。「Amazon Echo とどっちを買うべきかはっきりしてよかった」などというコメントもあります。

ITブログVentureBeatがGoogle社に問い合わせたところ、「これは広告ではありません。我々のパートナーをゲストとして迎え、彼らのお話をシェアしてもらっただけです」という返事が来たのだと。

VentureBeat によれば、現地の午後3時過ぎには今日の予定を聞いても美女と野獣については話されなくなったということ。また、消息筋の話ではグーグルとディズニーの間に今回お金のやりとりは無かったようだとの話も。

「お金が動いてないから広告ではない」とは思いませんが、テキスト検索の横に広告を出して儲けるのが本業の会社ですから、音声アシスタントの会話に広告が混ざってくるのもある意味既定路線なのかもしれません。近未来の家の中は多少なりともこんな感じになっていくのでしょう。

ウェブサイトの横に出てくる広告は無視できても、音声で喋られると無視は難しいし、購買行動に何らかの影響は与えられるかもしれないですね。

Google曰く 「Google.comはちょっと危ないよ」

Hacker News に出てた小ネタ

危ないスクリプトなどを実行させようとするような危険なウェブサイトを見つけたり警告してくれたりするセーフブラウジングの機能で、自分自身のドメイン google.com に「一部のページに不正なコンテンツが含まれています」という警告が出てしまっているようです

google-transparency-report-on-google-com

「このウェブサイトの一部のページが、訪問者のパソコンに不正なソフトウェアをインストールしています。」とか「このウェブサイトの一部のページが、訪問者のパソコンに不正なソフトウェアをインストールする 危険なウェブサイトに訪問者をリダイレクトしています。」とか。

google-transparency-report-on-google-com-enlarged

多数のサービスで膨大なページを提供していますし、ユーザーが作ったコンテンツを公開するようなサービスも多いですから、google.com のどこかでは、怪しいファイルが混入することもあるかもしれないですよね。

それをきちんと見つけて警告しているとしたら、むしろうまく仕組みが動いているのかも。すぐに対策が取られて除去されるのではないでしょうか。

google.co.jpをチェックすると「危険ではない」とでますので、とりあえず .co.jp の方を使えば安全? (違うって)