「画像」タグアーカイブ

ランダムなアルファベット4文字x2で、Google画像検索が謎の抽象画を返してくる

グーグル画像検索を乗っ取るサイト?

reddit/whatisthisthing(これは何?)で質問されて話題になった謎の現象がこれ。

グーグル画像検索で”jwsr ljxb”のように、アルファベットで単語になってなさそうなものを2個入れると、出てくる候補が謎の図形画像だらけになります。

どんな4文字でも出るわけではありません。まず辞書にあるような4文字はダメです。その単語に関する画像が出てきます。略語として成立してるものもだめ。子音ばかりを読めないような並びで並べると出やすいように思います。

画像のサイトを開いてみると、どの画像も c0d3.attorney というドメイン上のページにあることがわかります。その内容はというと、

謎の画像二つに、ごく短いプロジェクト紹介、そしてその後ろには長々と、デタラメにも見える読めないテキストが続いています。

難解プログラミング言語 Malbolge を使ったプロジェクト

プロジェクト紹介の内容はこちら

c0d3.attorney は Malbolge, 1998年にベン・オルムステッド氏が作成したパブリックドメインな難解言語, で書かれたプログラムを表示することに特化したプロジェクトです。言語は使うことがほぼできないように設計されています。(しかし)設計上の弱点がこれまでに発見され、使えるプログラムを書くことが可能となりました。これを共有できることは喜ばしいことです

とても短い紹介文で、これ以外には情報がありません。

ページのほとんどを占めるデタラメ風テキストが、そうすると Malbolge 言語のコードだということなのでしょう。

画像もコードも、URLに与えたパラメータに応じて変化しますが、あるページで数えてみると、約5万語、61万文字ありました。

オンラインの Malbolge実行環境(あるんだ…) に最初の一行を食わせてみましたが、エラーとなってしまいました。1行だけ入れても動かないのかもしれません。

ちなみに、サイトにサンプルとしてある Hello, World はこれ

('&%:9]!~}|z2Vxwv-,POqponl$Hjig%eB@@>}=

うん。まったくわからん。

Google は「知らん」と

TheNextWeb が Google にこの現象に関して問い合わせしてくれていますが、これは Google のイースターエッグではないし、同社は c0d3.attorney とは何の関係も無い、という回答が来たそうです。

「一般的な話」として、画像のあるページにある文字で検索したら出るよ、ともコメントにあったということで、ごくごく当たり前のつまらない結論になってしまうのですが、この自動生成っぽい Malbolge 言語のコードの中にアルファベット4文字のセットが大量にでき、その中の2組の4文字をウェブの他のサイトで2つ同時に使ってる他のサイトがほとんど無いために、検索で出てきてしまう、ということでしょうね。

今の時点でも、この謎のサイトを作ったのは誰か、などは判明していません。

純粋なプロジェクトか、意図のあるSEOスパムか?

ドメインの世界では、 .com 以下は、ランダムだろうと意味がなかろうと 4文字のドメイン名はすべて誰かに取得されていることが2013年には報告されています。打ち間違いでもなんでも、4文字.com を入れた人を待ち構えて、広告を見せたりドメインを売りつけたりという商売をしてる人たちがどこかに存在するわけです。

となると、今回のサイトもそういう「迷い込んできた人」を捕まえるために作られた可能性も消し去ることはできません。とはいえ、今のところサイトに来ても、広告があるわけでもなし。単に人が来たからといって得になることなんてあるのかなとも思います。

いろいろな文字列でGoogleから推薦される、と聞くと人によってはたいへん魅力的に感じるかもしれませんが、そのデタラメな文字で迷い込んでくる人が分量としてどれほどのものか、という話もあります。総量としては見つけてやってくる人はそれほど多くないかもしれません。

ですが、今回の件で興味を持った人は、単語になってない日本語の文字の組み合わせを大量に配置するサイトでも作れば、同様の結果を得られたりするかもしれませんね。

via reddit and TheNextWeb

NSFW画像検知APIの優劣比較

NSFW(Not safe for work = 職場閲覧不適)画像、わかりやすい言い方だとエロ画像ですが、画像を渡すとその画像がエロかどうか判定してくれる API というの、結構たくさんあるんですね。

なぜこの種のAPIに需要があるかというと、ユーザー投稿型のwebサービス運営において、広く見せられないような画像を投稿されることが運用の大きな障害となるからでしょうね。悪意のあるユーザーや考えなしのユーザーによって法に触れたりサービスのイメージが悪化するような画像を投稿され、さらにそのことがソーシャルメディアで喧伝されたりすれば、サイトの評判に関わります。

Facebook や twitter のような超大手なら、画像の判定もいくらでも内製できるでしょうが、そうでない小さなサービスでは、多少お金を払ってでも簡易に判定を外部に任せたいところでしょう。

…と、書いていたら、Tumblr が(おそらく Apple に iPhone アプリを禁止された影響で)アダルトな投稿を禁じるという方針転換を発表し、同時に開始したアダルト画像のフィルタリングの誤判定がひどいらしいので、NSFW 判定は多数のエンジニアを抱える大手でも難しい分野なのでしょう。

そんな画像検知のAPI を、Aditya Ananthram さんが、API の検出精度を実験したり、価格を比較したりしてくれています。

調査対象のAPIはなんと11個。このまとまったリストだけでも、取っ掛かりとしてはありがたいですね。

また、セーフ/アウトのアウトの種類もいろいろあるようで、API によっても分類は異なりそうですが、以下のようなカテゴリ分けで判定を試みています。

  • Explicit Nudity (露骨なヌード)
  • Suggestive Nudity (思わせぶりなヌード – 隠すところは隠しているが… みたいなやつ)
  • Porn/sexual act (ポルノ/性行為)
  • Simulated/Animated porn (CGやアニメのポルノ)
  • Gore/Violence (流血/暴力)
  • Safe for Work (職場で問題ない)

実験するにあたって、当然、本物の NSFW 画像が必要となります。ブログ記事自体は必要なところはボカシが入っていて、SFW(safe for work = 職場安全)ですけど、中にGoogle Documents へのリンクがあり、リンク先には今回使用された、正しく分類されたデータが入っています。追試とかしたい方は注意してください。

カテゴリごとに強いAPIはありますが、Google のものがおおむね良い成績を上げたそうで、さすがというところでしょうか。また、Gore/Violence や Safe for Work というカテゴリはどのAPIでも判定は難しいようで、各APIでも誤判定が多かったそうです。このへんは元のテストデータにしても正解かどうか意見がわかれそうですし、「職場で問題ないかどうか」なんて普遍的にわかるものでもないですからね。

擬陽性・偽陰性の多寡を並べたグラフ(Overall Comparison セクション内)や、呼び出し回数に対する価格(Pricing セクション内)などもまとめられているのでこれらを併せて比較することで、予算と精度からどのAPIを調べてみるといいかの手がかりが得られそうです。

Salieo – レスポンシブ・いい感じに画像を切り出し表示してくれるサービス

Salieo は、Javascript で画像ファイルから写真の重要そうなところを切り出して表示してくれるというサービスです。サイトのキャッチは”instantly, intelligently, responsive”(即座に、賢く、レスポンシブに)となっています。

ユーザー登録してAPIキーをもらってみました。同じ一つの写真がこんな風に自動でクロップされて表示されます。

比較のため、スクリプトをオフにすると以下のようになります。横長でも縦長でも、元の画像がそのまま縮むので、車の形がゆがみますね。

# 物があるところをうまく切り出してくれる、ということなのですが、この写真はちょっと例には良くなかったかな。

ユーザー登録した上で、申請したドメインやURLパターンに合致した画像だけが変換の対象となります。変換できる画像の数や変換の回数によって料金が変わりますが、一番下の無料枠でも10画像、月25,000回までの呼び出しができるようです。

先行の類似サービスとして、imaggaImageKit.ioが見つかりましたが、どちらも無料枠は無いようです。Salieo の無料枠もお試し用という感じの枠ではありますが、実際に試せるのはやはりいいかと。

これらのサービスを使えば、切り出しについて特に考えずに元の画像一つをアップロードしておけば、サイトで表示した時にその時の縦横比にあわせて動的にクロップされるわけです。あとは写真から重要そうな場所を切り出す判定部分の精度が良ければ、画像が表示される際の縦横比を固定しにくいサービス運営者からは、有料でも嬉しいサービスとなるかもしれません。

via Hacker News

有名人をフィーチャーしたブラウザ拡張

nCage

説明不要の有名俳優ニコラス・ケイジ。ブラウザ拡張 nCage は、ウェブページ上のすべての画像をニコラス・ケイジの画像に差し替えてくれるという、彼のファンにはたまらない拡張機能です。

Yahoo!ニュースをこの拡張で表示するとこんな感じに。

ncage on Yahoo Japan News

Rick Roulette

YouTube上の動画を、ランダムにリック・アストリーの”Never Gonna Give You Up”に差し替えるという拡張です。置き換わる確率はデフォルトで6分の1、つまり6回に一回ですが、これは設定で変更できます。

ブラウザ拡張の公式サイトがあり、ソースコードはgithubで公開されています

Cenafy

WWEの人気レスラー、ジョン・シナ。シナ化(Cenafy)という名前のこの拡張を入れると、新たにページを開いた際に1/100の確率でジョン・シナ登場シーンの動画を自動再生してくれます。

こちらは動作状態を撮影した動画。動画の00:30 あたりで拡張が発動します。

ファンの人はネットサーフィン中に定期的に流れるシナの動画にアガるんでしょうか。

McKayla Is Not Impressed

アメリカの体操選手マッケイラ・マロニー。ロンドン五輪で銀メダルに終わった際の「不満顔」がネット・ミームとなり、アメリカではとても有名だそうです。

オバマ前大統領と不満顔でのツーショット

「McKayla Is Not Impressed(マッケイラは感心しない)」というネット・ミーム名をそのままつけたこのブラウザ拡張では、ウェブサイト上の画像に、ランダムにマッケイラ・マロニー選手が不満顔で入り込みます。

Cera is planet

子役からコメディ俳優になったマイケル・セラのブラウザ拡張。

この拡張は、サイト上の画像を全部マイケル・セラの写真に差し替えます。さらに、ページ上に”planet”(惑星)の文字があると、”Cera”に置き換えます。

写真共有サービスPhotobucket、ホットリンクでの画像掲載に突然年$399 課金を開始

Flickr500 Pixel などと並び、英語圏での写真共有サービスの大手の一つであるフォトバケット(Photobucket)が、そのサービスを非常にわかりにくい形で突然改変、ユーザー達によれば改悪、し、騒ぎになっているようです。

変更内容はというと、Photobucket のサイト以外からアップロード済の画像ファイルを参照して表示させる、いわゆる「ホットリンク画像」での表示が、別料金を払わないと行えなくなる、というもの。

AmazonやeBay、Etsy などの販売ページの商品画像に Photobucket を使っていた出品者がかなりいるため、それらサイトでの商品画像ページがこんなことになっています。

商品画像のところに出ているのはこれ。

「アカウントを第三者ホスティング対応に更新してください。」 リンク先では、Plus 500プラン、なるプランへ変更すると、画像が他サイトでも表示され、広告も隠される、と案内されています。

このPlus 500プランの料金が年$399(4万3890円) ということ。容量2Gの無料プランの解除が年$99(1万890円) なので、Plus 500 というのはトータルで約$500(5万5000円) というところから来ているのでしょうか。

6月26日に公式ブログで、6月20日から利用規約を更新したという数行のメッセージが出ていたようですが、これが今回のサービス仕様変更に関するものだったのだとか。わかりませんよねこれ。

切手収集愛好家のフォーラムで先月末にこの問題について声が上がったのが最初の一つのようです。そこから各ニュースサイトに取り上げられ、自分の商品ページがひどいことになってると気づいた Photobucket ユーザーがさらに不満の声をあげる、という状況。

登録ユーザー数1億人、掲載画像数150億枚、というサービス規模は、Flickr ほどではないにしても、日本から利用しているユーザーもいるでしょう。ホットリンクで画像を外部サイトに掲載しているところは、まだこのトラブルに気づいていない場合もあるかなと思います。

ネット上での写真の共有は、Facebook や Instagram など後発のソーシャルサービスに大きく喰われていると思われます。その中で既存の容量アップ年$99(1万890円)、ではやっていけなくなったのかもしれません。しかし、隠すようにサービス内容を変更し、代わりに表示された画像で支払いを迫る、というこの動きを「身代金目的の脅迫だ」と感じたユーザーも多く、目先は大量の商品画像を差し替えることもできず$399(4万3890円) 支払う業者がたくさんいたとしても、長期的には他サイトへの流出は避けられないように思います。

via PitaPixel

大量の画像素材で、有名人の顔を合成

素材画像販売の大手 Getty Images 、その大量に抱える素材を活用したクリエイティブで面白いプロモーションをすることがよくあるのですが (参考)、今回のプロモーションは、多数の一般人の顔写真素材を組み合わせて、誰もが知っているあの有名人の顔を作る、というもの。

endless-possibilities-prince-of-wales

ウェールズ公や

endless-possibilities-angela-merkel

ドイツ首相アンゲラ・メルケル氏など。

popular-face-with-getty-images

有名人の顔が少しずつできていく動画を観ていると、顔のパーツに関しては必ずしも同性でなくても似てる人がいる、というのがわかります。

多数の写真から、4か月の実験とテストを経て、有名人のと似たパーツを探しだしたということです。

機械学習などを活用して、機械にこういった写真を合成させることは今後どんどん簡単になっていくでしょうね。

本人の写真や映像をまったく使わずに、その人の表情や立ち居振る舞いを再現できるようになる未来もこのままいけば実現できてしまうわけで、そうなった時に肖像権とかはいったいどう判定されるのでしょうかね?

via Design Boom