「比較」タグアーカイブ

NSFW画像検知APIの優劣比較

NSFW(Not safe for work = 職場閲覧不適)画像、わかりやすい言い方だとエロ画像ですが、画像を渡すとその画像がエロかどうか判定してくれる API というの、結構たくさんあるんですね。

なぜこの種のAPIに需要があるかというと、ユーザー投稿型のwebサービス運営において、広く見せられないような画像を投稿されることが運用の大きな障害となるからでしょうね。悪意のあるユーザーや考えなしのユーザーによって法に触れたりサービスのイメージが悪化するような画像を投稿され、さらにそのことがソーシャルメディアで喧伝されたりすれば、サイトの評判に関わります。

Facebook や twitter のような超大手なら、画像の判定もいくらでも内製できるでしょうが、そうでない小さなサービスでは、多少お金を払ってでも簡易に判定を外部に任せたいところでしょう。

…と、書いていたら、Tumblr が(おそらく Apple に iPhone アプリを禁止された影響で)アダルトな投稿を禁じるという方針転換を発表し、同時に開始したアダルト画像のフィルタリングの誤判定がひどいらしいので、NSFW 判定は多数のエンジニアを抱える大手でも難しい分野なのでしょう。

そんな画像検知のAPI を、Aditya Ananthram さんが、API の検出精度を実験したり、価格を比較したりしてくれています。

調査対象のAPIはなんと11個。このまとまったリストだけでも、取っ掛かりとしてはありがたいですね。

また、セーフ/アウトのアウトの種類もいろいろあるようで、API によっても分類は異なりそうですが、以下のようなカテゴリ分けで判定を試みています。

  • Explicit Nudity (露骨なヌード)
  • Suggestive Nudity (思わせぶりなヌード – 隠すところは隠しているが… みたいなやつ)
  • Porn/sexual act (ポルノ/性行為)
  • Simulated/Animated porn (CGやアニメのポルノ)
  • Gore/Violence (流血/暴力)
  • Safe for Work (職場で問題ない)

実験するにあたって、当然、本物の NSFW 画像が必要となります。ブログ記事自体は必要なところはボカシが入っていて、SFW(safe for work = 職場安全)ですけど、中にGoogle Documents へのリンクがあり、リンク先には今回使用された、正しく分類されたデータが入っています。追試とかしたい方は注意してください。

カテゴリごとに強いAPIはありますが、Google のものがおおむね良い成績を上げたそうで、さすがというところでしょうか。また、Gore/Violence や Safe for Work というカテゴリはどのAPIでも判定は難しいようで、各APIでも誤判定が多かったそうです。このへんは元のテストデータにしても正解かどうか意見がわかれそうですし、「職場で問題ないかどうか」なんて普遍的にわかるものでもないですからね。

擬陽性・偽陰性の多寡を並べたグラフ(Overall Comparison セクション内)や、呼び出し回数に対する価格(Pricing セクション内)などもまとめられているのでこれらを併せて比較することで、予算と精度からどのAPIを調べてみるといいかの手がかりが得られそうです。

ポテトチップスの空気量を調べたインフォグラフィックス

How Much Air is in Your Bag of Chips?(チップスの袋の空気量)は、14種類の有名なポテトチップスを購入し、その袋の中のどれぐらいが空っぽか、というのを計った調査と、その結果のインフォグラフィックスです。

59%が空気というチップスから、19%が空気というものまで、14品種のポテトチップスの空気の割合が並べられています。平均は43% ということで、スーパーでポテトチップスを買っても、半分近くは空気だということですね。

それぞれのパッケージの価格や内容量もあるので、空気が多いものが量が少ないというものではないでしょうけど、袋を開けてみてがっかりするのが嫌なら、空気率の低いブランドを選ぶのがいいのかもしれません。

測定方法は、同じ商品を2セットずつ買って、水に沈めて水位の変化でパッケージの体積を計測、次に空気を吸いだしたものを同じく水に沈めて計測、2回の平均を取った、ということです。

ヘンリー・ハーグリーブスさん(Henry Hargreaves)が2015年に同様の調査を公開していたそうで、今回のインフォグラフィックスも参考にしたそうですが、二つの調査結果を比べると、70%が空気だった2015年の調査からすれば、今回の空気の割合は43%と、だいぶ改善したようです。もし、これらの調査結果が報道されたことで、空気を増やし続ける動きにブレーキが掛かったのだとすれば、消費者にとっては良い調査でしたね。

via Bored Panda

もし地球がバスケットボール大だったら? 地図上で太陽との距離を確認できるwebサービス

太陽系の大きさを、身近な地図上で実感するためのサイト Soalar System Maps

もし地球がバスケットボールの大きさだったとして、東京日本橋のサイボウズ本社に太陽があったとしたら、

太陽の大きさがこんなで、

バスケットボール大の地球は、国会議事堂あたりを回っているかもしれない、と。

サイトでは、他の惑星を選ぶこともでき、またバスケットボールだけでなく「もしテニスボール大だったら」も選択することができます。

天文学的な距離や大きな量を卑近な例に縮小することで感じる、という教材はよくありますが、自分の家や良く知っている場所を太陽にできることで、さらに理科への興味を持ってもらったりすることもできそうですね。

Angular で書かれたソースコードはこちらで公開されています

サイトの作者が「この動画からインスピレーションを得ました」と紹介している、もし太陽がサッカーボールだったら各惑星(存在の可能性が言われる第9惑星も)はどこ? も面白いです

カリフォルニア大火災の前後を衛星写真で見比べるサービス

カリフォルニア州サンタ・ロサで発生した大規模な山火事、40人以上の死者を出し、一週間経ってもまだ完全に収束してはいないということです。約10万人が避難し、多くの家が焼けてしまったということで、被害の映像もいろいろと入ってきています。

10月12日、火事の後の衛星写真を使ってRobin Kraftさん(@robinkraft)が作ったのは、この被害地域の衛星写真を火災前と後で一つに並べ、マウス操作でオーバーレイされた二つの画像を見比べることができるサイトです。

左にスライドすると、火事の後の写真が見られます。デフォルトで表示される地域は、地域中の家が燃えて灰となってしまっていますが、画面の左端のあたりでは、延焼が止まって家々が残っています。

赤いところは木々の緑が赤方向にずれているためで、赤外線カメラでの撮影による影響ということです。家が次々と燃えても、家の間の木々は結構残っているものなんですね。

こちらのニュース記事には、山火事が起こった領域が地図に描かれていますが、複数の離れた箇所で発生し、それぞれが大きく燃え広がっていることがわかります。

画像比較スライダー(image comparison slider)などと呼ばれる、比較的新し目のUI、ニュースサイト等でもよく見るようになってきましたが、このような事件で被害の深刻さを見せるには大きな威力を発揮するようです。

via Maps Mania

強い訛りの英語がSiri, アマゾン, グーグルの音声認識にどれぐらい伝わるか実験した動画

変わったアクセントの英語に、各社の音声認識はどれだけ対応できるのか、という実験動画です。

挑戦したのはこちらの8人。英語圏の5つの方言(アメリカ、スコットランド、アイルランド、英国、オーストラリア)に、非ネイティブの日本・ドイツ・イタリア語話者。

アップルの Siri, アマゾンの Alexa, グーグル Home に、それぞれのお題を自分の訛りで話しかけて、認識されるかどうかを見ています。

最初のお題は「ウスターソース(Worcestershire sauce)を買い物リストに入れて」。非英語圏の3人でAlexa が苦戦していますね。(結果 2:09頃) 1:55頃、日本語担当の人がすごい日本語訛り英語で話しても、Google は拾っています。

あとの3問は「ベネディクト・カンバーバッチの生まれた日は?」「ワガドゥグはどこの国の首都?」「Westworldの作者は?」

普通の英語で話せる人たちが、自分の訛りをわざと強調して話しているというところもあるし、たった8人での実験なので個人差によるものも多いだろうと思います。ここで出た結果を見て Google Home が一番、というのは早計過ぎると思いますが、3つのアシスタントといろいろな国の出身者が集まったところで遊びとしてやるのは面白いかもしれません。

これらの会話アシスタントの開発企業はずっと多くのいろいろな訛った話者を使って日夜改善作業をしていることでしょうね。いずれは人間がわからないような強い訛りでも拾えるようになることでしょう。

via Likecool

任意の二つの国の大きさ比較をブラウザ上でできる Which is bigger: Africa or North America

Is Africa bigger than North America (アフリカは北米より大きい?)は、世界地図上の好きな2点を自由に重ね合わせて、国や大陸の大きさを簡単に比較できるweb上のツールです。

compare-countries-on-globe-tool

左側の二つの地球をマウスで回して、比べたい2地点を決めると、右側で二つの地図が重なって見えます。

madagascar-and-japan
(マダガスカル島と日本)

よく使われるメルカトル図法の世界地図では、南北の極地に近づくほど地図上の面積が実際の面積より大きく見えてしまいます。グリーンランドやカナダが大きく見えたり、アフリカが小さく見えたりするので、メルカトル図法の地図に慣れていると直感的には国や大陸の大きさ比較がうまくできません。

地球全体を一度に描こうとしなければ面積のずれは発生しにくくなるわけで、表示できる縮尺を限定して好きな位置を中心に2枚の地図をオーバーレイすることで、大きさの比較だけをやりやすくしています。

D3.jsを使ったソースコードも公開されています

via Flowing Data