「機械学習」タグアーカイブ

顔認識がアジア系男性を「目が開いてない」と拒絶 ニュージーランド

Facebook上でニュージーランド人のリチャード・リーさんが公開したメッセージがこれ。

パスポートの更新をしようとオンライン手続きをする際に、自分の顔写真をアップロードしたところ、「被写体の目が閉じています」というエラーになって受け付けてくれなかった、という事件です。

多数の既存の顔写真を機械学習させた結果で、目を閉じている写真をエラーにしているのだと思いますが、教師データとして世界中の顔写真ではなく、ヨーロッパ系やマオリ系が多数というニュージーランドの顔データを使ったのかもしれません。

アジア人の目をことさら取り上げたり強調して描いたりすることは、人種差別として厳しい批難を受けるようになってきています。10月に欧州連合の委員が巻き起こした事件は記憶に新しいところ。

欧州連合(EU)のギュンター・エッティンガー欧州委員(デジタル経済・社会担当)=ドイツ=が、中国人を「つり目」と呼ぶなど差別的な発言を繰り返していたことが暴露され、批判にさらされている。

差別発言に批判=欧州委員、中国人を「つり目」:時事ドットコム

上の記事がYahoo!ニュースに転載されていた時に寄せたコメントが掲載終了で見えなくなっているので、こちらに転記しておきます。

つり目(slant-eyes)は、西洋において東アジア人の顔面の特徴を揶揄する際に使われる典型的な差別表現になっています。2008年にはスペインのバスケットボール・ナショナルチーム、2009年には歌手のマリー・サイラス、2013年にはスペインのバイクレーサー、マルク・マルケスがこの表現で炎上しています。

今回は中国人を指してのものですが、マルク・マルケスの時は日本人が対象でした。

今回のリーさんは、笑い話として共有して世界中に広まりましたが、そのコメント欄でやはり差別的な書き込みをするような人も出てくるわけです。

ニュージーランドのパスポートセンターも、悪気があってシステムを作ったわけではないと思いますが、機械学習のための元データの選定についても学習させるデータのセットが本当にそれでいいのか、というのを考えないといけないのでしょうね。

via Bored Panda

山道を自動で飛んで遭難者を発見するドローンの研究

チューリッヒ大学などのグループによる、無人ドローンを飛ばして山で遭難した人を探す研究が進んでいるそうです。

drone-follows-trails-1

山の中の道がどちらに続いているか、は、これまでは自動で判断できなかったということですね。

スイス国内だけでも、山での怪我や迷子による救援要請は毎年1000件以上あるということ。安価なドローンを同時に多数飛ばし、山道を捜索させることで、発見・救助までの時間を大きく短縮できる可能性があるのだとか。

森の中の小道を自動的に判断して飛んでいかせるためには、人工知能の技術が使われています。森の中を飛ぶには、枝や葉などの障害物をうまく避けて飛ぶ必要があり、また道がどちらに続いているかは時として人間でも間違うこともあります。

drone-follows-trails-2

ヘルメットをつけた人間がアルプスの中の山道を歩き回り、2万枚の写真を撮影し、そのデータを基にディープラーニングをさせたところ、まったく知らない新しい場所においても、85%の確率で正しい方向を当てられるようになったそうです。85%が高いかどうかですが、人間による判断では82%ということで、人間並みかそれ以上の能力と言えます。

drone-follows-trails-3

人間の捜索隊には二次遭難の危険もあります。遭難が起こった状況では天候などの状況も悪いケースも多いでしょうし、ドローンによって遭難した人を素早く見つけられるとすれば、これまでは助からなかった遭難者も多くが助かるようになったりするのかもしれません。また、山での捜索の話で良く出てくる、多数の人間を長期間動員したために遭難者や家族が大金を支払わなければならなくなった、というような問題も減らせるかもしれません。

ドローンでピザを配達する研究もいいですが、人命救助ができるドローンも、ドローンの活用法として良いアイデアだし、早く実用レベルになって普及するといいですね。

via Trackimo

TERRAPATTERN – 航空写真地図の類似画像検索サービス

アルファ版として公開された TERRAPATTERN は、航空写真地図を使った類似画像検索サービスです。

GoogleマップやOpenstreetMapなどでおなじみの、航空写真をスクロールして閲覧できるUIの上で、適当なブロックを指定してみます。

たとえば、とあるテニスコートのところをクリックすると、同じ都市の中から、似たような場所を列挙してくれるというわけです。

terrapattern-tenniscourt-in-sf

こちらはとあるマリーナを選んだ時の結果

terrapattern-marina

なお、現在は、タイル状の航空写真をその形で機械学習に掛けているということで、人間が認識する「目立った構築物」がすべて見つかるわけではなく、タイルの中の形や色のパターンが似ているものが出てくる仕組みということです。

TERRAPATTERN は今のところ、ピッツバーグ、サンフランシスコ、ニューヨーク、デトロイトの4つの都市だけに対応していますが、ソースコードはMITライセンスでGithub上に公開されているということなので、自分の見たいデータを入れて動かしてみることもできるでしょう。

via FlowingData

lexiconjure – 機械学習で英単語の意味を作り上げるツイッターbot

ロス・グッドウィンさん(Ross Goodwin)の手によるツイッターアカウント@lexiconjure は、それに向けてアルファベットの単語をつぶやくと、その単語の意味を「生成」して返してくれるという新しい自動応答ボットです。

たとえば、Hexidecimated, 「16進数にされた」的な造語を与えられて、こんな定義を生成しています。

Hexidecimated

[形] アメリカ合衆国ヘキシカ島時代に関する/意味する。Hexide は北半球で強調される音節を持ち、イスラム教徒とユダヤ教徒が住んでいた。

[名] Hexidecimateの子孫

19世紀後半: ギリシア語の hexis (健康) + kedimē (種) から

なんかもっともらしいんですが、デタラメです。

この定義、オックスフォード辞書のデータからディープラーニングを使って自動生成しているそうです。

既存の辞書の定義をなぞって、あるはずのない言葉の定義をそれらしい英語と辞書っぽいフォーマットで生成してくれるというわけですね。

PythonのソースコードがGitHubで公開されています。

もう一つ傑作を紹介。このbotが紹介されたHacker Newsのコメント欄より。

ycombinator

[名] 受け入れられる状況に対して騙したり敵意を見せたりするように設計された人物

Y Combinator はHacker Newsの運営元ですね。

辞書風の定義文はTwitterの(今の)文字数では収まらないので、完全版はTumblrの方で記録されています

多数のツイッターユーザーから辞書にない単語も与えられていますし、”love”のような辞書に既にあるはずの単語も与えられ、それについても新しい「意味」が生成されています。

lexiconjure-top

AWSの無料枠を使って運営され、90分に一個の定義を返すようになっているそうで、現在はリクエスト殺到のため返答が遅れている状況です。

辞書にない単語の定義をでっちあげるゲームとしては、昔フジテレビで深夜にやっていた「たほいや」がありました。英語圏では「ボルダーダッシュ」(たわごと)とか「フィクショナリー」(フィクション+ディクショナリー)と言うそうです。

http://www.amazon.co.jp/dp/4594012582/

via Hacker News

メールの返信をプログラムが「提案」する機能をグーグルが開発

本日、グーグルのリサーチブログで、メールの返答を勝手に考えてくれる機能 Smart Reply ができた、という発表がありました。smart reply = 賢い返答、ですね。

まだこの Smart Reply を試せるところは無いようですが、Gmailブログに出ているアニメーションGIFで、どんな感じの機能かが見て取れます。

(credit: Gmail Blog)
(credit: Gmail Blog)

「来月休暇を取ろうと思うんだけど、あなたの休暇予定は決まってるか? 決まってたら教えてほしい」という、社内での休暇取得を調整するメールに対して、アプリの下部に3種類の回答案が表示されます。

「まだ計画してません」「ちょうどあなたに送ったところです」「今それについて検討していたところです」の3つの案が表示され、このユーザーは3つめの案を選び、そこに続けて自分の言葉でメールを続けていきます。

今回ブログで報告しているグーグルの研究者Greg Corradoさんは、モバイルでメールの返事を書くことのたいへんさから、もしメールの内容が簡単な返答で済むようなものかどうか判定できて、ワンクリックで選べる雛形が出てきたらどうだろう、という同僚のアイデアを聞いて、挑戦してみようと思ったとのこと。

6月に発表された論文では、大量の既存の会話データを使い、しかし英語についての知識は内蔵していないプログラムによって、人生の意味について人間とチャットするプログラムを作っていますが、今回の成果はその研究の延長にあるということ。

このスマートリプライシステムでは、時系列データ(この場合は単語-単語のつながり)を扱うリカレントニューラルネットワーク(RNN)二組の一方で受け取ったメールをエンコードしていき、他方で可能な返答を予測していくそうですが、この時に伝わるベクトルが、「あなたは明日フリーですか?」という文章と「明日は都合の良い日ですか?」という文章でちゃんと似たものになるそうです。

また、3つの提案がどれも似たものになってしまう、というプロトタイプの問題点は、3つの回答の意味がそれぞれ離れたものになるように調整したのだとか。あと何にでも「愛してるよ」と返してしまう癖があって困った、みたいな話もあって興味深いです。感謝の気持ちを表すのにそういう言葉も多々含まれるからだろう、ということで、そのへんは出にくくなるように調整したのだとか。

今週後半には、AndroidiOS の Inbox アプリで、この Smart Reply が使えるようになるということです。残念ながら英語のみですが、アプリの対応版が出たらぜひ試してみたいところです。

こういう研究がさらに進んでいけば、提案から選ぶ、どころではなく、単純なものや定期的なものについては、プログラムが勝手に応答してしまうような未来も来るのかもしれないですね。

MarI/O – ニューラルネットワークと遺伝的アルゴリズムでマリオの早解き

ニューラルネットワークと遺伝的アルゴリズムの組み合わせにより、ゲーム「スーパーマリオブラザーズ」の一面を教師無し学習で解かせている動画です。

mario-neural-network

最初に学習が十分済んだ状態のプレイが実演されますが、1面を46秒で解いています。世の中には41秒で解いてる動画もあるようですが、かなり早い部類と言えるでしょう。

0:46 からは、今回の解法についての解説です。マリオを含む画面上の地形やキャラクターのスプライトを入力に、どのボタンを押すかを出力としたニューラルネットワークをランダムに作り、うまくいったネットワークを組み合わせて次の世代のネットワークを作り試行させます。これを繰り返し、この例では34世代目でマリオが46秒でゴールに到達する組み合わせが出来ています。

luaのソースコードがPastebinで公開されているので、追試も可能かもしれません。NESエミュレーター(Bizhawk Emulator)とマリオ本体が必要だと思いますが。

SethBling さんは、マインクラフトなどゲームを扱った多数のヒット動画を持つ人気ユーチューバーでもあり、今は抜かれました(この記事執筆次点で歴代9位)がスーパーマリオの早解きで世界一を取ったこともあります。もしかすると早解きのルートはこのようなプログラムの解析を参考にしたのかもしれません。

# あるいはその早解きプレイ動画自体がこうしたプログラムによるものだった可能性もあるのかも

via TNW