「研究」タグアーカイブ

Speech2Face – 声からあなたの顔つきを当てる研究

声から、喋っている人がどんな顔なのかを推定する、という研究です。

上に並んでいるのが、短文の音声メッセージの話者です。これ左端はダニエル・クレイグ氏(007)ですよね。他はわかりませんが。

サイトで再生ボタンを押すと、推定に使われた音声データが聴けます。10秒も無いぐらいの短い文章です。

そして、下に並んでいるのが、その音声から深層ニューラルネットワークを利用して推定した話者の顔。

学習データとしては、インターネット/YouTube 上の数百万の人が喋っている動画を使ったそうです。「こんな風貌の人は、こんな風に話す」というデータを大量に食わせることで、「こんな風に話す人は、こんな見た目なことが多い」という変換を得たということですね。

推測結果には性別・ジェンダー・人種など繊細な問題が絡むことから、倫理的な注意書きが添えられています。学習データは全人類の平均的な喋り方を集めたのではなく、YouTube などから動画を集めたことから、データには当然バイアスがあります、と。YouTube に出ているような人の喋り方、に偏っているかもしれないし、喋っている言語のサンプルが少なかったりする言語の場合も偏りがあるかもしれない、などなど。

また、話者本人を特定したり、話者のファッション(髪の色やメガネ等)を特定したりは当然できません。(メガネをかけた人特有の話し方、とかない限り)

アプリやブラウザに対して喋ると顔写真を出してくれたり、というお遊びサービスは面白そうですが、その先にどのような実用的な応用がありうるのか。何か面白いことができそうな研究ではありますね。

via Futurism

ペンや筆の動きを推測してコピーできるロボットの研究

ブラウン大学のコタニ・アツノブさんらの研究 Teaching Robots To Draw(ロボットに描き方を教える)は、手書きの文字や絵画をロボットに真似させるというものです。

漢字を含め、ギリシャ語、タミル語、ヒンディー語など様々な文字について、文字のフォントや書き順情報を知っているわけでもなく、書いている途中の様子を見るでもなく、書かれた結果から書き順を推測して、同じような結果になるように書くのだそうです。

動画のデモを見ると、書き順は必ずしも人間が書いたオリジナル通りでもなく、しかし書き終わった結果はオリジナルと似ている、という感じですね。

今の結果としては、単純なコピーや写真の方が複製として優秀なのでしょうけれど、書き順を再現できるということは将来的に契約のサインを真似たり、タッチを含めた名画の複製ができたりする可能性がありますね。まるっきりの複製ではなく筆致が似てるということから、亡くなった書家や画家の新作(風)、みたいな作品もそのうち生まれ得るのかもしれません。

via Tech Explorist

超伝導ダンス – あなたの研究を踊ってみてコンテスト優勝作品

第11回 あなたの博士課程を踊ろう! コンテストの最優秀賞というのが公開されています。

こちら、超伝導理論を研究するカナダ・アルバータ大学のプラモド・ヤパ氏(Pramodh Yapa
)とその仲間たちが6週間掛けて製作したという、超伝導理論を説明するミュージカルダンス

一人一人のダンサーを電子に見立てて踊っています。超伝導状態で二つの電子がクーパー対を形成するというところが、二人組でのダンスに。

説明を聴いても言ってることは難しいですが…

第11回、ということで11年やってるコンテストだそうですが、今年はなんと50個もの応募があったそうです。

最優秀賞の他に、3つの優秀賞も選出されています。

生物学部門から、「脳の意識」

化学部門から、「浸透理論 – 導電プラスティック」

社会学部門から、「物理学を学ぶためのドアとしてのムーブメント」

大学院の専門となると一般の人に話してもなかなか理解されないことも多いと思いますが、自分の研究を紹介してみよう、という気にさせるコンテスト、面白いですね。

via Science Magazine via Winning Science's annual 'Dance Your Ph.D.' contest, physicist depicts electrons swinging on superconducting wires | EurekAlert! Science News

目が見えなくてもレーシングゲームができるようにする研究

コロンビア大学博士課程のブライアン・A・スミスさんが開発しているRacing Audio Display(RAD)は、音の情報だけでビデオゲームを遊べるようにするためのユーザ・インタフェースです。

コースに対する車の角度によって変わる音と、次にどちら向きのどんなカーブが来るかという音声情報の2種類によって、コースをはみでたりせずにコーナーをうまく回ることができるということです。このシステムにょって、目が見えているプレイヤーとそれほど違わない速度を出せ、よく練習した人ならタイムを上回る場合もあるということ。

研究紹介の動画では、画面を横にして隠しても、まったく影響なくレースを続けることができています。

ヘッドフォンから聴こえている情報、をこの動画で体験できるわけではないのですが、実際にどう聴こえるのかも知りたいですね。

研究の今後では、レーシングゲーム部分にライバル車を登場させた上でゲームができるようにしたり、アドベンチャーゲーム、ロールプレイングゲーム、ファーストパーソンシューティングゲームなど他のジャンルにも同様の仕組みを組み込んだりすることだそうです。

via GamesBeat

bikesphere – 自転車の周りに光の結界を張るミシュランの研究

ゴムタイヤとグルメガイドで有名なミシュランのスペイン支社が公開してるBikesphereは、自転車のライトを「より賢く」改良するもの。

動画を見ると、自転車を中心とするような大きな円を、道路上に投映するものだというのがわかります。見た目も普通の自転車ライトの大きさなので、さすがに光量はそれなりで、ぼんやりとした円でしかないのですが。

そしてこのライト、車の接近を感知すると動作を変えます。車が近くに来たな、と検知すると、路上へ投映する光が強く大きくなるようです。この動作切り替えによって、危険のなさそうな時はバッテリーを節約し、必要な時のために持たせることができるのでしょう。

小さくて電池の消費も少なく、安価なセンサがでてきたからこそ実現しそうなデバイスですね。

「運転席のコスプレ」で運転する謎のバン。無人運転車への人々の反応を見てる?

バージニア州アーリントンで先週、街中を普通に走る”無人運転車”が、テレビ局関係者によって発見されました。まだテストコースでの実験段階のはずの無人車が一般道を走っているなんて、と追跡した記者が目にしたのは、本物そっくりの座席を着た、人間椅子のコスプレイヤー。上半身が座席で、下半身は半ズボンという半席半人の怪人です。

ツイッターでそのファーストコンタクト動画が流れています。

「あなたは誰?」「何をしてるのか?」「ニュース局です」「ちょっとお話聞かせてもらえますか?」などと話しかけているのは、NBCテレビ・ワシントン支局のスタッフ。座席男は一言も発せず走り去ったということ。

上記ツイッター動画がネットで大きく広まった後の今週、NBCテレビは続報で一応の謎解きを出しています。

NBCは、ネットを含め各所に問い合わせをしていたようですが、そんな中でバージニア工科大の中の人から電話で情報提供が有ったということ。

その電話によれば、コスプレ運転席男の活動は、バージニア工科大が行う自動車に関する研究の一環で、「実世界の反応を見るために行っている」ということ。研究の詳細は明かされず、大学としては「市の担当局には届け出ている」と語ったそう。州の運輸局はこの実験を知らず、地元警察は「驚いた」と回答したそうです。

個人でこういうイタズラをする人は居て、YouTube に動画も上がってたりするのですが、大学が研究でやってるんですね。これから自動運転車が普及したら、街は有人運転と無人運転が混在する時代になるわけで、そのあたりを見越して何か調べたいと思っているのかもしれません。

via Ars Technica