「音声」タグアーカイブ

Q – 性別のない合成音声=ジェンダーレス・ボイスを各社音声アシスタントに採用呼びかけ

Q は、グーグル/アップル/アマゾン/マイクロソフトなどIT大手のスマートスピーカーや音声アシスタントに向けて提案された、男性でも女性でもない合成音声です。

サイトトップでクリックすると、その男女どちらでもない合成音声を聴いてみることができます。

デンマーク・コペンハーゲンのLGBTパレード団体やAIのバイアス問題に対処しようという団体らによって制作されたこの音声は、GoogleアシスタントやAmazonアレクサなどの音声アシスタントの音声が「男性声」「女性声」からの選択を強いていることに対する問題提起だということ。

言われてみれば、機械で合成しているのだから人工音声で男性か女性の声を選ばないといけない理由はないわけです。

「テクノロジー企業は、合成音声の性別を選択できることで人々がより快適になると信じ、性別をテクノロジーに持ち込んでいます」

「残念なことに、これらによって性別が必ずはっきりどちらかの2つに分かれる、というステレオタイプの永続化が補強されてしまうのです」

なるほど。応答ができて情報が返せればいいのですから、機械の合成音声にわざわざ性別を与える必要はないのかもしれません。男性声・女性声が今すぐ無くなるとは思えませんが、中性声を追加することはそれほど抵抗なく採用してもらえる可能性もあるのではないでしょうか。

このQの音声モデルは、数千の候補者から数人を選び、その人たちに話してもらった声のピッチを変換することで作ったと、紹介動画にありました。

「世界初のジェンダーレス音声」とサイトでは言っています。これまでも中性的な音声合成はいろいろ存在していたと思うので、世界初は言い過ぎではないかとも思いますが、ジェンダー中立を訴えて作成されたという意味ではこれまでになかったものでしょうか。

via Hacker News

voicecoder.net – Alexaの音声でカスタマイズできるゲーム

Voice Coder、「音声でコーディングを学ぼう」とあるこのプロジェクトは、Amazon Alexa を使って初歩のプログラミングを学べる、というサービス/スキルです。

Alexa スキルと連動させたブラウザゲームにおいて、横スクロールゲームで背景画像を切り替えたり、自機が地面や障害物、アイテムと衝突した際に起こるイベントを切り替えたり(ライフが減る、音が鳴る、ポイントが増える、など)を、音声で指示することができます。

と、動画のデモでは動いているのですが、実際に自分で使おうとすると、Alexaスキルがうまく動いていないのか、アクセスコードを話してくれず、自分でプログラミングを試すことはできませんでした。

元のゲームのパラメータを音声で変えられる、と言ってしまえばそれだけで、「音声でプログラミング」は言い過ぎかもしれません。ですが、スマートフォンで文字を書いたり、パソコンでキーボードを打ったりすることが身についてない小さな子供でも、このような音声インタフェースなら使うことができます。ゲームもプログラムで動いていて、それを変更することができるんだ、という体験をさせるにはいいのかもしれません。

via Hacker News

子供の歌声を腕のイレズミにした母親

腕の刺青に対してスマートフォンをかざすと、スマートフォンから子供のかわいらしい歌声が再生される、という動画がありました。

見た目のインパクトはあるし、音声波形らしき入れ墨なのでイレズミとして実際の声の波形を彫り込んだのかと最初思ったのですが、どうもそうではなさそう。これは、Skin Motionというサービスが生成した「波形風のバーコード」で、このサービスのスマートフォンアプリを使って認識させて、サーバ側にアップロードしておいた音楽/音声を再生させているということのようです。

二次元バーコードの刺青で参照先のコンテンツを再生する、という話だとそれほど珍しいわけでもなくて、QRコードのイレズミが5,6年も前のものがいくつも見つかります。

普通の一次元バーコード刺青となると、それこそスマートフォン以前からありますし。

この手の「実体はインターネット上などにあって、そこをポイントしているだけ」の情報の体への埋め込みは、リスクが高そうな気がしますねえ。サービス提供者が停止したらどうするんだ、とか。イレズミの場合は、皮膚に傷がついたり、シミやシワが増えたりしただけで、読み取りできなくなりそう、というのもありますし。

さらに、このSkin Motion、アプリの登録に39.99ドル(4320円)、毎年のサービス料も9.99ドル(997円)掛かるようです。

背中のイレズミに財宝のありかが隠されている、だと伝奇小説によくありそうな話ですが、毎年お金を払って維持するようなもの、となると刺青を彫るのが普通という文化の人にとっても、賢い選択とは言いにくいのではないかなあ…

via Geekologie

AutoMute – ブラウザの音声再生を全部デフォルトオフにできるChrome拡張

AutoMute は、Chrome ブラウザからとにかく音が出ないようにできるブラウザ拡張です。

インストール直後の設定は、あらゆるサイトでの音声がオフになっています。すべてのタブにミュートのマークが表示され、マークをクリックしたり、拡張アイコンのメニューから選択したりすることで、個別に再生を許可することもできます。

YouTube など、サイト側で用意しているミュート機能とは別のレイヤで止まっているため、場合によっては拡張でアンミュートして、動画側でのアンミュートして、としないと聴こえないこともあります。

音楽等が突然再生されたりすると非常に困る、といった職場で働いているような人たちは、保険のために入れるといいのかもしれませんね。絶対にどんな音も鳴らなくていい、ということなら、OSのドライバを止めるとかイヤホンジャックを埋めるとかもありですが、この拡張であれば、音がしても大丈夫なサイトだけ許可したり、どうしても音を聴かなければいけない時だけ設定を変えて聴いたりすることができます。

via LifeHacker via TheNextWeb

Google Homeがディズニーの新作「美女と野獣」の頼まれない広告を流す

家庭用の音声アシスタントとしてAmazonエコーと競争中のGoogleホームですが、ユーザーが望んでもいない新作映画の宣伝を勝手に始められた、という話がネットに流れて問題となっているようです。

あるユーザーが撮影した動画がツイッターに上がっています。

「OKグーグル、今日の僕の予定は?」と語りかけると、時刻、天気予報、職場までの予想通勤時間、を話した後に、「ところで、ディズニー映画『美女と野獣』は本日公開です。今回は(父親の)モーリスではなくベルが発明家です…」から、ベルについてもっと知りたければ質問して、と続けています。

ユーザーがディズニーや美女と野獣について質問した結果話しているのではなく、今日の予定の後に勝手に宣伝を始めているように見えます。reddit では、これに不快感を覚えた人たちが議論しています。「Amazon Echo とどっちを買うべきかはっきりしてよかった」などというコメントもあります。

ITブログVentureBeatがGoogle社に問い合わせたところ、「これは広告ではありません。我々のパートナーをゲストとして迎え、彼らのお話をシェアしてもらっただけです」という返事が来たのだと。

VentureBeat によれば、現地の午後3時過ぎには今日の予定を聞いても美女と野獣については話されなくなったということ。また、消息筋の話ではグーグルとディズニーの間に今回お金のやりとりは無かったようだとの話も。

「お金が動いてないから広告ではない」とは思いませんが、テキスト検索の横に広告を出して儲けるのが本業の会社ですから、音声アシスタントの会話に広告が混ざってくるのもある意味既定路線なのかもしれません。近未来の家の中は多少なりともこんな感じになっていくのでしょう。

ウェブサイトの横に出てくる広告は無視できても、音声で喋られると無視は難しいし、購買行動に何らかの影響は与えられるかもしれないですね。

AmazonエコーとGoogleホームで無限ループ会話

人類が滅んだ後にロボット同士が会話し続ける、みたいな

Amazonの音声アシスタントEchoと、Googleの音声アシスタントHomeを並べて、無限に続く会話をさせている動画です。

動画主アダム・ジャコウェンコさん「アレクサ、今晩の僕の予定は?」
Amazon Echo「今晩は一つのイベントがあります。6時に『ヘイ、グーグル。今晩の僕の予定は?』があります」
Google Home 「今晩6時に予定があります。タイトルは『アレクサ、今晩の僕の予定は?』です」
Amazon Echo「今晩は一つのイベントがあります。6時に『ヘイ、グーグル。今晩の僕の予定は?』があります」
Google Home 「今晩6時に予定があります。タイトルは『アレクサ、今晩の僕の予定は?』です」

…以下無限に続く。

via Geekologie