All Articles by Akky Akimoto

2704 Articles

Uncover Harassers – #MeTooされた有名人の名前をハイライトするブラウザ拡張

Uncover Harassers は、セクシャルハラスメントの告発を受けたことがある有名人のリストを保持し、ブラウザのニュース記事などでその有名人が出てきた時にハイライト表示するというChromeブラウザ拡張です。

例として出てくる画像では、一年前に5人の元生徒らから告発された人気俳優ジェームズ・フランコ氏(James Franco)を例に使っています。左が通常のニュース記事なら、名前の部分が赤くハイライトされて目立っています。

さらに、ハイライトされた名前に対して、どのような告発がいつ有ったか、といったソースを辿れる情報も表示されます。

氏名やニュース概要、ソースのURLなどの情報はすべて拡張のソース内にありました。これとツールチップのTippy.js、ハイライターのmark.js が同梱されているだけなので、とりあえず今のv2.3.0 はおかしな動きはしなさそうです。データの更新でバージョンが上がる作りなので、先のことはわかりませんが。

気になる名簿の根拠ですが、タイム誌によるこちらの特集記事やニューヨークタイムズの記事を参考としているそうです。タイム誌の記事では、ハーヴェイ・ワインスタイン氏に対するMeToo告発の後に告発を受けた、実に142人もの有名人が列挙されています。

載ってない告発された有名人については、フォームで受け付けて更新するということ。

作者のサリム・ハックさん(Sarim Haq)は、一か月ほど前にジェームズ・フランコ氏の出演した映画「ディザスター・アーティスト」の感想をフェイスブックで書いた際に、友人にフランコ氏のMeToo騒動について初めて教えられ、ひどい行為をしたことを認識せずに有名人の宣伝に加担してしまうことを問題と感じ、サイドプロジェクトとして Uncover Harassers を作り始めたそうです。

サリムさんは TheNextWeb の取材で出た「告発された、ではなく有罪になった人のリストであるべきでは?」という問いに対し、「告発された(accused)」と表示する線は逸脱していないのと、その人物に対してそのような疑義がありニュースになっている、という事を示しているだけである、と答えています。さらに知りたければリンク先から自分で調べられる、ので良し、というスタンスのようですね。

via TheNextWeb

ASCII World – クォータービューのASCIIテキストで描かれたブラウザゲーム

ascii world は、ブラウザで動く ASCII ベースのゲームです。

キーボードの W・A・S・D キーで上下左右にキャラクター(線ですが)を動かし、Jキーでジャンプ。チェックポイントを通ってゴールを目指します。道から外れて落ちたら面の最初に戻される。ルールは単純です。

テキストで描かれているから「テキストゲーム」、しかし2.5Dゲームでもあるわけです。ブラウザでこれを描画する意味はともかく。

ソースコードがGitHub で公開されています。ソースからすると現在9面あるようですね。そこそこコンパクトな関数で各面のフィールドを生成しているよう。コメントも多めです。

via Hacker News

テレビから”Alexa”と流れてもAlexaが反応しない技術をAmazonがスーパーボウルに向け投入

4日に行われるスーパーボウルでは Amazon もスマートスピーカー アレクサのTVCMを流すようですが、それに先がけて「テレビが “Alexa” という言葉を流しても家の Alexa 機器が反応しない技術」を配備したと Amazon の開発者ブログで明かされています。

この技術、基本的には、発話された”Alexa”に対する指紋のようなデータ(acoustic fingerprint)を使い、家庭でユーザーが発した”Alexa”ではないということを判定するもの。

既知のCM中の”Alexa”については、あらかじめ音声指紋を計算しておき、Echo デバイスがその場で突合せをして撥ねているそうです。なので、今回のCMに出てくる”Alexa”を無視するだけであれば、サーバ側の処理は不要ということになります。

ただ、それだけではなく、同時に広い地域の多数のEchoデバイスから、同じ発声の”Alexa”が届いた時に、これをテレビやラジオの放送によるものだとリアルタイムに判定して無視することもできるのだそうです。事前に知らされてない状態でラジオのDJがリスナー達のAlexaを起動しようとしても、防げるようになった、ということになります。

スーパーボウルで流される予定の動画は、YouTube で既に公開されています。ハリソン・フォード氏が出演。過去の「うまくいかなかった Alexa 組み込みデバイス」を紹介するという面白動画になっています。

テレビ・ラジオだけでなく、世の中に広く存在する”Alexa”に対処してるとすると、例えば Google Home が喋る”Alexa”にも反応しなくなってるかもしれませんね。そうすると過去にご紹介したこういう遊びは動かなくなるのかな。

コスプレ写真でGitを学ぶレポジトリ komeiji-satori/Dress

GitHub のkomeiji-satori/Dress は、自分のコスプレ写真をGitで管理し共有するため(A Study and Practice project of git)の学習用レポジトリです。

当プロジェクトで、リポジトリの clone, ブランチの作成, コミットのpush/pull, プルリクエストの作成, の全プロセスを学べます。Git/GitHub の使い方がわかるようになるでしょう。

This project helps you to learn the whole process of cloning a repository, creating a branch, pushing and pulling commits, and making a pull request, thus you can have a good knowledge of Git/GitHub’s usage.

100名近くの contributors が参加していますね。Hacker News で紹介されたことでどっと増えているのかもしれません。

説明が中国語と英語の併記で、必ずしも同じ内容が両方で書かれているようでもないですが、もともとは女装コスプレか異性装コスプレの共有場だったのかもしれません。Contributing.md には「他人の写真を載せない」「可愛いは正義」「性別不問」という参加条件が載っています。

public に全データが公開されていることから、データを利用したウェブサイトが複数作られ、README 中でも紹介されています。

ライセンスはCC 4.0 by-nc-sa とあるため、利用条件に従ってここの写真を再利用する人も出るかもしれませんね。

元々ソースコードの管理や共有のために作られた Git ですが、IT関連の電子書籍の編集などで使っているケースもあります。コードを書けなくても、いろんな人が自分の目的で使える場があれば、世の中の Git 親和性や バージョン管理への理解も高まるのかもしれないなと感じました。もしかしたらすでにあるのかもしれませんが、句会とか水彩画とか、いろいろな趣味の発表場所として使われていくのかも。

via Hacker News

go-license-detector – オープンソースのライセンスを判定してくれるツール

go-license-detector は、プロジェクトのドキュメントファイルをスキャンして、そのプロジェクトがどんなライセンスかを推定するというツールです。SPDX で400種類近くに分類されている多種多様なライセンスの分類名(identifier)の形でライセンス情報を返します。

従来のツール

Ruby製のLicenseeでは、ライセンスファイルの存在や、既知のライセンスファイルとの一致度を見て、オープンソースのライセンスが何かを判定しています。GitHub 自身も、各リポジトリのライセンスを判定するのに利用しているそうです。

他にもいくつか、Google の licenseclassifier などライセンスを推定するツールはあるのですが、go-license-detector は以下の特徴があるそうです。

  1. 誤判定があっても、「不明」という結果を少なくする方向の検出
  2. Golang による高速な処理
  3. GitHub の人気トップ1000リポジトリ(手動でライセンスが判定されている)をできるだけ当てられることを目指す
  4. SPDX の分類に従う

精度比較

ブログ記事では、既存の各ツールとの判定精度の比較をしています。902のソースコードを判定し、ライセンスがあるものに関して99%という高率の判定結果、また、判定の速度もとても優秀ということ。

現在は LICENSE や READEME など、一定の種類の名前でライセンス情報を探そうとしていますが、それらのファイルについて既存のライセンス文書との一致をみるにしても、単なる一致ではなく単語のゆらぎやミススペルなどまでケアしているようです。

何か一つオープンソースのプロジェクトが有ったとして、そのライセンスが何であるかを当て、それを信じて利用するというよりは、多数のリポジトリをまとめて分析するような用途に向いているのかなと思いました。

via Detecting licenses in code with Go and ML · source{d} blog

ランダムなアルファベット4文字x2で、Google画像検索が謎の抽象画を返してくる

グーグル画像検索を乗っ取るサイト?

reddit/whatisthisthing(これは何?)で質問されて話題になった謎の現象がこれ。

グーグル画像検索で”jwsr ljxb”のように、アルファベットで単語になってなさそうなものを2個入れると、出てくる候補が謎の図形画像だらけになります。

どんな4文字でも出るわけではありません。まず辞書にあるような4文字はダメです。その単語に関する画像が出てきます。略語として成立してるものもだめ。子音ばかりを読めないような並びで並べると出やすいように思います。

画像のサイトを開いてみると、どの画像も c0d3.attorney というドメイン上のページにあることがわかります。その内容はというと、

謎の画像二つに、ごく短いプロジェクト紹介、そしてその後ろには長々と、デタラメにも見える読めないテキストが続いています。

難解プログラミング言語 Malbolge を使ったプロジェクト

プロジェクト紹介の内容はこちら

c0d3.attorney は Malbolge, 1998年にベン・オルムステッド氏が作成したパブリックドメインな難解言語, で書かれたプログラムを表示することに特化したプロジェクトです。言語は使うことがほぼできないように設計されています。(しかし)設計上の弱点がこれまでに発見され、使えるプログラムを書くことが可能となりました。これを共有できることは喜ばしいことです

とても短い紹介文で、これ以外には情報がありません。

ページのほとんどを占めるデタラメ風テキストが、そうすると Malbolge 言語のコードだということなのでしょう。

画像もコードも、URLに与えたパラメータに応じて変化しますが、あるページで数えてみると、約5万語、61万文字ありました。

オンラインの Malbolge実行環境(あるんだ…) に最初の一行を食わせてみましたが、エラーとなってしまいました。1行だけ入れても動かないのかもしれません。

ちなみに、サイトにサンプルとしてある Hello, World はこれ

('&%:9]!~}|z2Vxwv-,POqponl$Hjig%eB@@>}=

うん。まったくわからん。

Google は「知らん」と

TheNextWeb が Google にこの現象に関して問い合わせしてくれていますが、これは Google のイースターエッグではないし、同社は c0d3.attorney とは何の関係も無い、という回答が来たそうです。

「一般的な話」として、画像のあるページにある文字で検索したら出るよ、ともコメントにあったということで、ごくごく当たり前のつまらない結論になってしまうのですが、この自動生成っぽい Malbolge 言語のコードの中にアルファベット4文字のセットが大量にでき、その中の2組の4文字をウェブの他のサイトで2つ同時に使ってる他のサイトがほとんど無いために、検索で出てきてしまう、ということでしょうね。

今の時点でも、この謎のサイトを作ったのは誰か、などは判明していません。

純粋なプロジェクトか、意図のあるSEOスパムか?

ドメインの世界では、 .com 以下は、ランダムだろうと意味がなかろうと 4文字のドメイン名はすべて誰かに取得されていることが2013年には報告されています。打ち間違いでもなんでも、4文字.com を入れた人を待ち構えて、広告を見せたりドメインを売りつけたりという商売をしてる人たちがどこかに存在するわけです。

となると、今回のサイトもそういう「迷い込んできた人」を捕まえるために作られた可能性も消し去ることはできません。とはいえ、今のところサイトに来ても、広告があるわけでもなし。単に人が来たからといって得になることなんてあるのかなとも思います。

いろいろな文字列でGoogleから推薦される、と聞くと人によってはたいへん魅力的に感じるかもしれませんが、そのデタラメな文字で迷い込んでくる人が分量としてどれほどのものか、という話もあります。総量としては見つけてやってくる人はそれほど多くないかもしれません。

ですが、今回の件で興味を持った人は、単語になってない日本語の文字の組み合わせを大量に配置するサイトでも作れば、同様の結果を得られたりするかもしれませんね。

via reddit and TheNextWeb