トップ100万ウェブサイトのrobots.txtを解析した人とその結果

An Analysis of the World's Leading robots.txt Files(世界のリーダーたちの robots.txt ファイル)というブログで、世界の上位100万サイトの robots.txt を解析したベン・フレデリクソンさん(Ben Frederickson)の話が出ていました。 フレデリクソンさんは、解析結果から、3つの面白い気づきを紹介してくれています。 Googlebot にしか見せないサイト Googleボット以外のすべてのボットを拒否する、という設定のサイトは意外に多いそうです。 大手サイトでは例えば、フェイスブック(robots.txt)が厳しいということ。実際に見ると

Docker+Traefikで同一ホストのサブフォルダとルートフォルダで別バックエンドを見に行かせる

Traefik をリバースプロキシにしてアクセスをバックエンドの Docker コンテナに振り分ける実験をしていたのですが、http://example.com/app1 と http://example.com/app2 をコンテナ app1 と app2 に振り分けることは無事できたものの、http://example.com/ へのアクセスがどちらにもいかず404になってしまいました。 docker-compose.yml の label

GoogleのChromebook宣伝動画、YouTube にスパムとしてはねられる

ツイッターにおけるヘイトスピーチ投稿の規制や、プログラムによる自動的なスパム判定がニュースとなっていますね。 そんな中、同じくスパム投稿や違法コピー投稿がなかなかなくならない YouTube で、有名企業によるプロモーション動画が誤判定でスパム扱いされた、と TheNextWeb が伝えています。 今回、スパム判定されてしまったのは、新しい Chromebook の宣伝動画(おそらく Pixelbook )、作ったのは Google 社です。YouTube を運営している会社ですね。自社サービスに自社動画がブロックされてしまったと。 スパム判定された状態の動画はすぐに撤回されてしまったようですが、消される前に Android 上の

Chrome Engine Extension – 友達のパソコンでのYouTube再生を毎日少しずつ遅くしていくChrome拡張

scd31.com の Stephen さんがブログで公開しているのが、同僚や友達のChrome にイタズラを仕掛けるための Chrome拡張「Chrome Engine」 友達にイタズラを仕掛けるための Chrome 拡張です。毎日、YouTube の再生速度が1%ずつ遅くなっていき、30日後には 7割の速度になります。拡張のアイコンはChromeのアイコンを使っていて、自身を「Chromeエンジン」と偽ります。 This is a chrome

国別の旅行危険リスクを可視化した世界地図 Travel Risk Map

保険会社International SOSが公開した旅行リスク地図(Travel Risk Map) 保険会社として多くの事件事故データを持っていて、それを使って判定しているのでしょうね。OpenStreetMap ベースの世界地図の上で、医療(medical)、治安(security)、道路の安全(road security)の三つのリスクの多寡を切り替えて表示できます。 国によっては州や地域でさらに細かくリスクが分類されていたりもします。 さて、旅行先としての日本の安全性はどう判定されているのか、と見てみると、 医療: リスク低(low) 治安: リスク低(low) 道路の安全: リスクとても低(very low) と、ありがたいことに世界でもトップレベルのリスクの低さであることがわかります。 ただし、治安の地図で見ると上には上がいて、low の下に insignificant (とるにたりない。統計的に有意でない)、というカテゴリーがあります。この insignificant

ボリュームつきおしゃぶり

赤ちゃんのおしゃぶりに、音量つまみがついてます。 つまみを回したからと言って、鳴き声が小さくなるわけではありませんが。音量を下げたくなる気持ちになるときもあるでしょう。 価格は10ドル。 ボリュームはちゃんと11までありますね。 via

人間の顔を、世界地図の「図法」で表すとこうなる、というコード

Projection face! は、人間の顔を世界地図の上に描いて、図法を変えたらどう歪んで見えるか、というのを見せてくれるウェブサイトです。

図法というのは、メルカトルとかモルワイデとかいうアレですね。代表的なものは社会科で習ったと思います。

D3.js を使って63もの図法で表示してくれますが、ソースコードも公開されています。

一個ずつ選択するのではなく全部を並べて見たい人のために一ページにおさめられたものがこちらになります。

球の表面を二次元で表そうとした時の図法、こんなにたくさんあってそれぞれ名前がついているんですね。

顔をマップしてみるというのは、元々は、1921年に書かれた論文 “Elements of Map Projection”に描かれていたものが初出だそうです。100年近く前ですから、この時のプロットは当然手書きでしょうね。

geojson形式のデータを用意すれば、別の絵についても簡単に同様のプロジェクションが作れます。さまざまな図法の違いの体感もできるし、架空の世界の地図で、真東がどこになるか、等距離の場所はどこになるか、等を考えるのに使えたりするかもしれません。

via FlowingData

イギリス中の自転車事故などを地図上で一望できるwebサービス

Bikedata は、イギリスにおける自転車に関するデータを地図上にプロットした、インタラクティブな情報地図です。

この画面では、道路のどの場所で自転車事故が発生したことがあるか、が、ピンクのマーカーで示されています。

通勤やツーリングの計画を立てる時に、事故が頻発するところを知って避ける、といった使い方もできるでしょうね。スマートフォンアプリなどで、事故の多い場所に近づいたら注意をうながす、みたいなものを作ったりもできるかもしれません。

サイトでは、事故の他にも、交通量、自転車の盗難、駐輪場、サイクルレーンの写真、など、様々な自転車に関するデータを表示することができます。

さらに、このサイトのソースはGPLv3 で公開されています。

元データは国によるもの

イギリス政府のデータ公開サイトに、道路の安全データ(Rode Safety Data)というのがあり、ここではSTATS19 という書類で報告された2005年から2014年までの事故のデータが公開されているようです。

100Mぐらいあるデータを見てみたら、こんな感じで緯度経度や日時、事故の状況を表すフラグを持つレコードが大量にあるCSVファイルでした。

こういったデータが公にされているのはいいですね。このデータを API 化して自転車事故について Cyclestreets.net が提供し、それを Google Maps APIなどを使って可視化したのが今回のサービス、ということになります。

via Maps Mania

Corporate Gibberish Generator – 企業名からIT企業のそれっぽすぎる紹介文を作るジェネレーター

Corporate Gibberish Generatorは、社名を与えるとその会社を紹介する「たわごと(gibberish)」を生成してくれるジェネレーターサービスです。Andrew Davidsonさんの作。

適当な社名を入れると、一瞬で英語で会社の紹介文を書きあげてくれます。出てくるのはこんな感じの文章

勇敢に未踏の地を拓き、(未来のある時点で)激烈に進化する企業

サイコイン社はリアルタイム統合品質管理における業界リーダーです。業界標準用語「eテーラー」の意味するところは何でしょうか? eサービス無しにはあなたの会社はメソドロジーを欠いたままでしょう。我々は、加入者コミュニティのキャパシティを再目的化することで進化させます。再仲介のための予算は反復のコストの10分の1以下になるべきです。わたしたちは、貴社がパートナーシップの許容量を変化させることに介在します。開発の要素はたった一語、「定着」でまとめることができます。「説得力がある」仲介とはどのような意味でしょう? 簡潔に言うと、新規テクノロジーを監視する革新的な計画を貴社は所持しているのか?です。最先端の考え方をしましょう。SVG と Apache の融合を想像してください。私たちが、ユーザーの隠れた能力を解き放ち生成します。

A company that can whiteboard courageously will (at some unspecified point of time in the future) be able to evolve fiercely.

CyCoin is the industry leader of real-time Total Quality Management. What does the standard industry term “e-tailers” really mean? Without e-services, you will lack methodologies. We will repurpose the capacity of subscriber communities to evolve. Your budget for reintermediating should be at least one-tenth of your budget for iterating. We will engage the capacity of partnerships to transform. The development factor can be summed up in one word: sticky. What does it really mean to reintermediate “compellingly”? Quick: do you have a innovative plan for monitoring new technologies? Think cutting-edge. Imagine a combination of SVG and Apache. We will unleash the aptitude of users to generate.

Corporate Gibberish Generator™ による生成サンプル

訳してて頭が痛くなってきました。一字ごとに見ていくと何も言ってなかったりするのは明らかなのですが、オリジナルの英文が良さげなデザインでパッと出ていたら、なんかいい事言ってるんじゃないか、ぐらいには思ってしまうかもしれません。

「特にインターネットとテクノロジー企業に合わせて「たわごと」を調整した」ということで、英文でこけおどしを書きたい人は、このサイトの生成する文章や使っている単語を参考にするといいかもしれません。

via TheNextWeb

ダークウェブ上の麻薬の売人が、世界ヒゲ選手権参加のため渡米して逮捕される

Tor など匿名化技術を使ってアクセスする「ダークウェブ」内のeBayのような売買掲示板 Dream Market においてビットコインと引き換えに麻薬をオンライン販売していたフランス人が、初めてのアメリカ入国を試みて到着した空港で米麻薬取締局(DEA)に捕まった、というニュースが流れてきました。

面白いのは、アメリカに行った理由が「世界ヒゲ選手権(The World Beard and Moustache Championships)」に参加するためだったというところ。

サイトによれば、今月9月の月初めに、テキサス州オースティンでたしかに大会が開催されていたようです。

逮捕の経緯

マイアミヘラルド紙によると、この38歳のフランス人ギャル・ヴァレリウス氏(@vallerius)は、アトランタ空港の入国管理において逮捕され、没収されたPCからは闇掲示板でのユーザー名OxyMonster(管理者権限のあるもの)、Torブラウザ、Dream Marketへのログイン/パスワード情報、そして$500000(5674万5000円) の価値のあるビットコイン、が見つかったという事。

空港で逮捕できたのは、当局が既にこのヴァレリウス氏を特定できていたからです。OxyMonster によってフランスからアメリカに送られた麻薬の対価として支払われたビットコインのほとんどが、取引所 LocalBitcoins の彼の口座に流れていることを特定し、続いて彼の Twitter や Instagram アカウントを検索、これら表の顔の書き込みと、ダークウェブのフォーラムでの裏の書き込みの文章から、語彙や文の区切り、書き方の癖や時々入ってくるフランス語、など、多くの共通点を発見したと。

アメリカに来るとわかった時点で、逮捕の準備はできていたということですね。

世界ヒゲ選手権

本人がどれぐらい危機感を持っていたのかは、裁判もまだなのでわかりませんが、ガーディアン紙によれば、2年前のオーストリアでの大会にも参加していたということ。ツイッターのプロフィールには、この時の「ヒゲ世界8位」や今年の「ヒゲ欧州5位」が誇らしげに書かれています。

今年の大会主催者によれば、面識はないものの、ヒゲ者としてオンライン上での存在は認識していたそうです。Beard Wars(ヒゲ戦争)というオンラインアプリ上の投票コンテストで、こちらは”Barba”というニックネームで参加していたそうですが、会員同士の投票で決まるランキングで、後から参加したこのユーザーBarbaが、ぐんぐんと得票を伸ばし、1,2位をぶっちぎりで逆転したことがあったそう。この Barba のヒゲ写真と不自然な得票数について良く覚えていた主催者は、逮捕されて大会に来られなかった「コンピューターに詳しいであろう」逮捕者が Barba だとすぐ思い当たったのだということ。Tor まで使ったかどうかはわかりませんが、おそらくダミーアカウントを量産して自分に投票させたのでしょうね。

気になる世界ヒゲチャンピオンですが、こちらが結果ページになります。ヒゲのスタイルによって27ものカテゴリーがあるそうで、

逮捕された彼が参加する予定だった「自然なアゴヒゲ、30.1-45cm部門」の上位者は、こんな人たちでした。

# リンク先ではアニメーションgifで動いているので、もっと面白いですよ

ということで、ダークウェブの犯罪の話から、思いもかけずヒゲの立派さで世界を争う人たちのことを知ってしまいました。27の部門ごとに上位3名のヒゲが見られるのですが、なるほどいろいろな種類のヒゲがあるもんだなあ、と。

via Miami Herald

紙と導電性絵の具でライトを作るキット Electric Paint Lamp Kit

Kickstarter で支援が請われている Electric Paint Lamp Kit は、紙の上に電気を通すペイントを塗ることで組み立てられるランプです。

この水性の絵の具を紙の上に描くと、そこに電気が通じるようになります。電池とLEDをつなげたら、電線でつないだのと同様に光ります。

こちらの動画では、もっと複雑な「回路」を、版画を印刷するように作ったりしています。

キットの説明通りに回路を描き、回転するスイッチ部分に micro USB で電源を供給すると、オンオフのできるライトになる、というわけ。紙の部分は色や形を自由にできるので、自分だけのライトが作れます。

3つのランプが作れるキットが、32ポンド(約5000円(56万7450ドル))とのこと。クラウドファンディングですが、プロジェクト元の Bare Conductive は、導電性ペイントを日本の Amazon でも売っているぐらいなので、なんらかの実績はあると見て良さそうです。

キットが紙なのはコスト的に安いからだと思いますが、インクが乗る素材があればいろいろな物を、今回のキットだとランプに、できるわけで、イケアとか100円(1万1349ドル)ショップなんかで安価に入手できる素材をベースにした工作、というのも出てくるかもしれません。

via The Verge

電卓で演奏する ‘All Star’

スマッシュマウスのオールスター、もう20年近く前のヒット曲を、キーを押すときに音が出る電卓二つを使って演奏する動画です。

こちらが原曲

使われているのは中国製の AR-7778 電卓という電卓で、こちらの見ると、音階だけでなく押した数字を(中国語で)喋ったりもできる電卓のようです。

2014年に日本人?が公開した、この電卓一台での「千本桜」が800万回再生を越えていてAmazon では「千本桜が弾ける電卓」なんて言って売ってる業者もいるので、元々は日本発のネタらしいとわかったのですが、今回の動画を公開したユーザー It’s a small world さんも、twitter を見る感じ、日本の人のようですね。海外でも伝わるような曲を多数演奏され、英語タイトルで公開することで、少しずつ再生回数が増えていっているようです。

なるほどこういう方法で YouTuber になるというのもあるのか、と感心しました。この電卓でこれだけ演奏するための練習や、の音階を生かすアレンジなど、これだって簡単ではないでしょうけどね。

via Geekologie

akky's work blog