「ツール」タグアーカイブ

New Tong Wen Tang – ブラウザ上で簡体字⇔繁体字変換するChrome拡張

中国語のウェブサイトを調べないといけなくなった時に、ロシア語とかアラビア語等と違って、漢字のおかげでなんとなく大意が掴めるのは日本人にとって少し楽なところだと思います。

しかし、それが中国本土の方のウェブサイトだった場合、画数の多い漢字を中心に簡体字で書かれているため、それが元々どんな漢字だったのかわからず、判読率が下がってしまうという問題があります。

また、日本人でも歴史や小説、映画等で知っているような固有名詞なども、簡体字で書かれているせいで見落として気づかなかった、ということも起こります。「刘备」と出ていてもなんだかさっぱりわかりませんが、「劉備」なら誰の事かわかる、とか。

その点、台湾や香港で使われている繁体字のページなら、日本語の漢字と同じや似ているものも多いのでずっと推測しやすいですよね。New Tong Web Tang は、簡体字と繁体字を切り替えて表示してくれる、というChromeブラウザ拡張です。

ページ上で右クリックから変換を指定すると、ページ上にある簡体字の漢字を、対応する繁体字の漢字へと変換してくれます。変換の前後で、中国語(簡体字)Wikipediaの「日本」の冒頭は、こんな風に変換されました。

設定によっては、自動的に常に一方へ変換させるようにもできます。

この拡張機能、ソースコードもGithubで公開されています。他にも同様の機能を持つChrome拡張はいくつかありましたが、ユーザー数はこれが8万人超と多いようです。

# ユーザーが多いから必ず安心、と言うわけでもないですが。とても少ない拡張よりは監視の目も多いでしょう

繁体字に変換した後の文章を見ると、それでも日本人的にはわかりにくい(日本語と字形が違う)漢字も多いので、もっと良いのは簡体字を対応する日本の漢字に変換してくれるツールなのかもしれないなと思いました。

Listly – ウェブページからデータを抽出してExcelファイルにしてくれるサービス

Listly は、ウェブページのスクレイピングをお手軽にしてくれるサービスです。

フォームに抽出したいサイトのURLを入れて、Listyボタンを押すと、

ページ内の構造から、リストを抽出してくれます。抽出に使ったCSSセレクタを表示してくれてるので、これをコピーして使うもよし、”Excel”ボタンを押すと、エクセルファイルでダウンロードもできます。

何回も繰り返すような作業ならプログラム化すると思いますが、一度しかやらないとわかっている抽出作業などでは、特に便利なのではないでしょうか。

また、未実装ですが”Scraper”というボタンを見ると、繰り返し抽出を行うためのブックマークレットか何かを生成してくれる予定があるようです。APIも開発中とか。

同様のものにImport.ioというサービスが先行であり、機能的にも強力なのですが、こちらは月$199(2万2060円) からの有料サービスとなっています。Listly もユーザーが増えればいずれはお金を取りそうではありますが、今のところは登録等なく利用できます。

via Hacker News

英語の求人文章から「男性的」「女性的」な表現の偏りをチェックしてくれるサイト

イギリス内閣府とNPO団体 の共同運営するAppliedは、ジェンダー差別や人種差別を廃し、公正で多様性のある採用ができるような支援機能を多数持つ求人サイトだそうです。

そのような機能のうちの一つ、あなたの書いた求人の文章のジェンダーバイアスをチェックしてくれるオンラインツールは、デモとして無料公開されています。

試しに、ネットに公開されているシニア・プロダクトマネージャー募集のサンプルを与えてみたところ、こんな判定が出てきました。

男性的(masculine)と判定された単語は、

  • leader (リーダー)
  • confident (自信いっぱいの)
  • analyze (分析する)
  • lead (リードする)
  • leadership (リーダーシップ)

女性的(feminine)と判定された単語は

  • responsibilities (責任)

求人広告に書かれた文章は、その職務のことだけでなく、企業組織やその文化についてのヒントを応募者に与え得るそうです。Applied は、男性的な言葉ばかり並べた募集の文面は女性の応募を遠ざけ、結果的に多様性の無い組織を作ってしまう、と主張しています。求人を書くときに、無意識にどちらかの性の人物を想定して、言葉を選んでしまっていないか、ということでしょうね。

他にも同様の注意を呼び掛けているサイトはあり、バイアスの少ない文章が求人で重要、という考え方はAppliedだけの発想ではなさそうです。

サービスは最低プランが無料から始まるフリーミアムで、ユーザー1人で使うだけなら無料である程度使えるようです。

海外に支店があったり、グローバライズした製品やサービスを売ったりしなければいけない日本企業では、英語で求人しなければいけない、という状況もあるでしょう。英語で正しく文章を書くだけでも大変ですが、文章に含まれる微妙な偏りや差別については、文法的な正しさとはまた違った知識や経験が必要そうですし、このようなツールに一回かけてみて、あまりに一方的な判定結果が出た場合はちょっと考えてみる、というのは安全のためにもいいかもしれないですね。

via New Scientist

写真などの画像を無数のセルで出来たエクセルのシートに変換できるツール Google Spreadsheet Art

よくGoogle Spreadsheetsマクロによる凝ったツールを公開しているブログ Digital Inspiration のAmit Agarwal さんが、また面白いツールを公開してくれました

写真などの画像ファイルを表計算ファイルへと変換するツール Google Spreadsheet Art です。

view-from-cybozu-tokyo

これが元ファイル。300×300のサイズにあらかじめ縮小してあります。

Google Spreadsheet のツールファイルをブラウザで開いて、自分のGoogle Drive にコピーします。

google-spreadsheet-art-1

[Spreadsheet Art]メニューから、1. アップロードを選択、

google-spreadsheet-art-2

このツールで取り扱える画像ファイルの種類とサイズが注意として出てきます。

google-spreadsheet-art-3

画像ファイルのアップロードが終わると、多数のセルの中に色を表す数字が入っています。これが、元の画像ファイルのピクセルから取ってきた色の情報ですね。

google-spreadsheet-art-4

続いて、メニュー2番の「色を適用する」を実行。ちょっと時間が掛かります。

google-spreadsheet-art-5

1で取得した色で実際にセルの色が表示されるようになりました。

google-spreadsheet-art-6

全セルのサイズを小さくするのは、手動でもできますが、メニューの3番「セルを調整する」も用意されています。セルのサイズは、今回は2にしてみました。

google-spreadsheet-art-7

Google Spreadsheets 上に、アップロードした写真が再現されました。これを[ファイル]-[形式を指定してダウンロード]から Excel 形式で保存すると、Excelでも見えるようになります。

google-spreadsheet-art-8

できあがったファイルがこちら。

view-from-cybozu-tokyo.xlsx

元の画像ファイルが44KBだったところが、917KBとなりました。予想していたよりは小さい。

単純な作業を膨大にこなして作られたものが驚きになるというのは、他にもマッチ棒や10円(0.09ドル)玉、レゴなどで色々あると思います。しかし、デジタルな結果を作るのであれば、結局それはツールでできてしまうんだなあ、と。

公開されているGoogle Spreadsheetsのマクロは、現時点でのものは目を通し、怪しいコードは入ってないと思いました。何年にも渡っていろいろなツールを公開しているブログなので問題はないと思いますが、公開しているファイルやマクロを後から書き換えることは簡単ですので、自己責任でお試しください。

Pokémap – Pokemon Goのポケモン・ジム・ポケストップを可視化する勝手ツール

アメリカ人をトリコにし、任天堂の株価を倍に押し上げた位置情報ゲーム「ポケモンGo」、日本での今日のリリースが2ちゃんねる経由マクドナルドからのリークで延期になった、とかいう話も(本当かどうかわかりませんが)流れて来たりと、これから日本でも熱くなりそうなところです。

Pokémapは、Ahmed Almutawaが始めたばかりのツール開発プロジェクトで、ポケモンGo に出てくるポケモン達、アイテムを得られるポケストップ、奪いあうポケジムなどゲームを簡単に進められるようにする重要情報を、Google Mapベースの地図に表示してしまうというPython製ツールです。

pokemap-top

現在のツールはプログラマでないとセットアップがたいへんそうな作りになっていますが、こんなツールで地図が見えてしまうと、一般のユーザーとの競争はかなり簡単になってしまうのではという心配もあります。

各データは Niantec 社のサーバとの通信を見て取得しているようなので、早晩、通信方法が変更されたり、暗号化されたりするのではと思いますが、熱心なユーザー&開発者が2日間で50人近く contributor として集まったそうで、GitHub 上のプロジェクトページでは一時的にプルリクエストを受け付けませんという表示がされています。

via The Verge

ワードプレスのインポートツールで警告が消えない問題

WordPress のサーバ再構築をする必要があり、標準のXMLエクスポート形式であるWXRファイルを読み込ませたところ、最新のWordPressを使っているのにも関わらず以下のような警告が出てきます。

( ! ) Strict standards: Declaration of WP_Import::bump_request_timeout() should be compatible with WP_Importer::bump_request_timeout($val) in C:\Users\akky\OneDrive\services\akimotojp\blog\wp-content\plugins\wordpress-importer\wordpress-importer.php on line 38

wordpress-importer-caution

バグ報告もされているのですが、これがなんと2年も前のもの。ずっと直ってないというわけです。

直し方がわかってないわけではなく、現時点のバージョンなら、wp-content/plugins/wordpress-importer/wordpress-importer.php 1110行目の

function bump_request_timeout() {

function bump_request_timeout($unused) {

などとするだけです。

わかってるなら配布してるオリジナルを直してよ、と思うところですが、バグチケットの中でリード開発者により「まれにしか使わないインポートの警告を消すためだけに、500万人の管理者にアップデートさせるのは『アップデート疲れ』(update fatigue)もあるのでやりたくない」という結論が出されていました。

そして、他の重要な修正も入るなら喜んでプラグインの更新を掛けるよ、と、未解決のインポート周りのチケットリストを紹介することで返答を結んでいます。

そんなに気になるなら他の重要なバグ直せば一緒に直るよ、なんていう返しもあるのかあ、と変なところで感心しました。

インポート機能を全員が使うわけではない、というのは確かにその通り。インポート作業をするぐらいの利用者なら警告の意味も読めるし、これが実害のない警告に過ぎないこともちょっと検索すればわかるかもしれません。

しかしそれでも、推奨された最新バージョンを使って、標準で動かして警告が出てしまうのは、それこそ500万ユーザーを誇るならカッコ悪いように思うですが。警告を見た人の多くはそれが何かを調べ、対処するなり無視するなり判断するという時間を取られていますし。

WordPress Importerプラグインの一番新しいバージョンも5ヶ月前に出ており、このチケットが切られた2年前より後に修正を含めるタイミングはあったみたいだし。

# 他にStrict Standardsを外すという解決法もなくはないですが、PHP 7 も見えているこの時期にそんなことをするのは当然オススメできません。