語源別に英文を色分け、可視化で見えてくる英語の成り立ち

Etymology(語源)辞書というのがあって、ある単語がいつごろ、どうやって出来たか、どこから英語に取り込まれたかといった情報を調べられるそうです。
ブログIdeas Illustratedでは、単語の語源ごとに違う色で表示することで、英語の文章がどのような語源からの単語で成り立っているかを見せてくれています。以下は大いなる遺産からの一節。
Dickensetymologyvisualized
古英語、古フランス語、中英語、古ノルド語、アングロフランス語、ラテン語、アメリカ英語(Baseballとか)など、出自によって色分けされています。
マーク・トゥエイン(アメリカ)とチャールズ・ディケンズ(イギリス)の小説を比べて語源の割合と見るとか、法律文書や医学文書(やはりラテン語由来の単語が増える)、スポーツニュースなどでも分析をしています。小説一編や特定の作家に限らず大規模に統計を取ると、似たような単語から特定の国や業界の人がどんな単語選びをするかとかもわかるかもしれませんね。
世界に誇るキメラ言語である日本語でも、こういうのできそうですね。漢字やカタカナである程度どこから来たか表記で区別されていますが、それでもどのカタカナが何語由来か、とか漢字でも日本で作ったやつとか、個々にトリビアとして知っているものはあっても、こうやって可視化すると面白いかもしれません。
via Visualization of the Week: The origins of English – O'Reilly Radar

コメントを残す

メールアドレスが公開されることはありません。

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください