2014年11月7日金曜日

Evernoteで日本語OCRが機能するように

Evernoteは、撮影された画像に含まれた文字の検索ができるようになっている。ただ、このOCR機能は、英数文字列限定かと思っていたのだが、ある検索を行った際に、日本語も検索対象になっていることが判明した。


先日、本を実家に持っていった際、手持ち全書籍の表紙撮影をおこなったのだが、「清水」で検索したところ、上記画像のような結果になった。いつから使えるようになったのか、また精度の程度はわからないが、とにもかくにも素晴らしいことである。

なお、自分は有料ユーザなので、無料ユーザでこの機能が使えるかどうかは不明である。


APIを経由して、各画像の検索対象となっている文字列を取り出すことができるなら、Evernote経由で、コンテンツ管理システムに画像を入れるような仕組みが実現可能ではないかと思う。

<追記>
調べると2012年から使えたようで、わざわざ記事にするようなことではなかったと反省する次第。ちなみに、アカウントの個人設定で「文字認識に使用する言語」というのを「日本語+English」にしておくことが必要。