OCRできたよー(Ubuntu 16.04, Anaconda 5.2.0)

まずはubuntu 16.04でAnacondaの環境構築。

【随時更新】pyenv + Anaconda (Ubuntu 16.04 LTS) で機械学習のPython開発環境をオールインワンで整える  | ALGO GEEKS

上記の環境構築手順のコマンドをそのままコピペで。

Anacondaのバージョンの最新が5.2.0になっていたので、そこだけは変更した。

anaconda-navigatorの起動を確認した。

 

OCRについては下記を。

ml-begin.hatenablog.com

 

$ brew install tesseract

は、brewをインストールするのがめんどくて、

aptで入ることがわかったので、

$ sudo apt install teseract-ocr

で代替した。

qiita.com

 

あとは、参考よりそのままpythonコードをコピペして実行した。

import pytesseract
from PIL import Image

url_img = '20180524231805.png'
img = Image.open(url_img)
text = pytesseract.image_to_string(img, lang="eng")
print(text)

 

実行結果

(base) chino@kafu:~/デスクトップ$ python ocrtest.py
Abcdefg hijklmn

 

f:id:takuwz:20180614221710p:plain

 

すごい簡単できてしまったなあ。環境構築、実行手順の参考リンクも詳しくて、ありがたいなあという感じです。現場からは以上です。

(コード書いてないw。あと日本語。)

 

それとこれ、なんだろう。

distributed 1.21.8 requires msgpack, which is not installed.