仕事などの連絡でファイルをもらうことがあるのですがそれがpdfの場合は、中から文字を拾い出して自分の資料とすることができないので手打ちで入力したりします。「元のファイルをもらえさえすれば…」とも思いますが、そもそもくれた人自身がpdfで受け取っていたり、元が画像をスキャンしたものだったりすることもあります。
そんなときに知人から、PDFや画像ファイルから文字を読み取るWebサービス ONLINE OCR を教えてもらいました。これは!とさっそく試してみました。
ONLINE OCR はすぐにpdfから文字を読み取ってファイルにできます
ONLINE OCR はこちらになります。
このWebサイトで文字を読み取りたいpdfを指定して、テキストファイルにしたいと思います。
1. STEP Upload file のところにある Select file をクリックし、PCにあるpdfを選びます。
2. STEP Select language and output format で JAPANESE と Text Plain (.txt) を選びます。
Enter Captcha code というテキストボックスに、
左に書いてある数字を入力し、CONVERT をクリック
このように結果が表示されます。Download Output File のリンクをクリックするとテキストファイルをダウンロードすることができます。
ダウンロードしたテキストファイルを開くと、
このように文字が読み取れていました。元のpdfファイルを見ると
こういうものでしたので、この部分だけを見るとほぼ完璧に読み取れているようです!
新聞の縦書き文字jpgから文字を読み取ってファイルにする
次にjpg画像から文字を読み取ってファイルにしてみます。
jpg画像は、
この、日刊工業新聞で、コワーキングスペース8Beatが取り上げられた新聞の切り抜きをiPhoneで撮影したものです。ONLINE OCRで出力されたファイルを見てみると、
画像の部分は文字化けの形になってしまっていますが、記事本文はいい感じに文字が読み取れていました。正直、新聞の切り抜きで縦書きの文字画像からここまで読み取れるとは思わなかったのでびっくりしました(^^)/
ユーザー登録(無料)をすると、大きなファイルも読み取れるようになる
ログインしない状態では読み込みファイルの最大サイズは5MBです。これを超える大きさのファイルを読み込みたいときはユーザー登録(無料)をしてログインすると最大サイズが200MBまでと大きくなります。
ユーザー登録は、このWebサイトの右上にある
SIGN UP をクリックします。
必要事項を入力して、Sign Up をクリック
すぐに登録されて画面が変わるので、
Go to Login page をクリック
username と password は入った状態でしたので Log in をクリック
すると、同じように読み取りページが表示されるのですがちょっとレイアウトが変わりました。
ログイン前とログイン後の読み取り最大サイズの差
ログイン前の状態で11MBあるファイルを指定すると
File is too large というエラーメッセージが出ます。
ログイン後に同じファイルを指定すると、
エラーが出ず、CONVERTすることができます。
ログイン前かログイン後か、で可能なことが違ったり、無料の場合は読み取り数に制限があるようです。
入出力形式や無料の範囲、有料の金額など
まとめてみます。
入力可能な形式
・PDF(複数ページのPDFファイルを含むPDFファイルのすべての種類)
・TIF / TIFF(マルチページTIFFファイルをサポート)
・JPEG / JPG
・BMP
・PCX
・PNG
・GIF
・ファイルの上記の型を含むZIPファイルもアップロードすることができます。
入力ファイルの最大値
ファイルの大きさについての制限はログインしていない状態で5MBまで、ログインした後は200MBまで読み込めるようになります。
出力フォーマット
出力フォーマットは、
・Adobe PDF document
・Microsoft Word document
・Microsoft Excel document
・RTF document
・Text Plain
の5種類となっています。
処理ページ数
また、ログインする前の読み込み制限は1時間あたり15のイメージファイルを利用できます。ログインした後は、複数ページのファイルが読み取れるようになるため、ファイル数ではなくページ数の制限で、最大25ページになるようです。
また、一度に大量にOCRしたいときは、
で、料金を払うとたくさんのOCRができるようになるみたいです。
まとめ:ONLINE OCRがあれば、外出先でOCRができる!
このようにWebサービスであるONLINE OCRならスキャナーがある場所でなくても外出先でもらったpdfを読み込ませたり、紙でもらったファイルを写真に撮ってそのばでOCRをすることができます(^^)/
外出先でOCRができるのってとっても便利だと思います!
[amazon_searchlink search=”独立 起業 “]
コメント
コメント一覧 (1件)
[…] PDFや画像ファイルから文字を読み取るWebサービス ONLINE OCR […]