でじすたねっとフォーラム(質問コーナー)

iPadなどのデジタル勉強を行う人が相互に質問・回答を行うことでデジタル勉強をより便利にしてくためのページです!!

筆者

もちろん筆者もここで回答していきますよ!!

自炊でのOCR化について
 
通知
すべてクリア

[解決済] 自炊でのOCR化について


7000kazuking
(@7000kazuking)
Active Member
結合: 1年前
投稿: 3
Topic starter  

お世話になります。

標記の件についてお伺いさせてください。

私はScanSnapとiPad、surfaceを使い自炊をし始めました。ScanSnapは月に500枚のOCR制限があるため、読取革命を購入しました。ですが、何百ページもあるものを読取革命でOCR処理するのは数十分と思ったより時間がかかるようです。そこで、GoodNotesにスキャンしたPDFを取り込むと、OCR処理をしていないファイルなのにしっかりと文字検索をしてくれました。GoodNotesに取り込み教科書として使用し、またGoodNotesの検索機能を使うことになにか不便があるものなのでしょうか?

よろしくお願いいたします。


引用
7000kazuking
(@7000kazuking)
Active Member
結合: 1年前
投稿: 3
Topic starter  

すみません、追加で質問お願いします。

私も医学の勉強をしているのですが、読取革命などでOCR処理をして思ったことは、文字の誤認がとても多いということです。何百ページも手作業で直すのは無理があります。デジスタさんはこのことに関してどのような対策を講じてらっしゃるのか、教えていただきたいです。


返信引用
digi(デジ)
(@rym)
メンバー Admin
結合: 5年前
投稿: 25
 

 

ご質問ありがとうございます。

ScanSnapを使ってのOCRについてですね。

 

ScanSnapにもいろいろ機種がありますが、紙を束でセットできるモデル(iX1500)などとPC(Surfaceでも可)を使えば、「読み取り可能なPDFにする」というボタン(おそらく右クリックなどから選べるはず)があると思います。

 

シンプルに言えば、ローカルでのOCR(文字認識)が可能かと思います。

 

  • 質問者様の500枚の制限はScanSnap cloudを使用したオンラインでのOCRであると推測します。

 

自分はローカルでのOCRをメインに使用しており、こちらの認識精度は、Adobe PDFリーダーよりも優れた性能であり、個人で使えるものではなかなかこれ以上のものにも出会えない優れたレベルにあると思います。

 

ScanSnap cloudのオンライン認識は(ローカル性能が高すぎて満足していため)まだ使ったことがありません。なので、認識精度についてはコメントできませんが、一度ローカルでのOCRを試してみてはいかがでしょうか?

 

使われているScanSnapの機種によってはローカルでの認識ソフトが付属していない可能性もあり、そうであったら申し訳ありません。

 

FUJITSUのサイトのURLも貼っておきますので、よければご覧になってみてください。

 

 

https://www.pfu.fujitsu.com/imaging/downloads/manual/ss_webhelp/jp/help/webhelp/topic/tb_img_not_searchable.html

 

追加で質問あれば、書き込みをお待ちしています。

 


返信引用
digi(デジ)
(@rym)
メンバー Admin
結合: 5年前
投稿: 25
 

スキャンした教科書の文字の誤認識についてのコメントです。

スキャンした教科書は基本的にPDF Expertを使ってコピぺでアウトラインを作成してそこから探すことが多いです。

もしくは、一度検索に引っかからなくて自力で見つけた時にテキストでキーワードを打ち込んでいます。

PDFのOCRはまだまだ完璧ではありません。検索制度を求める場合にはisho.jpなどで電子版を購入することをお勧めしています。

 

 


返信引用
7000kazuking
(@7000kazuking)
Active Member
結合: 1年前
投稿: 3
Topic starter  

お忙しい中、さっそくのご返信ありがとうございます。

ScanSnapはix1500を使用しています。

読取革命だと、教科書などPDF化したものにOCR処理しても漢字は特に別の字として認識してしまうようで、検索しても引っ掛かりません。

差し支えなければ、デジスタさんが使用しているというローカルのOCRを教えていただけませんか?

よろしくお願いいたします。


返信引用
共有: