教養人にオススメ!3000円分のポイント貰える!Amazonの新時代サービスAudibleで激アツ!キャンペーン
カテゴリー

教科書のPDF化(自炊)の方法〜読みやすさ重視のスキャン編〜

デジタル勉強解説

〜オススメ記事〜

本サイトのメインコンテンツ

「iPadで勉強」のマニュアル

「勉強用iPadの購入を考えていませんか?」
「iPadの購入の値段で悩んでいませんか?」
iPad勉強歴3年以上の筆者が勉強に十分な性能・容量+できるだけ金額を抑えるiPadの選び方を紹介しています。
勉強用iPadコスパ最強セットの紹介

「教科書買うときに、学生ならポイント18%もらえるのに定価で買っていませんか?」

知らない人が損してるモノ凄い学割の紹介!

【知らない人は損してる】学生なら教科書・書籍をかなり安く購入できるの知ってます?

Amazonの新サービスaudibleを無料で使えて3000ポイントゲットできるキャンペーン!

筆者も使ってみましたが、想像以上のクオリティ。知識人のための新常識になりそうな予感です。

▶Audible

教科書をスキャンしてPDF化すればタブレットに入れていつでも読むことが可能です。この記事では、本の章構造ごとに分割してスキャンする方法を紹介します。

今回は教科書のPDF化の過程のうち、スキャンの方法を紹介します。スキャンした後にPDF Expertで読んでいくことも考慮して行う工夫についても紹介します。

今回使用するスキャナーはEPSON製のDS570Wという機種です。

この記事は教科書のPDF化シリーズの1つです。
順番に読んで頂いたほうが分かりやすいかと思います。

▼教科書PDF化シリーズ記事

    1. 総論&準備編
    2. 裁断業者依頼編
    3. 裁断業者レビュー編
    4. スキャン編
    5. 裁断・スキャンした自炊本の復活の方法編〜再製本が超簡単にできた話〜←この記事

この記事より前の段階までで裁断についての紹介は終わっているので、本が分解されて紙の束になっている状態から説明していきます。

スポンサーリンク

スキャンの段階で一工夫

裁断まで終わったら最後はスキャンの過程です。

筆者は裁断の過程は業者にお願いしているので、かなりきれいに仕上がってきます。

さて、スキャンは普通1冊の本を1つのPDFにまとめてスキャンすると思いますが、筆者の場合には本の章ごとに分けてスキャンしています。

この理由としては、

      • スキャンのときに章に分ける作業で本の概要が把握できる。
      • PDF Expertではファイル管理できるので、章ごとに表示できる。
      • PDFのファイルサイズが小さくなるので、読み込みが早くなる

スキャン過程

使用する機械

筆者が利用しているスキャナーはEPSONのDS-570Wです。

一番メジャーな機種というわけではありませんが、高機能で使いやすい機種です。

ちなみに一番メジャーな機種はコチラのScansnapです。

 実際にスキャンする

【1】裁断した教科書を準備します。

裁断の方法は別の記事でまとめてあるので、こちらを御覧ください。

教科書のPDF化(自炊)の方法〜裁断業者編〜

教科書のPDF化(自炊)の方法〜裁断業者編への依頼方法〜
教科書(今回は医学書)をスキャン(自炊)してPDF化するには、まず本を裁断してバラバラにすることが必要です。 裁断に関しては、裁断代行業者を利用することがオススメです。 裁断代行業者の選び方と依頼方法を紹介していきます。 ...

▼裁断した教科書はこのような紙の束になっているはずです。

先程も紹介したように筆者の場合はざっくりと、章ごとにわけてPDF化していきます。

もちろん普通に1冊まとめてPDFにしてもOKです。

次にすることは本の目次をみて本の構成を調べます。

この本の場合には、

・総論

・各論

・精神医学と社会

という3つに大きく分かれることが分かりました。

この本は300ページほどの薄い教科書ですので、3つにざっくり分けることにしました。

一番右側の束は、タイトル、序文+目次の束です。

ハリソン内科学といった3000ページくらいの教科書の際には20くらいの章に分けてスキャンしています。

Mr.Pad
Mr.Pad

この本の構造を調べる過程が意外と読むときにも役に立ちます。

大まかな外枠をしることができるので、読みやすく、頭に入りやすくなるのです。

【2】スキャナーの準備

スキャナーは普段はコンパクトに収まっていますが、展開すると大きくなります。

▼普段はコンパクト:横の水は大きさの参考用

▼展開すると大きくなります。

【3】スキャナー側の設定

DS570Wでは専用ソフトで色々設定ができます。

使用しているPCはMacなので画像はMacでの設定画面になりますが、Windowsでも同じ様な設定が行えるはずです。

専用ソフトはDocument captureというソフトです。

▼管理画面はこんな感じ

▼ジョブリストという設定を保存する機能が有ります。

document captureの設定

筆者の場合はスキャンの方法は上の画像の1パターンだけにしています。

(1つ目はデフォルトの設定)

解像度は300dpiで設定しています。

Mr.Pad
Mr.Pad

デフォルトでも全然問題なくスキャンが可能です。特に難しい設定はしていません。

解像度をデフォルトの200dpiより上げているのは将来的にディスプレイが更にきれいになった場合を想定しています。

 

デフォルトと替えているのは保存フォルダの指定と解像度の変更です。

【3】スキャンする

実際にスキャンしていきます。

筆者が使用しているようなスキャン専用機なら、紙の束をドサッとセットして開始ボタンを押すだけで連続でスキャンしてくれます。

Mr.Pad
Mr.Pad

一枚一枚手差ししていると思われる方もいるようですが、違いますからね!

先程、4つの束に分けた書籍の中で最も分厚い束が160ページありました。

今回使用しているDS570Wでは160ページ分も一気にセットできます。

紙の質にもよりますが、160ページ+であと10ページ分ほどセットできそうです。

Mr.Pad
Mr.Pad

このようにスキャナーに一気にセット可能な枚数は150〜200枚程度です。書籍を1冊まるごとスキャンしようとしても、何回かに分けてセットする必要があります。なので、内容ごとに何部かに分けてスキャンを行ったとしても労力に大きな差はありません。

△こんな感じでスキャンしていきます。

今回は1冊の本を4つの束に分けてスキャンを行ったので、4つのPDFができました。

スキャンのコツ

スキャンを行う際にもコツがあります。

これを知っているか知らないかではスキャンにかかる時間も違うかもしれません。

スキャンした紙をまとめる方法

一度スキャンをしたことのある方にならわかって頂けると思うのですが、スキャンし終わった紙の束はものすごいバラバラできれいに元の状態にまとめることが困難です。

きれいにまとめようとしても紙の摩擦で全然まとまってくれません。

そんなときに覚えておいてほしい方法がコチラです。

ざっくり言葉で説明すると「息を吹きかけながら揃える」 という感じです。

紙同士が静電気でくっついているので、摩擦が大きくなっている状態なので、空気を送り込んで紙と紙の間を空けて上げれば摩擦力が下がってきれいに揃うという感じでしょうか。

文字認識(OCR処理)

ここまででスキャンしたPDFは「写真」の状態です。

ですので、検索しても引っ掛けることはできません。

検索できるというのも教科書をPDF化するメリットですので、文字認識処理(OCR処理)はぜひ行っていきたいところです。

文字認識には専用のソフトが必要です。

スキャナーについているDocument captureにもOCR機能はありますが、筆者はこれとは別にAcrobat Proというソフトを購入しました。

Macでも使えるOCRソフトは選択肢が少ないです。

Windowsの方はもっと選択肢があると思います。

スキャナー附属ソフトでもできることをわざわざ別のソフトでおこなう理由は、

時間のため

です。

なぜ文字認識ソフトによって時間の差が生じるのか説明させてください。

まず重要な前提として、文字認識処理にはかなり時間が掛かります。

パソコンのスペックにもよると思いますが、スキャンにかかる時間を1とすると文字認識処理には10以上の時間が掛かります。(Mac Book airを使用)

スキャナー附属のソフトを使用した場合、スキャンの直後に一連の流れとして文字認識処理を行う必要があります。(スキャナー附属のソフトの都合です。)

スキャン直後に文字認識を行うと連続してスキャンを行うことはできません。

これでは1部スキャンするたびに、かなりの待ち時間が生じます。

これを別のソフトで行うと、スキャンが終わったPDFをまとめて文字認識処理することができます。

夜寝る前に複数のPDFを指定して処理開始しておけば、朝起きたら文字認識が完了しているという便利さです。

実際にどんな感じか

▼Acrobat Proの操作画面

PDFの中の文字を認識するにはこの中の「スキャン補正」という項目を使用します。

▼スキャン補正の画面です。

 

ここで「複数のファイル内のテキストを認識」をチェックします。

「ファイルを追加」をクリックすると、

ファイルを追加するか、フォルダーまるごと追加するか選択できます。

フォルダーまるごと追加できるのが便利です。

こんな感じで複数のファイルを選択していきます。

追加したファイルはこのように表示されます。

あとは「OK」を選択して文字認識を開始していきます。

テキスト認識の設定がポップアップしてきます。

筆者はこの様な設定でテキスト認識しています。

文字認識に関してはこのように3つの選択が可能です。

筆者は「検索可能な画像」で行っています。

下に「非圧縮」があることからも分かるように、「検索可能な画像」は圧縮がかかっています。

読みにくくなるわけでもなく、圧縮をかけてくれるので大変助かる機能です。

▼最後に出力先(保存場所)を決定します。

筆者の場合には

      • 別フォルダに
      • 最後に「ocr」と名前に付け足して

保存してくれるような設定にしています。

元のPDFと文字認識が終わったPDFは一見区別がつきにくい為です。(検索してみれば分かりますが。)

PDFリーダーに移動

ここまでの過程でPDFが完成しました。

ここからはiPadで読むために、cloudに移動する作業です。

使用しているPDFリーダーアプリはPDF Expertです。

PDF Expert by Readdle
仕事効率化, ビジネス¥1,200iOSユニバーサル

筆者の場合はicloud上のPDF Expertのフォルダに移動しています。

序盤に紹介したように、筆者は章や内容ごとにPDFを分割して作成する方針です。

例えばハリソン内科学をPDF化した場合にはこのような感じになります。

「ハリソン内科学.pdf」というファイルが一つあるよりも、読む時に便利に感じませんか?

PDF Exertでは全文検索機能もあるので、すべてのPDFから検索することも可能ですが、文字認識の精度は100%ではありません。(おそらく、どのソフトを使用しようとも)

このように大まかなジャンルごとに固まったPDFならば、本をパラパラめくるような感覚で探している内容を探すことも十分に可能です。

Mr.Pad
Mr.Pad

検索でもかなりの高確率で掛かりますけね。

でも、この方法の方が読みやすく感じるは筆者だけでしょうか?

まとめ

      • 教科書のPDF化は、内容ごとに分割してPDF化するのが個人的にはオススメ
      • 文字認識はスキャナー附属のソフトより別のソフトを買ったほうが時短になる
      • PDFリーダーでオススメなのはPDF Expert

▼オススメのPDFリーダー

PDF Expert by Readdle
仕事効率化, ビジネス¥1,200iOSユニバーサル

▼今回紹介したAcrobatは学割が存在して、学生だとかなり安く買えます。

【自炊情報】Acrobat Pro 2017 は学生のうちに買うと65% OFFで買える話。Macでも使えるOCRソフト

【自炊情報】Acrobat Pro 2017 は学生のうちに買うと65% OFFで買える話。Macでも使えるOCRソフト
Acrobat Pro 2017とはWIndowsかMacで使えるPDFリーダーです。管理人は、OCR機能を使用するために購入しました。OCR機能というのは、写真に写ってる文字を文字だと認識させ、透明テキストの埋め込みを行うことです...

 

コメント

メインカテゴリー

デジタル勉強法 ペーパーレス化の方法勉強系アプリ
勉強に役立つアイテム・サービスを紹介