2014/10/23

綺麗な綺麗な自炊の仕方 -ドキュメントスキャナで書籍をデジタル化する

いまさらですが、何年もやってるとやはり技術が上がってきていい感じに熟成といいますか、満足できるようになったのでここに記載します。


きれいな自炊とは、きれいなデータとして保存できるまで、のことです。


  1. カット
  2. 採寸
  3. くべる
  4. 枚数があっているかチェック
  5. トリミング
  6. dpiを合わせる

1.カット
私は裁断機を使わずにカッターを使っています。普通のカッターで十分です。よく切れます。替刃も安い。


机を切らないように、余っていた木材と、木材と高さの合う本を台座にカットしています。結構なんとかなるもんです。







2.採寸
ここが重要な過程です。必ず実物より大きめにスキャナします。
机に採寸用のメモリをかましておくと楽ちんです。(2つ下の写真参考)

自炊データはスマホとかタブレットとか、そういったデジタルデバイスで読むことになるのでコンテンツ以外の余白はないほうが幸せです。パソコンのディスプレイくらい大きいと気になりませんが、モバイルデバイスだとかなり重要です。ですのでデジタル化しコンテンツが今後うまく活用できるかの重要なポイントに成ります。
(左が紙面そのままの余白あり、右が余白をカットしたもの。実際使用の際はこの差がとても大きいです)


というホうできれいなトリミング、楽なトリミングのポイントはスキャナの段階で始まります。
ポイントはスキャナを紙の大きさではなく、コンテンツの大きさを基準に大きめに取るということです。

つまり下の写真でいうところのC.でスキャナします。ポイントは、Cの右端が実際の紙よりも大きく取られているところです。

B.のコンテンツの両端から均等に、等距離の余白を作ってスキャナします。
上の場合ですと、B左とC左の距離と同じだけの余白を、B右とC右に作っています。


書籍は左右見開きという構造ですので、カットの仕方によって、というか大抵の場合は紙面の余白日が出ます。こういう差があるとパソコンで見開きで観覧できる場合はさほど気になりませんが、モバイルデバイスで1ページずつ観覧する場合はコンテンツが、ページ送りごとに左右にピコピコ動いてよろしくありません。

そしてなりより、スキャナ後のトリミングで失敗する場合があります。
スキャナーデーターの両端から100pxカット!!とかする事になるわけですが、見開き左右の頁で広い狭いが入れ替わるので結局カットできる余白はコンテンツをカットしないように最小ピクセルで設定することになります。すると当然広い側の余白を取り除ききれません。
奇数ページ・偶数ページで設定を変えてればできますが、そんなことはとてつもなく面倒です。



だからはじめからコンテンツに対して均等に余白をとってスキャナするのです。
実際の紙がないところは黒等でデータ化されますが、どうせトリミングする箇所なので関係ありません。

コンテンツだけに余白を取ると、図や解説写真、巻頭の写真など冊子フルサイズのコンテンツに対応できないという理由もあります。こういったフルサイズのコンテンツの数にもよりますが、数少なければ一枚一枚トリミングしても大した労力ではありません。

これはその本の重要度や図表の数で判断すればオケです。



というわけで大きめにとった採寸をスキャナサイズに入力です。間違っても自動トリミングなんか使いません。手間が増えるだけです。たとえ制度が上がったとしても、1-2枚でも失敗してるかも?という疑いがあれば結局全てチェックしなければなりません。それに各画像データのサイズが統一できないと、あとあと泣きます。ページによって時のサイズが違うということにもなりかねません。








3.くべる
さてようやくスキャナです。焚き火に巻きをくべる如くです。
これは危機にもよりますし、基本的に単純作業なので割愛。

ただしくべる際は、しっかりと紙を均しておくといいでしょう。カットが不十分で禅語のページとくっついていたり古い冊子もくっついている場合があります。
昔の銀行員が札束を数える用に、紙をなびかせて紙の間に一度空気を入れるようにほぐしておきましょう。






4.枚数のチェック
デジタル化した後でページ掛けがあったなど目も当てられません。必ずやりましょう。
私はいまだにVixというファイラーを使っているのでこちらの連番リネーム機能を使っています。


枚数チェックは、実際のページと名前を一致させます。つまり50頁のファイルは「aaa050.jpg」みたいな具合です。連番を振って最終ページまでページ数と名前が一致していればオケです。スキャナの掃除具合によって、カスが貯まると二枚同時に吸い込まれる、なんてこともあるのでちゃんとチェクっしましょう。





5.トリミングとリサイズ
さてようやくデジタルデータの加工です。
余白のカット(トリミング)とリサイズはPhotoShiferてアプリで同時にできます。
カットする余白の大きさはJtrimで測ってます。



あまりキツキツにやっても仕方ないのでコンテンツ+20ピクセルくらいが良いと思います。
リサイズは、書籍の需要度に寄りますが、テキスト主体なら幅800もあれば上等でしょう。



スキャナの段階でサイズを指定してるので、すべてのデータのサイズ(容量ではなくピクセル数)を統一できていることも大切です。
表紙や背表紙は、少ないので私は一枚一枚トリミングしています。そして最後にリサイズだけしてサイズを合わせます。



6.dpiをあわせる。
これが地味に大切です。JPGで保存する人に関係ありませんがPDFで保存する人には欠かせない工程です。

PDFで保存する利点

  • ファイルをひとつに纏められる
  • ライン引きができる
  • 文字認識させられる
  • 目次を付けられる
等です。ファイルをひとつにというのは、フォルダ内にJPGがワッサワッサあるより私はPDFにまとめたほうが扱いが良いという考え方です。何のデバイスで観覧するかにもよるのでこれは人それぞでしょう。

ライン引きというのは、気になった箇所に赤線を引いたりメモ書きができるということです。


文字認識は校正しないで適当に認識させとくだけでも、少しは検索の役に立つだろうという程度ですが、ないよりはいいかなと。

目次は、需要な書籍にしかつけませんが、便利な機能です。



さてPDFで保存する際は、800*1200ピクセルと言った画像ファイルのサイズのみの統一だけでは不十分です。画像ファイルにはその画像の印刷時の密度が付記されています。PDFは本来印刷状態を統一にするためのフォーマットなので、このdpiがたいせつになります。もしこれを統一してないと、下の画像のように表示がいびつになります。



これは表紙の印刷密度が散大で、白いページのほうが濃密な状態です。どうせもう印刷することはないのでdpiの値は何でも良いのですが、統一しておく必要があります。

dpiの調節は、解像度変更君というアプリが軽くて使いやすいです。




とまあこんな感じで綺麗に出来ました。
この状態ならモバイルデバイスでも十分に読みやすくいけます。

手間がかかるようですが、慣れれば流れ作業の合間にちょこちょこやるだけでどんどん進めます。



注意
スキャナで読んだだけで満足してしまい、いつか読もうと埋没しやすい!!!
「読んだだけで読んだ気になる」ので注意が必要です。


0 件のコメント:

コメントを投稿