現在開催中の電子書籍ストアセール情報まとめ

家電・PCなどのAmazonセール情報

注目の大規模セール・速報など (8/18更新)




Mac OS X Mavericks の Preview でPDFを結合するとサイズが膨れ上がる現象について

定期的に手持ちの書籍をPDF化するようにしていて、裁断した書籍の取り込みはScanSnap S1500で、PDFの結合作業はMacのPreviewを使っているのですが、どうもMavericksのPreviewがバグっぽい挙動をしていたので、メモを残しておきます。

発生している問題

透明テキストの含まれているPDFをMavericksのPreviewで結合すると、サイズがありえないくらいに膨れ上がる場合がある。

作業環境

PDFの読み取り:ScanSnap Manager(ScanSnap S1500に付属のPDF読み取り&OCRツール)

書籍を全編カラーで読み込むとサイズが膨れ上がり、また紙の黄ばみといった不要な情報まで拾ってしまうので、表紙だけはカラーで、本文(中身)はグレースケールで読み込むようにしています。

PDFの結合:MacのPreview

表紙と中身で別の読み取り設定を使っていると、別々のPDFが出来上がるため、最終的にそれらを結合する必要があります。私は結合にMacのPreviewを使っています。

問題の再現方法

  1. 透明テキストが含まれるPDFを2つ用意します。それぞれのサイズは、100MB、5MBとします。
  2. この2つのPDFを結合する際に、「100MBに5MBを追加する」のと「5MBに100MBを追加する」のとで、結合後のサイズが大きく異なってきます。

100MBと5MBのファイルを結合したのですから、結果は大体105MB程度になると予想できます。実際に、「100MBに5MBを追加する」場合だと、大体105MB程度のPDFファイルが出来上がります。しかし、「5MBに100MBを追加する」場合では、400MBを超えるサイズのPDFが出来上がってしまうのです。

サイズが異常に大きくなる原因

透明テキストのサイズが肥大化しているのが原因のようです。400MBに膨れ上がってしまったPDFに対して、Adobe Acrobat XI Proを使って透明テキストを削除してみたところ、105MB程度までファイルが小さくなることが確認できました。つまり透明テキストだけで200数十MBという、通常ありえないサイズを占有していたことになります。(*Adobe Acrobat XI Proは30日間の無料体験版を使いました)

まとめ

MacのPreviewで透明テキスト付きのPDFを結合する場合は、サイズの大きいPDFに小さいPDFを結合するようにした方が良いかと思います。これを逆にすると、ファイルのサイズがびっくりするほど膨れ上がってしまうことがあります。

これ、バグっぽい挙動にも思えますが、どうなんでしょうかね。