PDF压缩技巧及PDF压缩软件(再次更新)

  总结一下PDF压缩技巧及相关的PDF压缩软件,作为 全面接触PDF:最好用的PDF软件汇总 的专门补充。尽管使用 pdf 压缩的机会不多,但考虑到这方面的相关文章和软件介绍极少,所以,写作此文并持续完善。欢迎指正补充。

一、PDF内部的压缩技术

  pdf 文件内部已经使用了如下压缩技术:
  - LZW (Lempel-Ziv-Welch) 与 FLATE (ZIP, PDF v1.2):用于图像、文本的无损压缩。
  - JPEG 及 JPEG2000 (PDF v1.5):用于图像的有损和无损压缩。
  - CCITT (Group 3 or 4) 与 JBIG2 (PDF v1.4):用于黑白图像无损压缩。
  因此,pdf文件通过压缩软件(7-Zip/WinZip/WinRar)来减小存储体积的做法,通常不会取得明显效果。但必要情况下,也不妨尝试。比如Ni网友留言说,“7-Zip的LZMA算法对某些文件还是有很大压缩效果的,曾试过把50M的PDF用7z压到16M。”

二、pdf文件体积的相关因素及压缩技巧|更新

  关于PDF文件的体积与优化。
  1. 任何优化(或压缩)都可以分为两种:有损和无损。涉及的信息,既包括能直接看到的文字、图像,也包括不被直接看到的字体、文件元信息等。举个非pdf的例子,从bmp到png的格式转换是无损的,到jpg就是有损的。对jpg优化(有损)而言,一种是降低图像质量,一种是减少头信息。其中比较智能的软件,在降低图像质量时,能对不同区域采取不同的图像压缩比。即:次要区域多压缩多损失,重要区域少压缩保持高质量。
  2. pdf如果体积较大,通常是来自图像和嵌入的字体。
  3. 生成pdf时就要考虑体积,建议:采用较少的字体,采用常见的字体,这样就可以在减少字体嵌入的成本,而不影响显示质量。减少图片的数量、尺寸、色深,采用最适合的格式。

  从文件体积看,可以这样表示:pdf=文+字体+格式+图+附件。因此,压缩pdf也要从这些方面入手。

PDF的字体优化原则|更新

  字体优化(via)的原则如下:
  - 优先使用标准字体。PDF默认的标准字体有5种(Times, Helvetica, Courier, Symbol, ZapfDingbats),规范的pdf阅读器必须支持这些字体。此外的字体就有可能需要全部或部分嵌入(Font Embedding)。
  - 使用较少种类的字体。若要体积小,就不要宋体、楷体、黑体一齐来了。另外,滥用字体会远离美观而偏向花哨甚至恶俗。
  - 使用较少的字体风格。对pdf而言,常规、粗体、斜体、粗斜体是4种不同的字体,需要分别嵌入。少用一种是一种。另外,这些字体强调方式,可以换用字号、颜色、下划线、字符间距、缩进等手段实现,它们不会占用多余体积。
  - 使用轻型字体。(比如某些华丽的艺术字体,比常规的黑体、宋体体积更大)。

PDF的图像优化

  待完成……

通常有效的PDF优化措施|更新

  - 用 PDF 打印软件把pdf文件再打印为新的pdf;(推荐一试,因为有大量免费软件!)
  - 在 PDF 编辑软件中“另存为” 。解释:pdf是一种“增量保存(incremental updates)”格式。当你改变一些信息后,它会将这种变化“保存”在原文件的最后,这种做法速度快,但文件体积大。而“另存”则是重写文件内容,速度稍慢,但文件体积减小。
  - 高级PDF编辑软件中的优化按钮。如 Nitro PDF Button → Prepare → Optimize Document;如Acrobat 8 → Advanced → PDF Optimizer.

更多PDF优化资料|更新

   Optimizing your PDF files
  Optimize PDF Files
  Reducing PDF File Size
  
  oversky网友留言 2009-09-27:pdf creator, cutepdf, PrimoPDF, PDF ReDirect, Bullzip 这样都是用 ghostscript 来生成 pdf。档案大小、品质会有差都是因为设定的关系。主要是在图案的 jpeg 压缩比、解析度较高的图案是否有 downsampling,还有字型是否有包入 pdf 档有关。真要说可以制作比较小的档案,要找可以把图用 jpeg2000 压的,目前我只看到 PDF-XCHANGE 4 PRO 和 adobe acrobat 有这技术。

三、pdf 压缩软件综述

免费PDF压缩软件|更新

  免费pdf压缩软件几乎不存在。很多早期免费的pdf压缩软件都在版本升级后转成了收费软件,不再提供免费版本,只能自行搜索。
  - PDF Compress v1.0 免费版:出自 bureausoft 公司,免费版可在 这里 下载注意不要选择官方链接(Official Download),只有选择下载站未更新的链接,才是旧的免费版(2009-10-15测试通过)。最新版本注册价格为 49 USD。
  - Free PDF Compressor:旧的免费版未找到下载链接(欢迎提供),新版为 Nice PDF Compressor(59 usd)。

收费PDF压缩软件

  多数pdf解决方案供应商都有类似专门软件(verypdf/Advanced PDF Tools/PDF Compress;)或全能软件中包含了压缩功能(acrobat)。

四、压缩软件 PDF Shrink 试用手记

  pdf shrinkPDF Shrink:原Mac平台的pdf压缩软件,现开始提供windows和iPhone版本。试用期 10天,注册价格:35usd。2009年10月,善用佳软得到了 PDF Shrink 的 windows 内测版本,试用如下。

1. 下载安装与试用

  下载:PDFshrink_w45.exe 约3.5MB。
  安装:安装后 9.3MB,包括如下文件:

PDFShrink.exe
PDF Shrink Users Guide.pdf
webupdater.exe
Apago PDF Shrink.url
license.txt
uninst.exe
webupdatedlg.xrc
6,824 KB
540 KB
1,920 KB
1 KB
1 KB
49 KB
33 KB

  运行主程序,PDFShrink.exe,其界面与基本功能可通过下面的视频 (抱歉,不太清晰)有个基本了解。

  软件的基本界面很简单,主界面的列表是几个预设压缩方案。直接把pdf文件拖放到对应方案上即可。

2. PDF Shrink 压缩原理

  PDF Shrink Users Guide.pdf 中提到,“PDF Shrink reduces the size of PDF files by optimizing the resolution and compression method of each image in the PDF file. The interface allows for setting different compression and resolution choices for color, grayscale and monochrome images.”
  照此来说,PDF Shrink 的优化措施只是在图片方面:优化(应该就是降低)分辨率、改进压缩算法。而不涉及影响到pdf大小的其他方面(比如字体嵌入)。

3. 纯文本pdf压缩测试

原始文件:雪山飞狐.txt,ansi编码 264KB。
测试过程:用notepad.exe打印到如下三款pdf打印机(采用默认设置),然后,用 PDF Shrink 的 web 方案进行压缩。
测试结果:

生成软件 初始pdf大小 PDF Shrink后 压缩率
PDFCreator 825 KB 800 KB 3.0%
PDFCreator-优化* 417 KB 375 KB 5.3%
CutePDF Writer 1080 KB 1055 KB 2.2%
TinyPDF 982 KB 950 KB 3.3%

* PDFCreator-优化:手工设置不嵌入字体。

结论:
  PDF Shrink 对文字内容几乎无法压缩。不嵌入字体是减少文本类型PDF体积的有效手段。

4. 纯图像pdf压缩测试

原始文件:photo.doc。制作过程:直接在 MS Word 2003 中 ctrl+n 新建文档,在TC中拖放3图片文件(数码相机照片,jpg,3888 x 2592 像素,每张约 3MB,共 9.7MB)到该doc文档,保存,得 doc 文件 10.3 MB。分别打印到如下三款pdf打印机(采用默认设置),然后,用 PDF Shrink 的 web 方案进行压缩。
测试结果:

生成软件 初始pdf大小 PDF Shrink后 压缩率
PDFCreator 1634 KB 39 KB 97%
PDFCreator-优化* 49 KB 42 KB 15%
CutePDF Writer 2182 KB 39 KB 98%
TinyPDF 837 KB 210 KB 75%

* PDFCreator-优化:手工设置pdf分辨率,从默认600降到72;彩色图像压缩从默认自动改为 jpeg 最大压缩,并设分辨率为72。

结论:
  ① 总体看,大尺寸图像的压缩,从doc到pdf,再到压缩后的pdf,都有明显效果。本例:10MB → 1-2MB → 50KB。
  ② CutePDF Writer 和 PDFCreator 生成的原始文件相差较多,但压缩后的体积相同。这是因为本质上它们都是用 ghostscript 生成的。
  ③ 基于 GhostScript 的 PDF 生成,可以通过参数设置降低文件大小。比如 PDFCreator 更改设置后直接生成的 pdf 为49KB,但比起 PDF Shrink 压缩出的更小(39KB)的pdf,图像质量较差。

5. 实际网页测试

原始文件:在 Chrome 浏览器中打开 http://xbeta.info 页面,分别打印到如下三款pdf打印机(采用默认设置),然后,用 PDF Shrink 的 web 方案进行压缩。
测试结果:

生成软件 初始pdf大小 PDF Shrink后 压缩率
PDFCreator 203 KB 189 KB 5%
CutePDF Writer 289 KB 271 KB 4%
TinyPDF 188 KB 167 KB 9%

结论:
  ① pdf压缩效果取决于图像/文字的比例。
  ② 对于本身体积较小的pdf文件,最终大小首先取决于生成时的设置,其次才是压缩。比如,本例中,用tiny pdf生成的原始文件,比压缩后的cuteppdf、pdfcreator文件更小。

  大家如有其他关心问题,欢迎留言提出。

附录:文章更新历史

  2009-10-15:补充PDF优化方法与建议;更正链接/错字,鸣谢黯然过客、ivanlee。
  2009-10-14:新增纯文本、纯图片测试案例。
  2009-10-14:初稿。
>

《PDF压缩技巧及PDF压缩软件(再次更新)》有25个想法

    1. 真厉害。已经是压缩档的能压那么大?就好象拿7zip压mp3和rmvb一样。能压缩的,大部分是很多是冗余数据的。对于Jpg来的pdf,唯一的办法就是降低图片质量。

      1. 是滴噢.
        用Acrobat优化压缩后的PDF, 通常用7z压还是比较有效的. 一个160多M的扫描版PDF(图片格式), 已经用Acrobat最优化压缩, 再用7z压, 可以有92%的压缩率, 可以小10M了.
        因为经常通过网络传PDF, 能少一些都是好处.
        当然, 这是要用一定的时候作代价的, 有必要的才用就是了.

  1. pdf shrink的高级设置中,可以移除 Base 14 Fonts. 即
    Times (v3) or Times New Roman PS MT (v4.x) – 4 versions*
    Helvetica (v3) or Arial MT (v4.x) – 4 versions
    Courier – 4 versions
    Symbol
    Zapf Dingbats
    * (regular, bold, italic or oblique, and bold italic of each)

  2. 善用佳软,貌似更换了缓存插件啊……
    放弃了cos-html-cacahe,启用了wp-super cache,是cos-html-cacahe有什么不足的地方么?希望告知一下,对我们这些WP新人也是个启发,在选择缓存插件的时候有个参考。
    谢谢。
    【善用佳软:sorry,我不关注也不懂这些,是管理员做的。】

  3. 不太懂这个,我自己生成的PDF文件都比较大…而且图片没原文档清晰,文字貌似也不是原文档的字体~~

    我是用WPS来制作的

    1. 我并不能断定 IHQC 的压缩效果是否真比目前的算法(比如jpg,jpg2000)更好。但它提到的思路是对的,即把图片智能分成不同部分(或不同层),然后分别采用最优压缩算法,而不是一刀切。也就是说,IHQC的核心不是C(compress),而是I (intelligent)。这种技术在商用中也并非独家,比如,这款佳能数码复合机就可以: http://office.pconline.com.cn/manu/0909/1827209.html

  4. 你好!请教一个问题:关于PDF中中文字体显示

    为了目的更明确些,将问题简化成:哪一种中文字体在PDF中用显示器(开启了Cleartype)显示最清晰?我使用过衬线字体(Serif)如:宋体、方正新报宋、方正博雅、方正书宋,非衬线字体(Sans Serif):黑体、雅黑等,从阅读心理上说,衬线字体更适合长篇阅读,而令人遗憾的是:即使是破折号——这样的符号,其边缘也是无法锐利。
    能否给予指点一二?谢谢!

  5. 直接用PDF/X标准就好了~
    曾经试过将接近1G的服装图片(图片要求高,350DPI,TIF)转成PDF后150M不到,印出来效果一样~

    刚做了个测试:某出版文件(InDesign CS2),200多页,50多个字体,平均每页有一张相片,InDesign文件+链接图总共有1G多。

    用PDF/X标准打印,生成PDF文件400多M~
    再用Acrobat 7.0优化,生成PDF文件126.94M,此文件可用于印刷~
    跟着用7zip极限压缩,生成7z文件126.89M~

    个人认为PDF的压缩技巧主要是在于图片,如果需要印刷,则选个质量较高的压缩,如果只是电脑上看的,图片的分辨率可以低一点。文本和字体暂时是不会有更高的压缩率的了。

  6. Pingback: air max 90 jaune
  7. Pingback: dr zizmor

发表评论

电子邮件地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据