PDF压缩技巧及PDF压缩软件(再次更新)

  总结一下PDF压缩技巧及相关的PDF压缩软件,作为 全面接触PDF:最好用的PDF软件汇总 的专门补充。尽管使用 pdf 压缩的机会不多,但考虑到这方面的相关文章和软件介绍极少,所以,写作此文并持续完善。欢迎指正补充。

一、PDF内部的压缩技术

  pdf 文件内部已经使用了如下压缩技术:
  - LZW (Lempel-Ziv-Welch) 与 FLATE (ZIP, PDF v1.2):用于图像、文本的无损压缩。
  - JPEG 及 JPEG2000 (PDF v1.5):用于图像的有损和无损压缩。
  - CCITT (Group 3 or 4) 与 JBIG2 (PDF v1.4):用于黑白图像无损压缩。
  因此,pdf文件通过压缩软件(7-Zip/WinZip/WinRar)来减小存储体积的做法,通常不会取得明显效果。但必要情况下,也不妨尝试。比如Ni网友留言说,“7-Zip的LZMA算法对某些文件还是有很大压缩效果的,曾试过把50M的PDF用7z压到16M。”

二、pdf文件体积的相关因素及压缩技巧|更新

  关于PDF文件的体积与优化。
  1. 任何优化(或压缩)都可以分为两种:有损和无损。涉及的信息,既包括能直接看到的文字、图像,也包括不被直接看到的字体、文件元信息等。举个非pdf的例子,从bmp到png的格式转换是无损的,到jpg就是有损的。对jpg优化(有损)而言,一种是降低图像质量,一种是减少头信息。其中比较智能的软件,在降低图像质量时,能对不同区域采取不同的图像压缩比。即:次要区域多压缩多损失,重要区域少压缩保持高质量。
  2. pdf如果体积较大,通常是来自图像和嵌入的字体。
  3. 生成pdf时就要考虑体积,建议:采用较少的字体,采用常见的字体,这样就可以在减少字体嵌入的成本,而不影响显示质量。减少图片的数量、尺寸、色深,采用最适合的格式。

  从文件体积看,可以这样表示:pdf=文+字体+格式+图+附件。因此,压缩pdf也要从这些方面入手。

PDF的字体优化原则|更新

  字体优化(via)的原则如下:
  - 优先使用标准字体。PDF默认的标准字体有5种(Times, Helvetica, Courier, Symbol, ZapfDingbats),规范的pdf阅读器必须支持这些字体。此外的字体就有可能需要全部或部分嵌入(Font Embedding)。
  - 使用较少种类的字体。若要体积小,就不要宋体、楷体、黑体一齐来了。另外,滥用字体会远离美观而偏向花哨甚至恶俗。
  - 使用较少的字体风格。对pdf而言,常规、粗体、斜体、粗斜体是4种不同的字体,需要分别嵌入。少用一种是一种。另外,这些字体强调方式,可以换用字号、颜色、下划线、字符间距、缩进等手段实现,它们不会占用多余体积。
  - 使用轻型字体。(比如某些华丽的艺术字体,比常规的黑体、宋体体积更大)。

PDF的图像优化

  待完成……

通常有效的PDF优化措施|更新

  - 用 PDF 打印软件把pdf文件再打印为新的pdf;(推荐一试,因为有大量免费软件!)
  - 在 PDF 编辑软件中“另存为” 。解释:pdf是一种“增量保存(incremental updates)”格式。当你改变一些信息后,它会将这种变化“保存”在原文件的最后,这种做法速度快,但文件体积大。而“另存”则是重写文件内容,速度稍慢,但文件体积减小。
  - 高级PDF编辑软件中的优化按钮。如 Nitro PDF Button → Prepare → Optimize Document;如Acrobat 8 → Advanced → PDF Optimizer.

更多PDF优化资料|更新

   Optimizing your PDF files
  Optimize PDF Files
  Reducing PDF File Size
  
  oversky网友留言 2009-09-27:pdf creator, cutepdf, PrimoPDF, PDF ReDirect, Bullzip 这样都是用 ghostscript 来生成 pdf。档案大小、品质会有差都是因为设定的关系。主要是在图案的 jpeg 压缩比、解析度较高的图案是否有 downsampling,还有字型是否有包入 pdf 档有关。真要说可以制作比较小的档案,要找可以把图用 jpeg2000 压的,目前我只看到 PDF-XCHANGE 4 PRO 和 adobe acrobat 有这技术。

三、pdf 压缩软件综述

免费PDF压缩软件|更新

  免费pdf压缩软件几乎不存在。很多早期免费的pdf压缩软件都在版本升级后转成了收费软件,不再提供免费版本,只能自行搜索。
  - PDF Compress v1.0 免费版:出自 bureausoft 公司,免费版可在 这里 下载注意不要选择官方链接(Official Download),只有选择下载站未更新的链接,才是旧的免费版(2009-10-15测试通过)。最新版本注册价格为 49 USD。
  - Free PDF Compressor:旧的免费版未找到下载链接(欢迎提供),新版为 Nice PDF Compressor(59 usd)。

收费PDF压缩软件

  多数pdf解决方案供应商都有类似专门软件(verypdf/Advanced PDF Tools/PDF Compress;)或全能软件中包含了压缩功能(acrobat)。

四、压缩软件 PDF Shrink 试用手记

  pdf shrinkPDF Shrink:原Mac平台的pdf压缩软件,现开始提供windows和iPhone版本。试用期 10天,注册价格:35usd。2009年10月,善用佳软得到了 PDF Shrink 的 windows 内测版本,试用如下。

1. 下载安装与试用

  下载:PDFshrink_w45.exe 约3.5MB。
  安装:安装后 9.3MB,包括如下文件:

PDFShrink.exe
PDF Shrink Users Guide.pdf
webupdater.exe
Apago PDF Shrink.url
license.txt
uninst.exe
webupdatedlg.xrc
6,824 KB
540 KB
1,920 KB
1 KB
1 KB
49 KB
33 KB

  运行主程序,PDFShrink.exe,其界面与基本功能可通过下面的视频 (抱歉,不太清晰)有个基本了解。

  软件的基本界面很简单,主界面的列表是几个预设压缩方案。直接把pdf文件拖放到对应方案上即可。

2. PDF Shrink 压缩原理

  PDF Shrink Users Guide.pdf 中提到,“PDF Shrink reduces the size of PDF files by optimizing the resolution and compression method of each image in the PDF file. The interface allows for setting different compression and resolution choices for color, grayscale and monochrome images.”
  照此来说,PDF Shrink 的优化措施只是在图片方面:优化(应该就是降低)分辨率、改进压缩算法。而不涉及影响到pdf大小的其他方面(比如字体嵌入)。

3. 纯文本pdf压缩测试

原始文件:雪山飞狐.txt,ansi编码 264KB。
测试过程:用notepad.exe打印到如下三款pdf打印机(采用默认设置),然后,用 PDF Shrink 的 web 方案进行压缩。
测试结果:

生成软件 初始pdf大小 PDF Shrink后 压缩率
PDFCreator 825 KB 800 KB 3.0%
PDFCreator-优化* 417 KB 375 KB 5.3%
CutePDF Writer 1080 KB 1055 KB 2.2%
TinyPDF 982 KB 950 KB 3.3%

* PDFCreator-优化:手工设置不嵌入字体。

结论:
  PDF Shrink 对文字内容几乎无法压缩。不嵌入字体是减少文本类型PDF体积的有效手段。

4. 纯图像pdf压缩测试

原始文件:photo.doc。制作过程:直接在 MS Word 2003 中 ctrl+n 新建文档,在TC中拖放3图片文件(数码相机照片,jpg,3888 x 2592 像素,每张约 3MB,共 9.7MB)到该doc文档,保存,得 doc 文件 10.3 MB。分别打印到如下三款pdf打印机(采用默认设置),然后,用 PDF Shrink 的 web 方案进行压缩。
测试结果:

生成软件 初始pdf大小 PDF Shrink后 压缩率
PDFCreator 1634 KB 39 KB 97%
PDFCreator-优化* 49 KB 42 KB 15%
CutePDF Writer 2182 KB 39 KB 98%
TinyPDF 837 KB 210 KB 75%

* PDFCreator-优化:手工设置pdf分辨率,从默认600降到72;彩色图像压缩从默认自动改为 jpeg 最大压缩,并设分辨率为72。

结论:
  ① 总体看,大尺寸图像的压缩,从doc到pdf,再到压缩后的pdf,都有明显效果。本例:10MB → 1-2MB → 50KB。
  ② CutePDF Writer 和 PDFCreator 生成的原始文件相差较多,但压缩后的体积相同。这是因为本质上它们都是用 ghostscript 生成的。
  ③ 基于 GhostScript 的 PDF 生成,可以通过参数设置降低文件大小。比如 PDFCreator 更改设置后直接生成的 pdf 为49KB,但比起 PDF Shrink 压缩出的更小(39KB)的pdf,图像质量较差。

5. 实际网页测试

原始文件:在 Chrome 浏览器中打开 http://xbeta.info 页面,分别打印到如下三款pdf打印机(采用默认设置),然后,用 PDF Shrink 的 web 方案进行压缩。
测试结果:

生成软件 初始pdf大小 PDF Shrink后 压缩率
PDFCreator 203 KB 189 KB 5%
CutePDF Writer 289 KB 271 KB 4%
TinyPDF 188 KB 167 KB 9%

结论:
  ① pdf压缩效果取决于图像/文字的比例。
  ② 对于本身体积较小的pdf文件,最终大小首先取决于生成时的设置,其次才是压缩。比如,本例中,用tiny pdf生成的原始文件,比压缩后的cuteppdf、pdfcreator文件更小。

  大家如有其他关心问题,欢迎留言提出。

附录:文章更新历史

  2009-10-15:补充PDF优化方法与建议;更正链接/错字,鸣谢黯然过客、ivanlee。
  2009-10-14:新增纯文本、纯图片测试案例。
  2009-10-14:初稿。
>

复活节礼物:Expert PDF 5 Pro完整版

免费的PDF Reader有很多,免费的PDF Printer也不少,但免费的 PDF Editor 则几乎没有。如果你需要的话(不需要就算了),现在就有机会:复活节期间,CHIP.de 在发放 Expert PDF Pro 5完整版。

Expert PDF Pro 是完整的商业PDF解决方案,包括 PDF Editor、PDF Creator、WaterMark Creator、Word Converter 等组件。最新版eXPert PDF 6 的注册价格 $94.88。

进入[注册]页面后,输入Email,点击按钮,如图1
新页面显示了sn和下载链接(40+MB),如图2

安装包运行过程中的界面(包括注册页)均为德文,安装以后,把安装目录的 eXPert PDF 5\Resources\ 下的文件(德文语言包)清空,即为英文界面。
软件界面如下:

总结:如果你有PDF 编辑需求,可下载收藏此软件(或购买其他软件,如体积更为小巧的 Foxit PDF Editor,需¥792.00 );对一般用户,我认为意义不大。只是因为我在追讨域名过程中用过PDF编辑工具,所以,较为关注,分享此消息。

说明:我安装时最后出错导致未能安装完整,用官方安装包的文件补全以后才能正常使用Editor,而Creator仍处于未注册状态,不过,免费的Creator有很多,无所谓。

[via for-free-on-internet]>

PDF-XChange Viewer:功能最全的PDF阅读软件(待更新)

  PDF阅读软件种类繁多,且大多免费。其中,功能最丰富者当属 PDF-XChange Viewer。如果你需要注释、页面处理等较多功能,则应该首选 PDF-XChange Viewer(官网中文翻译介绍)。

一、下载和安装 PDF-XChange Viewer

  下载地址:善用佳软一贯的下载建议是,到 官方网站 进行下载。
  版本选择:喜欢小巧,则可下载免安装zip版(6MB,不包括帮助文件);喜欢一次到位,则可选择安装包(16-20MB,支持32/64位Windows)。
  更多说明:参见 download notes

  如果运行安装包:
  * 运行zip包中的 PDFXVwer.exe进行安装:接受协议,选定安装目录。提示:不要总接受默认安装目录,我的习惯是装在D盘,比如 d/:Program Files/pdf/PDF-XChange Viewer。
  * 设定安装内容。提示:如果最精简安装,只需14.7MB。自动升级和帮助文件可以不安装。建议:安装帮助文件。
  * 是否在桌面增加快捷方式?可先增之,后若不需要,可随时删之。或归集到其他目录。
  * 是否设为默认pdf阅读器?作为不了解的新软件,可暂不选。如果信任该软件或善用佳软的推荐,也可选之。
  * 安装成功,询问:是否启动软件?是。

  关于语言文件:
  在安装目录下的 Languages 文件夹中,有大量的 xml 文件。如果只需要简体中文,则可保留 PDFXVW_Chs.xml,而删除其他文件。

二、试用软件(以下待更新)

第一印象

运行程序,启动屏幕——炫丽的蓝天彩虹(图略)一闪而过,带给你与众不同的感觉。接下来就是软件主界面(下图为打开文件之后):

软件界面有3个特点:一是工具按钮比较多,预示着较多功能;二是当前无效的按钮会暗色显示,很人性;三是窗口缩小后,按钮会重新排列。这些特点都体现了软件的人性化。
按Ctrl+O打开一个文件,这样很普通的操作,竟然也有创新。选中一个pdf文件后,打开对话框右边会出现一个预览窗口,将文件视图、基本信息展现出来。『提示:这对于大量的1.pdf,2.pdf……场合尤其有用』

强大的标注功能

打开文件后,普通功能就不用多试了,直奔它的标注功能来吧。看到那么多按钮谁不想试试呢?先提醒一下,目前的所有标注功能,无论typewriter还是note,都可以很好地输入中文,并且支持各种字体!标注效果如下:

注意,标注内容是可以保存到pdf中的,这样,以后打开时,标注仍然存在。关于删除标注的提示:xbeta试用中,发现只能右键菜单删除;而不能用del键或undo功能删除标注。

其实,它的标注功能实在太强,绝非一段话所能介绍,还是参见异尘行者的大作《新版 PDF XChange Viewer 注解工具功能详解》吧。

多页签方式

多页签是当今潮流,Firefox2、IE7、VIM7这些最顶级的软件都加入了进来。新出的PDF-XChange Viewer当然不能置之不理。不仅支持多页签,还有一种缩略图并排显示模式(半透明效果,仍能看到当前的pdf文件)。

强大的导出为图像功能

它可以把一页(或多页)导出为常见的图像格式(png/gif/tiff/jpg),其中有很多参数可以选择。

搜索PDF

PDF-XChange Viewer不仅能在当前打开的pdf中搜索文字(支持汉字),还可以在指定目录下的多个文件中进行搜索。效果如下:

Zoom与导航
PDF-XChange Viewer还有一个比较特别的Zoom工具Loupe,相当于屏幕放大镜。此外,还有一个Pan & Zoom功能,相当于缩略图导航。

鼠标取词即时翻译
在这方面,PDF-XChange Viewer做得比Foxit Reader要更好。现在可以支持金山词霸、Lingoes、StarDict即时翻译。看看异尘行者的感受吧:

8/16的更新中,PDF XChange Viewer這一款免費PDF閱讀器,加入了支援Lingoes和StarDict這兩款免費即時翻譯軟體的功能!PDF XChange Viewer不只免費小巧,而且有非常豐富的PDF筆記註解功能,可以說是目前功能性最強大的免費PDF閱讀器,想知道詳細註解功能說明的朋友,可以參考我之前寫的:「PDF XChange Viewer 使用心得分享:與你的 PDF 互動」、「新版 PDF XChange Viewer 註解工具功能詳解」。而Lingoes靈格斯詞霸是一款免費的即時翻譯軟體,有豐富的字典檔可以下載,具有自動取詞、全文翻譯等功能,對於只需要基本翻譯的朋友,實在不需要用到譯典通,「Lingoes靈格斯詞霸」就綽綽有餘了。而StartDict星際譯王是另外一款免費的即時翻譯軟體,也是非常的簡單實用,最近還剛剛推出了最新的3.0版。這三款優秀的免費工具,現在可以互補利用,實在是一個令人開心的好消息啊!……讚嘆完畢。

三、总结

由上文可看出,尽管此软件仍处在1.x版,但功能异常丰富。并且在试用中也发现,打开文件速度也很快。此外,此软件更多功能还在计划中,相信未来的新版本会带来更多惊喜,拥有越来越多用户。xbeta写此文以后,已经有3个小版本升级,但其中的功能改进非常大。

如果你想尝新,想试一下pdf的多种批注功能,则强烈推荐此软:官方主页官方下载

链接:更多pdf介绍请见http://del.icio.us/xbeta.info/pdf

附录:文章更新历史

  2010-02-11:正在开始全面更新。
  07.11更新中文精简免安装版下载包。
  07.10更新取词、注释部分,并将部分图片换为中文界面;
  07.07更新对汉字的支持;
  2007-04-08: 初稿。
>