浅析Word文档

2019-09-10 04:33陆静
计算机与网络 2019年22期
关键词:跨平台后缀文档

陆静

Word有一个保存对话框,里面包含了一大堆类型各异的文档扩展名。然而很多时候,我们对于这个面板都是一览而过,并没有好好看过它。那么问题来了,这些扩展名到底都代表什么意思?

1. Word文档

特点:体积小、易修复、支持Word高级功能

后缀:.docx

这是日常接触最多的一种文档格式,其实也是Word的默认格式。这种文件的扩展名是.docx,是Office 2007以后版本新增加的一个格式。优点很多。首先.docx相比之前的.doc在压缩比上更高,同样一份文件保存成.docx后,体积会明显减小。其次.docx增加了冗余字段,这样当文档遭遇破坏时,可以更容易被修复。此外新版Office的一些特性,比如SmartART、图片样式等也要比.doc强大很多,更美观也更加易用。另外如果将文档的扩展名修改为.zip,还可以像打开文件夹一样直接提取到文档里的图片,这些都是.doc不具备的。

2.启用宏的Word文档

特点:通过编程实现传统Word不具备的功能

后缀:.docm

和上一种格式相比,二者最大的区别就在于“宏”。“宏”是什么?简单理解是一种编程代码,通过嵌入到当前文档中,即可让该文档拥有其他文档无法拥有的功能。举个例子,从网上下载了一本小说,然而粘贴到Word中发现断行断字非常严重,这时就可以编写一小段代码让Word自动整理。而像这种带有编程代码的文档,就叫宏文档。而实现这一功能的编程语言,其实就是大名鼎鼎的VBA。

3. Word 97- 2003文档

特点:体积大、缺乏修复冗余功能、兼容性佳

后缀:.doc

也许怕直接写出扩展名大家看不懂,总之微软在这里费了半天口舌,其实它就是我们刚刚所说的.doc格式。在Office 2007诞生以前,所有的Word文档都是采用这种格式。虽然以今天的眼光来看,.doc有着体积庞大、没有冗余和不支持媒体提取等弊端,但由于Office的低版不支持高版原则(即低版本Office无法打开高版本.docx文件),有些特殊环境我们还是需要将文档保存为.doc格式。

4. Word模板、Word 97-2003模板

特点:适合建立规范化公文

后缀:.dotx/.dot

Word模板和Word 97-2003模板是同一个东西,均为模板文件,其中Word模板的扩展名是.dotx,对应于Office 2017及以后版本,Word 97-2003模板的扩展名是.dot,对应于Office 2003及以前版本。换句话说,和.docx与.doc一样,同样也是新老版本的区别。

那么什么又是“模板文件”呢?简单来说,如果公司对于文档格式有着专门要求(比如页眉添加Logo,页脚标注页码,标题4号字,正文5号字……),那么就可以提前做出一套文件,然后保存为.dotx。今后再建立新文件时,只要选择这个模板就可以了。而且它的一大优点是,即便用户执行保存命令,也不会影响模板里的内容。

5.启用宏的Word模板

特点:可以包括特殊功能的Word模板

后缀:.dotm

和宏文档一样,启用宏的Word模板也是通过编程实现一些特殊功能,只不过这一次是作用于模板而不是文件,很简单。

6. PDF

特点:跨平台、防篡改

后缀:.pdf

无论是.doc还是更先进的.docx都解决不了恶意篡改问题。当然你可以通过密码或文档权限解决这个问题,但.doc非开源限制又让文档的使用范围大大缩小。这里就不得不提到,另一种特殊的文档格式———PDF了。简单来说,PDF有2个优势:不易篡改和跨平台使用。

PDF类似于图片但又不是图片,打开PDF后会发现每一个文字都能选择却无法编辑,事实上这种情况在商务应用中会有很大优势,很多重要的标书、合同、报价函等都会转成PDF传递,看中的正是PDF文件的不可篡改性。

此外PDF文件也能在不同平台间无差别打开,无论是Windows,MacOS,Android,iOS,都可以展现出文档的原始相貌,不必担心字体、字号和排版等问题。甚至这一特性还被一些设计师采用,通过将一些设计好的海报模板转换成Word格式,发送给普通用户修改,之后再另存为PDF格式,就能直接拿到打印店印刷了,清晰度丝毫不比PS差。

7. XPS文档

特点:微软的跨平台作品,在与PDF的竞争中已落败

后缀:.xps

相比PDF,XPS的知名度就低多了,其实它是微软为了竞争PDF所开发的一种文档格式。和PDF一样,XPS也拥有跨平台、不易篡改、容易读取(比如IE就可以直接打开)等优势,且由于是微软提出,因此在某些功能上与Office组件结合更加紧密(比如在Office中设置了IRM访问权限,转换为XPS后依旧保留)。

然而尽管有着这样或那样的优势,但XPS已经是一款失败的文档格式,现实中使用这种格式的场景极少,不建议大家采用。

8.单个文件网页、网页、筛选过的网页

特点:HTML格式,适合网络發布

后缀:.mht/.htm/.htm

有时我们会将一些资料发布到网上,这就需要将文档保存为网页格式了。Word提供了3种不同的网页文件格式:单个文件网页、网页和筛选过的网页。

单个文件网页:只生成一个文件(扩展名为.mht),图片、CSS和HTML会全部放入这个MHT文件中。整个过程有点像PPT里内嵌字体,最终生成的MHT体积很大,但省去了烦心的相对路径与绝对路径问题。

网页:生成一个HTML文件和一个媒体文件夹,好处是方便用户快速展开里面的图片,而且HTML的兼容性也是最棒的,不过二者需要同时移动。

筛选过的网页:生成结果类似于网页,同样也是一个HTML文件和一个媒体文件夹。它的不同之处在于会删除Word里一些不相关标志,而通过CSS控制网页。

9. RTF格式

特点:跨平台文档格式,支持编辑

后缀:.rtf

RTF也是一种跨平台文档格式,和.doc这种封闭格式不同,RTF可以在很多平台甚至写字板中轻松打开。与PDF和XPS不同,RTF是允许用户进行相关编辑的,而且也会把文档中一些格式保存下来。换句话说,它其实是融合了PDF与TXT的各自优点,而且比XPS更通行。不过RTF不支持很复杂的格式,一些不被支持的格式會在保存时被丢弃,所以更倾向于内容方面的传递。

10.纯文本

特点:最通行的文本格式,体积小、不会中毒

后缀:.txt

“纯文本”其实就是TXT了,这是一种非常通行的文本格式,早在DOS时代就已经有了它的身影。TXT一般用于保存文本信息,比如文件资料、备忘录和小说等,很多地方都能看到TXT的身影。由于它的高通用性,几乎可以被任何软件所读取(如浏览器、程序和APP),完全不必担心阅读器的问题,要比PDF,XPS等方便很多。此外TXT还拥有体积小、不会中毒等特性,唯一的问题就是无法保存格式。

11. Word XML,Word 2003 XML,strict open xml

特点:主要用于程序间数据交换

后缀:.xml/.docx

XML是一种通用化标记语言,它的简单易行让其几乎成为数据交换的唯一公共语言,很多编程语言都能直接读写XML文件。比如读取一份文档资料,传统的.doc或.docx由于规则封闭,一般的编程语言是无法读取的,而转换成XML则可以解决这个麻烦。

XML与我们熟知的HTML渊源很深,但二者并非1.0与2.0的关系。HTML语法松散主要用于网页编辑,XML语法严谨更侧重数据格式化存储。至于Word保存菜单里的“Word XML文档”和“Word 2003 XML文档”,同样也是Office版本的差异。

12. Opendocument文本

特点:跨平台免费文档格式

后缀:.odt

ODT是由OpenOffice软件生成的一种电子文件格式,由于OpenOffice的自由软件身份,使得它在Windows,Linux,MacOSX,Solaris等操作系统中都有很多拥簇。和PDF一样,ODT也支持格式排版,能够在不同平台间提供近乎一致的显示效果。不过和RTF一样,它也是允许用户编辑的,这一点是它和PDF的最大不同。

作为一款办公软件,Office体量之庞大从这篇文章便可见一斑。除了要兼顾自身功能外,还要同时满足不同环境、不同用户的信息交换需求。

猜你喜欢
跨平台后缀文档
浅谈Matlab与Word文档的应用接口
有人一声不吭向你扔了个文档
一款游戏怎么挣到全平台的钱?
轻松编辑PDF文档
潜力双跨平台:进阶:谁将跨入下一个“十大”?
基于C++语言的跨平台软件开发
Word文档 高效分合有高招
倍增法之后缀数组解决重复子串的问题
两种方法实现非常规文本替换
从型号后缀认识CPU性能