word转pdf字体斜体-如何制作PDF样本?

2022-12-14 18:24:27

如何制作pdf样本?

pdf文件是目前比较流行的电子文档格式，在办公自动化（oa）等软件的开发中，经常要用到该格式，但介绍如何制作pdf格式文件的资料非常少，在网上搜来搜去，都转贴的是同一段“暴力”破解的方法，代码片断如下：

streamwriter ppdf=new streamwriter(filepath);

arraylist xrefs=new arraylist();

float ypos =0f;

long streamstart=0;

long streamend=0;

long streamlen =0;

string strpdfmessage=null;

//pdf文档头信息

strpdfmessage="%pdf-1.1\n";

converttobyteandaddtostream(strpdfmessage);

xrefs.add(mpdf.length);

strpdfmessage="1 0 obj\n";

converttobyteandaddtostream(strpdfmessage);

strpdfmessage="<< /length 2 0 r >>\n";

converttobyteandaddtostream(strpdfmessage);

strpdfmessage="stream\n";

converttobyteandaddtostream(strpdfmessage);

……

看了上面的制作办法，我眼镜都摔坏了三幅，如果用上面这样原始的办法能制作出满意的pdf文件，那一定是天才所为。后来，我从一个网站（网址： http://itextsharp.sourceforge.net/index.html ）中看到了专门制作pdf文件的控件的介绍，暗喜之余，立马下载试验，果然非常轻松地制作出了想要的pdf文件，因为网站为英文，内容又多，读起来非常费力，在解决了自己的问题后，看到许多网友还在为pdf文件制作而郁闷，遂决定将该内容翻译为中文，由于本人英语水平一般，许多地方又晦涩难懂，故翻译质量不是很满意，敬请斧正，但大部分能看懂。本文的目的一是解决部分网友的燃眉之急，二是抛砖引玉，如果哪位仁兄愿意将该网站中的内容准确翻译出来，则是天下之大幸。

要用本文的方法生成pdf文件，需要两个控件：itextsharp.dll和icsharpcode.sharpziplib.dll，由于示例代码实在太多，我将代码全部整理出来，放在另外一个文件“示例代码.doc”中，所有这些资源，我均放在了本人的ftp站点（ftp://202.107.251.26）上的“pdf文件制作全攻略”文件夹中（文件夹中另外两个rar压缩文件为两个控件的源代码，供大家学习研究使用），你可以到这里下载相应的资源，或者直接到原网站下载。

为便于调试和叙述，所有例子均为dos控制台程序，windows程序使用方法完全一样，按照下面的步骤创建一个可调试的项目：

1、打开vs2003；

2、单击菜单“文件”→“新建”→“项目”，在项目类型中选择“visual c#项目”，在模板中选择“控制台应用程序”，输入文件名称如“makepdf”，指定好存放路径，然后点确定按钮；

3、在“解决方案资源管理器”中右键单击“引用”，从弹出的菜单中选择“添加引用”，在“.net”选项夹中选择“浏览”，添加前面提到的两个应用，如下图：

4、在代码窗口顶部添加两个引用：

using itextsharp.text;

using itextsharp.text.pdf;

至此，准备工作完毕。

第一部分 itext的简单应用第一章创建一个document
利用itext五步创建一个pdf文件：helloword。

第一步，创建一个 itextsharp.text.document对象的实例：

document document = new document();

第二步，为该document创建一个writer实例：

pdfwriter.getinstance(document, new filestream("chap0101.pdf", filemode.create));

第三步，打开当前document

document.open();

第四步，为当前document添加内容：

document.add(new paragraph("hello world"));

第五步，关闭document

document.close();

完整的代码见示例代码0101。

在例中，不难看出，制作一个pdf文件是非常简单的。

注：如果你将例中“document.add(new paragraph("hello world"));”中的字符串“hello word”换成中文，如“这是我的第一个pdf文件”，产生的结果一定让你大失所望，因为生成的pdf文件中并没有将中文显示出来，不要担心，在第9章中要专门讲解字体问题，中文显示也就迎刃而解了，如果不能正确显示中文，也就没有必要翻译本文了。

下面对这几步做详细介绍。

第一步创建一个document实例：
itextsharp.text.document-object共有三个构造函数：

public document();

public document(rectangle pagesize);

public document(rectangle pagesize,

int marginleft,

int marginright,

int margintop,

int marginbottom);

第一个构造函数以a4页面作为参数调用第二个构造函数，第二个构造函数以每边36磅页边距为参数调用第三个构造函数

u 页面尺寸：

你可以通过指定的颜色和大小创建你自己的页面，示例代码0102创建一个细长的浅黄色背景的页面：

rectangle pagesize = new rectangle(144, 720);

pagesize.backgroundcolor = new color(0xff, 0xff, 0xde);

document document = new document(pagesize);

通常，你不必创建这样的页面，而可以从下面页面尺寸中选择：

a0-a10, legal, letter, halfletter, _11x17, ledger, note, b0-b5, arch_a-arch_e, flsa 和 flse

大多数情况下使用纵向页面，如果希望使用横向页面，你只须使用rotate()函数：

document document = new document(pagesize.a4.rotate());

详细代码见示例代码0103。

u 页边距：

当创建一个文件时，你还可以定义上、下、左、右页边距：

document document = new document(pagesize.a5, 36, 72, 108, 180);

在示例代码0104中你可以看到该文档有一个0.5英寸的左边距和1英寸的右边距，上边距为1.5英寸，下边距为2.5英寸。

说明：

当创建一个矩形或设置边距时，你可能希望知道该用什么度量单位：厘米、英寸或象素，事实上，默认的度量系统以排版单位磅为基础得出其他单位的近似值，如1英寸=72磅，如果你想在a4页面的pdf中创建一个矩形，你需要计算以下数据：

21 厘米 / 2.54 = 8.2677 英寸

8.2677英寸* 72 = 595 磅

29.7 厘米 / 2.54 = 11.6929 英寸

11.6929英寸* 72 = 842 磅

默认边距为36磅即半英寸。

如果你修改了页面尺寸，仅仅影响到下一页，如果你修改了页边距，则影响到全部，故慎用。

关于页面的初始值，请参考第三步。

第二步创建writer实例
一旦创建了document，我们可以创建该文档的多个writer的实例，所有这些writer实例均继承自抽象类“itextsharp.text.docwriter”。

同时还有另外一种情况，你可以用itextsharp.text.pdf.pdfwriter产生文档pdf文件，如果你想创建一个tex文档，你可以使用itextsharp.text.tex.texwriter包。

writer类的构造函数是私有的，你只能通过下面的方法创建一个实例：

public static xxxwriter getinstance(document document, stream os);(xxx 是 pdf 或 xml)

你可以通过下面的方法创建一个实例：

pdfwriter writer = pdfwriter.getinstance(document, new filestream("chap01xx.pdf"));

但是你几乎永远不会用到writer实例（除非你想创建高级pdf或者希望用一些非常特殊的函数，如viewerpreferences 或 encryption）。所以通过下面的办法得到实例已经足够了： pdfwriter.getinstance(document, new filestream("chap01xx.pdf"));

在第一步中创建一个文档时，第一个参数意义不大，第二个参数可以是任何一种流，到目前为止我们一直使用system.io.filestream将document写入文件中，示例代码0105用到了system.io.memorystream（这不是一个独立的例子，你必须在servlet engine中测试这些代码。

第三步打开document
u 摘要

在你写入任何实际数据之前，你可能希望通过以下几种方法写入一些关于本文档的摘要：

public boolean addtitle(string title)

public boolean addsubject(string subject)

public boolean addkeywords(string keywords)

public boolean addauthor(string author)

public boolean addcreator(string creator)

public boolean addproducer()

public boolean addcreationdate()

public boolean addheader(string name, string content)

你可以选择自己的标题、主题、关键字、作者、创建程序，但以下产品信息将始终被添加：itextsharp (或者itextsharp的引用)和创建时间（实际上这两种方法是自动调用的）。

你还可以将自定义的名称添加为“报头信息”，但是这对于pdfwriter没有任何作用，如果看看实例代码0101产生的pdf文件的“文档属性”，我们可以看到仅仅有pdf创建程序和产品日期，而示例代码0106的“文档属性”框中有更多的信息。

打开document前要做的事：

你只能在open方法调用之前添加摘要，这是itext开发工具提供的一个选择。

在html中，报头信息被放在文档前面报头标识中间，调用open方法将导致报头信息写入流，因而在document被打开后无法更改这些数据。

pdf报头信息不包括摘要，看起来有类似于：

%pdf-1.2

该行显示生成的文档是一个版本为1.2的pdf格式的文件，在pdf中，摘要保存在pdfinfo对象中，当文档关闭时已经写入pdfwriter中了，因此，没有关于为什么不能修改库来满足任何时候添加或更改摘要的技术原因

u 页面初始化

open方法在不同的witer中同时会产生初始化事件，举例来说，如果你需要一个水印或者页眉页角对象出现在文档第一页的开始处，你需要在打开文档前添加这些，同样的用于设置该文档其他页水印、页眉、页角、页数和尺寸。

当调用下列方法：

public bool setpagesize(rectangle pagesize)

public bool add(watermark watermark)

public void removewatermark()

setting header property

public void resetheader()

setting footer property

public void resetfooter()

public void resetpagecount()

setting pagecount property

产生的结果只能在下一个新页中看到（当在本页调用初始化方法时），代码见示例代码0107，你必须要准备一张名为watermark.jpg的图片，如下图：

u 阅读器参数：

你可以通过下面的办法为pdf文件指定一些阅读器 (如adobe reader) 参数：

public void setviewerpreferences(int preferences)

在示例代码0108中，指定了下面一些参数：

writera.setviewerpreferences(pdfwriter.pagelayouttwocolumnleft);

writerb.setviewerpreferences(pdfwriter.hidemenubar | pdfwriter.hidetoolbar);

writerc.setviewerpreferences(pdfwriter.pagelayouttwocolumnleft | pdfwriter.pagemodefullscreen | pdfwriter.nonfullscreenpagemodeusethumbs);

正如你所看到的，参数可以使用以下一些常量：

l 文件被打开时，页面布局用到下面的其中一个：

pdfwriter.pagelayoutsinglepage �c 同时只显示一个页面
pdfwriter.pagelayoutonecolumn �c单列显示
pdfwriter.pagelayouttwocolumnleft �c双列显示,奇数页在左
pdfwriter.pagelayouttwocolumnright -双列显示,奇数页在右
l 文件打开时，页面模式用到下面其中之一：

pdfwriter.pagemodeusenone �c 既不显示大钢也不显示缩略图
pdfwriter.pagemodeuseoutlines �c 显示大纲
pdfwriter.pagemodeusethumbs �c 显示缩略图
pdfwriter.pagemodefullscreen �c 全屏模式，没有菜单、windows控件或者其他任何windows可见控件
l pdfwriter.hidetoolbar �c 当文档激活时，是否隐藏阅读程序（如adobe reader）的工具条

l pdfwriter.hidemenubar -当文档激活时，是否隐藏阅读程序的菜单.

l pdfwriter.hidewindowui -当文档激活时，是否隐藏阅读程序的界面元素，如滚动条、导航条等，而仅仅保留文档显示

l pdfwriter.fitwindow �c 是否调整文档窗口尺寸以适合显示第一页。

l pdfwriter.centerwindow �c 是否将文档窗口放到屏幕中央

l 在全屏模式下，指定如何显示界面元素（选择一个）

pdfwriter.nonfullscreenpagemodeusenone -既不显示大钢也不显示缩略图
pdfwriter.nonfullscreenpagemodeuseoutlines �c 显示大钢
pdfwriter.nonfullscreenpagemodeusethumbs �c 显示缩略图
说明:你只能在类pdfwriter中调用这些方法。

u 加密

打开文档之前还要做的一件事情就是加密（如果你希望该文档加密），要达到这个目的，你可以使用下面的方法：

public void setencryption(boolean strength, string userpassword, string ownerpassword, int permissions);

strength 是下面两个常量之一：
pdfwriter.strength40bits: 40 位
pdfwriter.strength128bits: 128位 (acrobat reader 5.0及以上版本支持)
userpassword和ownerpassword 可以为空或零长度，这种情况下， ownerpassword 将被随机的字符串代替
permissions 为下列常量之一：
pdfwriter.allowprinting
pdfwriter.allowmodifycontents
pdfwriter.allowcopy
pdfwriter.allowmodifyannotations
pdfwriter.allowfillin
pdfwriter.allowscreenreaders
pdfwriter.allowassembly
pdfwriter.allowdegradedprinting
该功能参见示例代码0109和示例代码0110。

writer.setencryption(pdfwriter.strength40bits, null, null, pdfwriter.allowcopy);

示例代码0109产生的文件能够被打开而无须密码，但用户不能打印、修改本文档。

writer.setencryption(pdfwriter.strength128bits, "userpass", "ownerpass", pdfwriter.allowcopy | pdfwriter.allowprinting);

打你试图打开示例代码0110产生的文件时，将要求输入密码（'userpass'），因为添加了allowprinting参数,你可以打印该文档而不会发生任何问题。

第四步添加内容
在解释第一步到第三步的不同示例中，你可能已经遇到了一些对象如phrase, paragraph等在接下来的几章中，所有这些问题都将得到详细解释。

有时你可能想一个writer故意忽略document产生的行为，如示例代码0111：

当我们创建了两个writer： writera 和 writerb：

pdfwriter writera = pdfwriter.getinstance(document, new filestream("chap0111a.pdf", filemode.create));

pdfwriter writerb = pdfwriter.getinstance(document, new filestream("chap0111b.pdf", filemode.create));

我们可以创建两个有细微差别的文档：

writera.pause();

document.add(new paragraph("this paragraph will only be added to chap0111b.pdf, not to chap0111a.pdf"));

writera.resume();

你可以比较文件: chap0111a.pdf和chap0111b.pdf的区别

第五步，关闭 document
关闭 document 非常重要, 因为它将关闭正在运行的writer并将内容写入文件，该方法在最后被调用，你应该总是要关闭文档。

高级话题：阅读pdf文件

该部分内容介绍了itext只能产生pdf格式的文件而不能解析pdf格式文件，不再翻译。

第二章块、短句和段落
块
块(chunk)是能被添加到文档的文本的最小单位，块可以用于构建其他基础元素如短句、段落、锚点等，块是一个有确定字体的字符串，要添加块到文档中时，其他所有布局变量均要被定义。下面一行中，我们创建了一个内容为“hello world”、红色、斜体、courier字体、尺寸20的一个块：

chunk chunk = new chunk("hello world", fontfactory.getfont(fontfactory.courier, 20, font.italic, new color(255, 0, 0)));

u 典型字体1：

在本指南中，除了第九章外（你可以在这里学会使用其他字体），我们将始终使用典型字体1，这些是不同的典型字体1：

・ courier (该字体定宽)

・ helvetica

・ times roman

・ symbol

・ zapfdingbats

u 下划线/删除线

如果你希望一些块有下划线或删除线，你可以通过改变字体风格简单做到：

chunk chunk1 = new chunk("this text is underlined", fontfactory.getfont(fontfactory.helvetica, 12, font.underline));

chunk chunk2 = new chunk("this font is of type italic | strikethru", fontfactory.getfont(fontfactory.helvetica, 12, font.italic | font.strikethru));

u 上标/下标

在块中有几个方法可以调用，其中大部分将在接下来的章节中介绍，本章中只介绍一个方法 settextrise(float f). 你可以使用该方法在上标或下标中写块。

u 块的背景

如果你想改变块的背景，你可以使用方法setbackground(color color). 这将在块文本的下面添加一个彩色矩形：

ck.setbackground(new color(0xff, 0xff, 0x00));

在示例代码0101中，你可以概览典型字体1和一个使用settextrise, setbackground等方法的的例子。

短句
短句（phrases）是一系列以特定间距（两行之间的距离）作为参数的块，一个短句有一个主字体，但短句中的一些块具有不同于主字体的字体，你有更多的选择去创建短句，一些具体使用参见代码0202。

u 古希腊语

因为古希腊语经常使用，在类phrase的构造函数中有一个特征：将一个字符串作为参数（如果你想避免这种情况，你只能使用块工作而不能使用字符串），正如你在示例代码0203中看到的，这个特征自动地将913至937（除903）和945至969（古希腊的ascii值）范围内的所有字体改为希腊符号。

u 非主要性

与其说这是一个特征，不如说是一个缺陷，但无论如何，这使创建一个非主要性的短句或段落成为可能，这将产生一个由下向上书写的临时作用（参见示例代码0204）。如果你想在一页中将一些位置移动到上面时可能有用。

说明，当你穿越上边届时无法检查，也没有办法让你回到前一页。

段落
段落是一系列块和（或）短句。同短句一样，段落有确定的间距。用户还可以指定缩排；在边和（或）右边保留一定空白，段落可以左对齐、右对齐和居中对齐。添加到文档中的每一个段落将自动另起一行。有几种办法建立一个段落，如：

paragraph p1 = new paragraph(new chunk("this is my first paragraph.", fontfactory.getfont(fontfactory.helvetica, 12)));

paragraph p2 = new paragraph(new phrase("this is my second paragraph.", fontfactory.getfont(fontfactory.helvetica, 12)));

paragraph p3 = new paragraph("this is my third paragraph.", fontfactory.getfont(fontfactory.helvetica, 12));

所有有些对象将被添加到段落中：

p1.add("you can add strings, "); p1.add(new chunk("you can add chunks ")); p1.add(new phrase("or you can add phrases."));

说明：一个段落有一个且仅有一个间距，如果你添加了一个不同字体的短句或块，原来的间距仍然有效，你可以通过setleading来改变间距，但是段落中所有内容将使用新的中的间距。见示例代码0205。

u 保持段落的整体性

在示例代码0206中，我们使用了setkeeptogether(true)方法来试图将一个段落放在同一页中，该方法并不是始终有效，举个例子，第一段不能刚好在一页中，于是被分成了两部分。第二段被放置在第二页，但第三段顺沿到了第三页上。

字体的延续
你应该掌握字体延续的一些规则，这些规则的应用见示例代码0207，当我们将一些内容用指定的字体（非默认字体）创建一个短句或者段落后再添加更多内容时，初始对象的字体风格将被延续，请看“hello 1!”和“hello 2”：

phrase myphrase = new phrase("hello 2! ", new font(font.times_new_roman, 8, font.bold));

myphrase.add(new phrase("some other font ", new font(font.helvetica, 8, font.italic)));

myphrase.add(new phrase("this is the end of the sentence.\n", new font(font.times_new_roman, 8, font.italic)));

document.add(myphrase);

我们由times new roman 粗体字开始，添加一些文本使用helvetica字体而不指定风格，我们发现文本被改变成了粗体，当我们再加一些文本使用times new roman字体和斜体风格，结果变成了粗斜体。

如果我们使用fontfactory来创建字体，字体风格不会被延续，因为fontfactory使用了另外的技术构建一个字体：

myphrase = new phrase("hello 1bis! ", fontfactory.getfont(fontfactory.times_new_roman, 8, font.bold));

myphrase.add(new phrase("some other font ", fontfactory.getfont(fontfactory.helvetica, 8, font.italic)));

myphrase.add(new phrase("this is the end of the sentence.\n", fontfactory.getfont(fontfactory.times_new_roman, 8, font.italic)));

document.add(myphrase);

在上面的代码中，使用helvetica字体的文本风字体没有指定（既不是粗体也不是斜体）。采用times new roman的额外文本仅仅显示为斜体。

你也看到我们添加了一个段落，添加该段落就如同一个短句。

paragraph myparagraph = new paragraph("hello 1! ", new font(font.times_new_roman, 8, font.bold));

myparagraph.add(new paragraph("this is the end of the sentence.",fontfactory.getfont(new font.times_new_roman, 8)));

document.add(myparagraph);

你可以不这样做，但将失去字体风格的延续，首先不用任何字体创建段落（例中我们仅仅给字体出间距为1.5倍），然后添加内容的不同部分。

myparagraph = new paragraph(12);

myparagraph.add(new paragraph("hello 3! ", new font(font.times_new_roman, 8, font.bold)));

myparagraph.add(new paragraph("this is the end of the sentence.", new font(font.times_new_roman, 8, font.italic)));

document.add(myparagraph);

如果你使用了phrase对象，你同样会失去字体风格的延续：

myphrase = new phrase(12);

myphrase.add(new phrase("hello 4! ", new font(font.times_new_roman, 8, font.bold)));

myphrase.add(new phrase("this is the end of the sentence.", newfont(font.times_new_roman, 8, font.italic)));

document.add(myphrase);

u 更改分割符

通常，当文本不能放在一行时，文本将被分割成不同的部分，itext首先会查找分割符，如果没有找到，文本将在行尾被截断。有一些预定的分割符如“ ”空格和“-”连字符，但是你可以使用setsplitcharacter方法来覆盖这些默认值。在示例代码0208中，你可以看到当到达行尾时一个块是如何被分割的。然后分隔符被改成点“.”，该行在该字符处被分割。

上一页：PDF转Word使用哪款浏览器最方便？

下一页：pdf转word识别注意-pdf格式文档能否转成WORD文档?