印刷版转电子版

用 Adobe Reader 把 PDF 转换成文本文件

1、把印刷版扫描成 JPG 图像 -- 用 PhotoShop 转换成 PDF 图片 --

用 Adobe Reader 打开 PDF 文件 -- 文件 -- 另存为文本文件。

2、Solid Converter PDF 工具

Solid Converter PDF -- 工具栏 -- 选择PDF文档 -- 转换 -- 选择版式 -- 根据提示完成转换。

用 Office 自带组件把 PDF 转换成文本文件

1、安装Word组件。

开始-程序-控制面板-添加/删除程序,

Office -- 修改 -- Microsoft Office Document Imaging 组件 --

Microsoft Office Document Imaging Writer 本机运行安装。

2、打印稿扫描成图片,插入Word文档。

Microsoft Office/ Microsoft Office 工具/Microsoft Office Document Scanning 开始扫描。

文字扫描选择“黑白模式”,调用扫描仪驱动扫描,也要设置为“黑白模式”,分辨率为300dpi。

扫描完后将图片自动调入Office 2003 组件“Microsoft Office Document Imaging”。

工具栏[使用OCR识别文字] -- 将文本发送到Word -- 将识别出来的文字转换到 Word。

获取部分文字 -- 用鼠标框选所需文字 -- 右击 -- 将文本发送到 Word。

改变选项 OCR 语言 -- 全英文文件 -- OCR语言改为“英语”

3、Office 2003 自带的 Microsoft Office Document Imaging 工具

用 Adobe Reader 打开 PDF 文件 -- 文件 -- 打印 -- 打印机栏的名称 --

Microsoft Office Document Image Writer -- PDF文件输出为 MDI 格式的虚拟打印文件。

运行Microsoft Office Document Imaging -- 打开 MDI 文件 -- 工具 -- 将文本发送到 Word --

在输出时保持图片版式不变