如何把pdf文件转换成txt文档?
  • 发表时间:2019-12-13 15:32
现在是电子书的时代,很多朋友的电子设备只支持txt格式的文件,可是找到的一些不错的书籍却是pdf的格式。怎么把pdf格式转成txt格式呢?近来,总有朋友问我这个问题。 这里把我的方法写下来,分享给朋友们,希望能帮到大家。更希望起到抛砖引玉的作用,有更好的方法被分享出来。
工欲善其事,必先利其器,所以,需要先安装pdf文档的专用软件,推荐使用Adobe Acrobat 7 Professional或者Adobe Acrobat 9 Professional版本。不要使用Adobe Acrobat reader,因为功能太少。软件网上一搜,可以随便找到。

如果是由word文件转成的pdf文件,这个比较简单。

打开pdf文档,选择文件——另存为

在弹出的另存为对话框中,保存类型——纯文本。

如果没法直接保存成纯文本,报ASCII码错误的话,可以先保存为microsoft word文档,再由word文档转换成txt格式。


如果pdf文档是由扫描后的图片制作而成的,用上述方法就无法直接转换成txt格式了。需要用以下方法。

打开pdf文档,选择文件——另存为——保存类型选择jpeg图片格式。如下图:

存为jpeg格式的图片之后,需要安装OCR识别软件。推荐使用清华紫光OCR或者汉王OCR软件。软件网上都可以免费下到。我使用的是汉王OCR 8.0 。

安装好软件之后,运行OCR软件。选择文件——打开图像,如下图:

找到图片保存目录,打开从pdf文件转换成的图片。

图片文件打开以后,选择识别——开始识别:

上半部分是识别出来的文字,下半部分是原稿。因为识别软件以及图片清晰度的原因,有些字会与原稿有误,需要校对。校对过程中,如果原稿字太小,看不清楚,可以选择放大原稿操作。如下图:

校对完成,选择输出——到指定格式文件,保存成txt格式就可以了。如下图:

至此,很轻松的,txt格式的文档就转换好了。

最后说一句,校对很重要,因为需要与原稿对比着认真的看一遍。仔细才能做到无误。所以这个过程很花时间的。希望大家从网上分享到别人上传的txt格式的电子书,在享受阅读的快乐与愉悦的同时,请怀着感恩的心,感谢发帖者。因为这也是别人的劳动结晶。