关于pdf文件转换成html问题,如何将pdf转成html?
  • 发表时间:2020-02-06 11:00
项目所用语言为php,项目场景中遇到需要将上传的pdf转换为html功能,之前我想法是用pdf转换word,然后word转html,结果失败了,主要原因卡在pdf转word这一环节,求高手指点以下,如何将pdf转成html,给个demo或者思路都可以。(建议我下载什么免费pdf转换插件就不必了,我是要在项目里面实现这一功能),谢谢。

html是网页的通用格式,但pdfTools转换HTM文件后,所形成的HTM文件并不包含有pdf文档中的文字,而是将pdf文档的内容转换成JPG图像文件,然后再用html语言将图片嵌入到网页中。生成的HTM文件是一个框架网页,即左边是各页面的链接窗口,右边的内容就是JPG图片了。如果你用的是IE6的话,当鼠标移到右边窗口后,就会浮出一排快捷工具栏。

首先选择菜单“工具→pdf转HTM”,使其转为HTM模式。接着打开文件有多种操作方式:通过菜单“文件→打开”直接按“Ctrl+F”键后调出打开对话框选择文件,或者直接把待转换的pdf文档拖到pdfTools主界面中,软件马上开始转换。转换后的文件是保存在源文件中,而且还有相应名称的子文件夹,里面就是一些jpg图片和其它资源。最后弹出一个提示窗口,点击“确定”即可。