PDF转Word后还是编辑不了是为什么?
  • 发表时间:2019-07-28 16:09
我们在把pdf转换为word时,应该都碰到过这种情况吧:转出来的word文档里无法编辑,所有的文字都像是在一个方框里。可是有时候,有些pdf转出来的word又可以编辑。很多人应该都很困惑,还以为是自己用的pdf软件工具不行。其实事实并非如此~
大多数人的印象里,pdf的前身就是word文档。事实并不仅限于此,众多pdf中也存在许多的扫描件,扫描件多是通过扫描机器扫描纸张材料得到的pdf文件,或者是很多人通过手机app以拍照扫描形式生成的pdf。看到这里我想很多人就已经明白了:有些pdf的源文件其实只是图片。即使图片上有再多的文字,转成word后它仍旧是一张图片。
这时候就需要一个提取pdf文字的工具---ocr。
ocr定义:通俗一点来说,就是采用光学将纸质材料中的文字识别为黑白点阵的吻戏图像。ocr软件工具则是直接提取电子版图片和文档内容。
ocr做到了图片形式的pdf转换为word后无法编辑的事。ocr本质来说就是提取出了图片中的文字, 而word只能做到pdf的表面转换,所以大多数的扫描件都无法编辑。