切换到宽版
  • 3660阅读
  • 11回复

[求助]【求助】怎么样从PDF文档中提取文字(10楼参考答案) [复制链接]

上一主题 下一主题
离线56817
 

发帖
1218
啄木币
464
鲜花
343
只看楼主 倒序阅读 使用道具 0楼 发表于: 2009-05-30
记得以前可以从PDF中直接选择文字的复制粘贴的,现在也不知道怎么的就不行了,哪位高手帮下忙,谢谢了
[ 此帖被56817在2009-05-31 08:34重新编辑 ]
评价一下你浏览此帖子的感受

精彩

感动

搞笑

开心

愤怒

无聊

灌水
离线上帝右手

发帖
5014
啄木币
24160
鲜花
841
只看该作者 1楼 发表于: 2009-05-30
加水印了?防复制了??可能是你的pdf资料本身的原因
离线上帝右手

发帖
5014
啄木币
24160
鲜花
841
只看该作者 2楼 发表于: 2009-05-30
加水印了?防复制了??可能是你的pdf资料本身的原因
离线哥特复兴
发帖
2730
啄木币
3
鲜花
180
只看该作者 3楼 发表于: 2009-05-30

点一下那个手的旁边那个    选中文本
离线小鹏8号

发帖
10284
啄木币
1
鲜花
2694
只看该作者 4楼 发表于: 2009-05-30
可能是扫描的吧啊?
如果是WORD转的或者制作的应该可以复制的
离线raphael
发帖
963
啄木币
5894
鲜花
58
只看该作者 5楼 发表于: 2009-05-30
你用的什么PDF阅读器?Adobe reader吗?
发帖
3364
啄木币
1396
鲜花
222
只看该作者 6楼 发表于: 2009-05-30
有的pdf文档是扫描的,不是word转的

用个ocr软件试试吧

ocr软件有紫光的汉王的什么的,去百度一下就能找到了
1条评分
blueblood 鲜花 +1 - 2009-05-31
离线ca001
发帖
283
啄木币
1636
鲜花
81
只看该作者 7楼 发表于: 2009-05-30
估计你的PDF文件是扫描的图片格式
离线欣宇

发帖
5723
啄木币
228557
鲜花
1684
只看该作者 8楼 发表于: 2009-05-30
是扫描图片格式的吧
用汉王 PDF OCR,可以直接识别PDF图像,比其他OCR要方便的多。但具体识别率要看图片扫描清晰度与否了。
http://search.gougou.com/search?search=%E6%B1%89%E7%8E%8B+PDF+OCR
1条评分
blueblood 鲜花 +1 - 2009-05-31
一路向前
离线jumankai
发帖
108
啄木币
203
鲜花
31
只看该作者 9楼 发表于: 2009-05-30
如果要是因为加密导致无法复制的的话可以上网找一个pdf解密的工具,有很多,比如 http://www.52z.com/soft/PDF_Decrypter.Html
2条评分
blueblood 鲜花 +1 - 2009-05-31
︶ㄣ.流年.﹎ 鲜花 +1 辛苦。 2009-05-30
离线56817

发帖
1218
啄木币
464
鲜花
343
只看该作者 10楼 发表于: 2009-05-31
谢谢大家了,我用的下面的方法,已经可以提取出来了
第一步:首先使用Adobe Reader打开待转换的PDF文件,接下来选择“文件→打印”菜单,在打开的“打印”设置窗口中将“打印机”栏中的“名称”设置为“Microsoft Office Document Image Writer”,确认后将该PDF文件输出为MDI格式的虚拟打印文件。

  第二步:运行Microsoft Office Document Imaging,并利用它来打开刚才保存的MDI文件,选择“工具→将文本发送到Word”菜单,并在弹出的窗口中勾选“在输出时保持图片版式不变”,确认后系统提示“必须在执行此操作前重新运行OCR。这可能需要一些时间”,不管它,确认即可。
1条评分
blueblood 鲜花 +1 - 2009-05-31
离线bear1991
发帖
1185
啄木币
375
鲜花
250
只看该作者 11楼 发表于: 2009-06-05
好贴留名,以备将来查询使用
快速回复
限100 字节
 
上一个 下一个