以下是将 PDF 转换为 Word 以及翻译 PDF 的一些方法:
另外,从计算机的角度看,文档分为有标记文档(如 Microsoft Word 和 HTML 文档,包含特殊标记用来将文本组织成段落、单元格和表格)和无标记文档(如 PDF 文档,存储了每个文档页面上字符、线条和其他内容元素放置位置的指令,但没有存储文档的任何结构信息,如表格或段落,因此机器难以读取)。当尝试将 PDF 表格复制到 Word 中时,原表格的结构通常会完全丢失。
有许多翻译PDF的方法,以下是几种适用方法:1.DeepL(网站)[www.deepl.com](https://www.deepl.com/translator):点击页面「翻译文件」按钮,上传PDF、Word或PowerPoint文件即可。2.沉浸式翻译(浏览器插件)[immersivetranslate.com](https://immersivetranslate.com/):安装插件后,点击插件底部「更多」按钮,选择「制作双语BPUB电子书」、「翻译本地PDF文件」、「翻译THML / TXT文件」、「翻译本地字幕文件」。3.Calibre(电子书管理应用)[calibre-ebook.com](https://calibre-ebook.com/zh_CN):下载并安装calibre,并安装翻译插件「Ebook Translator」。4.谷歌翻译(网页)[translate.google.com](https://translate.google.com/):使用工具把PDF转成Word,再点击谷歌翻译「Document」按钮,上传Word文档。5.百度翻译(网页)[fanyi.baidu.com](https://fanyi.baidu.com/):点击导航栏「文件翻译」,上传PDF、Word、Excel、PPT、TXT等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。
我们推荐这8种翻译方法:1、DeepL(网站)[www.deepl.com](https://www.deepl.com/translator)点击页面「翻译文件」按钮,上传PDF、Word或PowerPoint文件即可2、沉浸式翻译(浏览器插件)[immersivetranslate.com](https://immersivetranslate.com/)安装插件后,点击插件底部「更多」按钮,选择「制作双语BPUB电子书」、「翻译本地PDF文件」、「翻译THML / TXT文件」、「翻译本地字幕文件」 3、calibre(电子书管理应用)[calibre-ebook.com](https://calibre-ebook.com/zh_CN)下载并安装calibre,并安装翻译插件「Ebook Translator」 4、谷歌翻译(网页)[translate.google.com](https://translate.google.com/)使用工具把PDF转成Word,再点击谷歌翻译「Document」按钮,上传Word文档5、百度翻译(网页)[fanyi.baidu.com](https://fanyi.baidu.com/)点击导航栏「文件翻译」,上传PDF、Word、Excel、PPT、TXT等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)6、彩云小译(App)下载后点击「文档翻译」,可以直接导入PDF、PDF、Word、Excel、PPT、TXT、epub、srt等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)7、微信读书(App)下载App后将PDF文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮8、浏览器自带的翻译功能如果一些PDF太大,翻译工具不支持,除了将PDF压缩或者切分外,还可以转成HTML格式,然后使用浏览器自带的网页翻译功能
对于人类来说,浏览任何文档页面的认知过程都是相似的。当我们阅读一个页面时,我们的视网膜会捕捉到字符。接着在我们的大脑中,这些字符被组织成段落、表格和图表,然后被理解或记忆。但计算机是以二进制码感知信息,所从计算机的角度看,文档可以分为两类,如图3所示:图3计算机视角下的两种类型的文档有标记文档(Tagged Documents):例如Microsoft Word和HTML文档,它们包含像<p>和<table>这样的特殊标记,用来将文本组织成段落、单元格和表格。无标记文档(Untagged Documents):例如PDF文档,它存储了每个文档页面上字符、线条和其他内容元素放置位置的指令。PDF文档以人类可读的方式“绘制”这些基本内容元素,但它并没有存储文档的任何结构信息,如表格或段落。因此,无标记文档仅供人类阅读,但机器无法读取。当尝试将PDF表格复制到Word中时,这一点会很明显,因为在Word中原表格的结构通常会完全丢失。