PDF OCR 文字识别

使用 OCR 技术在浏览器中识别并提取扫描版 PDF 中的文字，无需上传文件。

拖拽文件到此处或点击上传

Max 100 MB

使用基于 Tesseract.js 的光学字符识别技术识别扫描 PDF 文档中的文字。选择文档语言后，可导出提取的文字或生成带有不可见文字层的可搜索 PDF。

最后审核: 2026 年 6 月

如何使用此工具

此工具在你的浏览器中运行。使用工具时，文件不会上传到我们的服务器。

支持哪些语言？

支持 100 多种语言，包括中文（简体和繁体）、英文、日文、西班牙文、法文、德文和韩文。处理前从下拉列表中选择。

为什么第一次运行较慢？

首次使用时需要下载语言识别数据（4-50MB，取决于语言）。之后浏览器会缓存数据，后续运行更快。

如何提高 OCR 识别准确率？

使用高分辨率扫描件（300 DPI 或更高），确保文档没有倾斜，并选择正确的语言。

什么是「可搜索 PDF」？

可搜索 PDF 在原始扫描图像上方包含一个不可见的文字层。您可以使用 Ctrl+F 查找文字，同时视觉外观保持不变。

我的扫描文档会上传吗？

不会。OCR 处理完全在浏览器中使用 WebAssembly 运行，文档不会离开您的设备。

在线编辑 PDF 元数据

在浏览器中查看和编辑 PDF 文档的标题、作者、关键词等属性信息。

Markdown 转 PDF 在线免费

将 Markdown 转换为精美排版的 PDF，多种主题可选，无需上传。

PDF 加密

为 PDF 设置或移除密码保护