微软Edge浏览器不断推出新功能,以提升用户体验和效率。最近,一个名为“OCR for PDF”的新实验性功能被发现正在内部测试中。这一功能将极大地改善用户处理扫描PDF文件的能力,使得从图像或扫描文档中提取文本变得更加容易。
什么是 OCR for PDF?
OCR(光学字符识别)是一种技术,可以从图像或扫描的文档中识别并提取文本。当前,当用户在Edge浏览器中打开扫描的PDF文件时,由于这些文件中的文本是以图像形式存在的,因此无法直接选择、复制或搜索文本。这给需要从扫描文档中提取信息的用户带来了不便。
通过引入“OCR for PDF”功能,Edge浏览器将能够使用Windows内置的OCR引擎自动识别和提取扫描PDF中的文本。这意味着用户将能够像处理普通文本文件一样操作扫描的PDF,包括选择、复制和搜索文本。
Windows 11 的 OCR 引擎
Edge浏览器将集成Windows 11的内置OCR引擎,该引擎作为通用Windows平台(UWP)的一部分,在Windows 10中首次引入。这个OCR引擎不仅支持文本提取,还能识别文本布局信息,确保提取的文本格式尽可能接近原始文档。
Windows 11的OCR引擎具有以下优势:
- 智能识别:能够准确识别各种类型的图像中的文本,包括扫描文档和普通照片。
- 本地运行:OCR处理是原生运行的,不会将用户的文档发送到微软服务器,确保数据隐私和安全。
- 无需互联网:用户可以在离线状态下使用OCR功能,不受网络连接限制。
- 多语言支持:支持多达25种语言,满足全球用户的需求。
如何启用 OCR for PDF 功能
目前,“OCR for PDF”功能仍处于实验阶段,尚未对所有用户开放。要尝试该功能,用户可以按照以下步骤操作:
- 打开Edge浏览器,访问
edge://flags
页面。 - 在搜索栏中输入
msPdfWindowsOcrCoverage
。 - 找到该标志并将其设置为“启用”。
- 重启浏览器以应用更改。
提升 PDF 文件的可用性和可访问性
通过引入OCR for PDF功能,Edge浏览器将显著提升扫描PDF文件的可用性和可访问性。用户将能够更轻松地从扫描文档中提取和使用文本,减少对外部工具的依赖。此外,这一功能还将提高文档的可读性和可编辑性,特别是在教育、法律和企业环境中,扫描文档的处理将变得更加高效。
其他性能改进
除了OCR for PDF功能,微软还在努力提升Edge浏览器的整体性能。根据Windows Latest的报道,Edge的多个界面元素,如下载菜单、扩展菜单、历史记录选项卡、三点菜单,甚至“询问Copilot”或右键菜单,都将得到显著优化,响应速度更快,用户体验更加流畅。
未来展望
虽然目前还不清楚“OCR for PDF”功能何时会正式上线,但这一功能的引入无疑将为Edge浏览器带来重要的改进,特别是在处理不可搜索的PDF文件方面。随着微软不断优化Edge浏览器的功能和性能,用户可以期待一个更加智能、高效且易于使用的浏览器体验。
评论