微软Edge浏览器引入“OCR for PDF”新功能

微软Edge浏览器不断推出新功能，以提升用户体验和效率。最近，一个名为“OCR for PDF”的新实验性功能被发现正在内部测试中。这一功能将极大地改善用户处理扫描PDF文件的能力，使得从图像或扫描文档中提取文本变得更加容易。

OCR（光学字符识别）是一种技术，可以从图像或扫描的文档中识别并提取文本。当前，当用户在Edge浏览器中打开扫描的PDF文件时，由于这些文件中的文本是以图像形式存在的，因此无法直接选择、复制或搜索文本。这给需要从扫描文档中提取信息的用户带来了不便。

通过引入“OCR for PDF”功能，Edge浏览器将能够使用Windows内置的OCR引擎自动识别和提取扫描PDF中的文本。这意味着用户将能够像处理普通文本文件一样操作扫描的PDF，包括选择、复制和搜索文本。

Edge浏览器将集成Windows 11的内置OCR引擎，该引擎作为通用Windows平台（UWP）的一部分，在Windows 10中首次引入。这个OCR引擎不仅支持文本提取，还能识别文本布局信息，确保提取的文本格式尽可能接近原始文档。

Windows 11的OCR引擎具有以下优势：

目前，“OCR for PDF”功能仍处于实验阶段，尚未对所有用户开放。要尝试该功能，用户可以按照以下步骤操作：

通过引入OCR for PDF功能，Edge浏览器将显著提升扫描PDF文件的可用性和可访问性。用户将能够更轻松地从扫描文档中提取和使用文本，减少对外部工具的依赖。此外，这一功能还将提高文档的可读性和可编辑性，特别是在教育、法律和企业环境中，扫描文档的处理将变得更加高效。

除了OCR for PDF功能，微软还在努力提升Edge浏览器的整体性能。根据Windows Latest的报道，Edge的多个界面元素，如下载菜单、扩展菜单、历史记录选项卡、三点菜单，甚至“询问Copilot”或右键菜单，都将得到显著优化，响应速度更快，用户体验更加流畅。

虽然目前还不清楚“OCR for PDF”功能何时会正式上线，但这一功能的引入无疑将为Edge浏览器带来重要的改进，特别是在处理不可搜索的PDF文件方面。随着微软不断优化Edge浏览器的功能和性能，用户可以期待一个更加智能、高效且易于使用的浏览器体验。