Clipper—HTML 到 Markdown 转换器和爬虫工具

Clipper 是一个开源的 HTML 到 Markdown 转换器和爬虫工具,允许你轻松地从网页中剪辑内容并将其转换为 Markdown 格式。它在内部使用 Mozilla 的 Readability 库和 Turndown 库来解析网页内容并将其转换为 Markdown 格式。Clipper 还提供了一个爬虫功能,用于爬取网站并剪辑所有页面。

Clipper 提供了一种快速简便的方式,用于保存网络上的内容片段,以供个人存档或笔记记录之用,类似于 Evernote Web Clipper 或 Notion Web Clipper 等浏览器扩展。然而,Clipper 完全在终端中运行,因此您无需安装任何扩展程序或注册账号。

Clipper—HTML 到 Markdown 转换器和爬虫工具插图

主要特点:

  •  轻松剪辑 Web 内容并将其转换为 Markdown。
  •  支持 URL 和文件输入。
  •  用于全面网站内容收集的爬网功能。
  • 可选输出格式:Markdown 或 JSON,包括 Markdown 和元数据。
  • 无需浏览器扩展:功能类似 Evernote Web Clipper 或 Notion Web Clipper 相,但 Clipper 完全在终端运行,不需要安装任何扩展或注册账户。

评论