项目名称:墨探

项目功能:网页转Markdown

项目简介:

一款将网页文章(如博客、新闻、文档等)转换为Markdown格式的工具。可以通过命令行工具快速转换网页内容,并支持将结果保存为文件或输出至标准输出。

墨探的开发初衷,是为了解决一个问题:如何将来自互联网上各种不同网站的文章内容,精准且高效地转换成统一的Markdown格式。

众所周知,万维网上的网站设计风格迥异,其HTML结构也呈现出千差万别的特点。这种多样性给自动化内容提取和格式转换带来了巨大的困难。要实现一个能够适应各种复杂HTML结构的通用解决方案,并非易事。

从特定的网站开始适配,以点到面,逐步抽取出通用的解决方案,最后尽可能多的覆盖更多网站。

功能介绍

  • 支持大部分 html 元素转换
  • 部分页面支持katex公式转换(示例:https://quantum.country/qcvc)
  • 部分页面支持github gist(示例:https://towardsdatascience.com/hands-on-multi-agent-llm-restaurant-simulation-with-python-and-openai)
  • 支持保存成文件或输出至stdout
  • 支持突破某些网站的防爬虫策略(需安装插件)

开源项目:墨探 - 轻松将网页文章(博客、新闻、文档等)转换为 Markdown 格式

开源项目:墨探 - 轻松将网页文章(博客、新闻、文档等)转换为 Markdown 格式

开源项目:墨探 - 轻松将网页文章(博客、新闻、文档等)转换为 Markdown 格式

直达链接:https://github.com/caol64/omni-article-markdown

 

开源项目:墨探 - 轻松将网页文章(博客、新闻、文档等)转换为 Markdown 格式


扫描二维码,在手机上阅读
收藏