Doc2X 全场景文档解析器,Doc2X 提供最先进与快捷的PDF解析无损还原PDF中的文字,图像,表格,公式,排版 一键还原成Markdown, Latex, 微软Word, HTML
MinerU 是一款专为AI时代设计的文档提取和转换工具,能够智能解析多种格式的文档,包括PDF、Word、PPT等,广泛应用于机器学习、大模型语料库生产、RAG等场景。