Last translated: 16 Jun 2025

Translation Not Available Yet

This repository's README hasn't been translated yet. Once translated, it will be easier to read and understand in your native language (中文).

After translating, add the links to README so others can view it directly.

Docling

Docling 文档处理工具

DS4SD%2Fdocling | Trendshift

arXiv 文档 PyPI版本 PyPI - Python版本 uv Ruff Pydantic v2 pre-commit MIT许可证 PyPI下载量 Docling Actor OpenSSF最佳实践 LF AI & Data

Docling 简化了文档处理流程,支持解析多种格式(包括高级 PDF 理解功能),并提供与生成式 AI 生态系统的无缝集成。

功能特性

  • 🗂️ 支持解析多种文档格式,包括 PDF、DOCX、XLSX、HTML、图像等
  • 📑 高级 PDF 理解功能,包括页面布局、阅读顺序、表格结构、代码、公式、图像分类等
  • 🧬 统一且富有表现力的 DoclingDocument 表示格式
  • ↪️ 多种导出格式和选项,包括 Markdown、HTML 和无损 JSON
  • 🔒 支持本地执行,适用于敏感数据和隔离环境
  • 🤖 即插即用的集成方案,包括 LangChain、LlamaIndex、Crew AI 和 Haystack 等智能体 AI 框架
  • 🔍 全面的 OCR 支持,可处理扫描版 PDF 和图像
  • 🥚 支持多种视觉语言模型(SmolDocling
  • 💻 简单便捷的命令行界面

即将推出

  • 📝 元数据提取功能,包括标题、作者、参考文献和语言识别
  • 📝 图表理解(柱状图、饼图、折线图等)
  • 📝 复杂化学结构理解(分子结构)

安装指南

通过包管理器(如 pip)安装 docling 即可使用:

pip install docling

支持 macOS、Linux 和 Windows 系统,兼容 x86_64 和 arm64 架构。

更多详细安装说明请参阅文档。

快速开始

使用 Python 转换单个文档时,可调用 convert() 方法,例如:

from docling.document_converter import DocumentConverter

source = "https://arxiv.org/pdf/2408.09869"  # document per local path or URL
converter = DocumentConverter()
result = converter.convert(source)
print(result.document.export_to_markdown())  # output: "## Docling Technical Report[...]"

文档中提供了更多高级用法选项

命令行工具

Docling 内置了命令行工具用于执行转换操作。

docling https://arxiv.org/pdf/2206.01062

您还可以通过 Docling CLI 使用 🥚SmolDocling 等视觉语言模型:

docling --pipeline vlm --vlm-model smoldocling https://arxiv.org/pdf/2206.01062

在支持的 Apple Silicon 硬件上会自动启用 MLX 加速。

详见使用说明

文档资料

查阅 Docling 的完整文档,了解安装指南、使用方法、核心概念、应用示例、扩展功能等详细信息。

应用示例

通过我们的实例教程亲身体验,了解如何使用 Docling 解决不同场景的应用需求。

集成方案

为加速 AI 应用开发,可查看 Docling 与主流框架和工具的原生集成方案

获取支持

欢迎通过讨论区与我们联系。

技术报告

了解 Docling 的内部工作原理,请参阅技术报告

贡献指南

参与贡献前请阅读贡献指南

引用参考

如果在项目中使用 Docling,请考虑引用以下文献:

@techreport{Docling,
  author = {Deep Search Team},
  month = {8},
  title = {Docling Technical Report},
  url = {https://arxiv.org/abs/2408.09869},
  eprint = {2408.09869},
  doi = {10.48550/arXiv.2408.09869},
  version = {1.0.0},
  year = {2024}
}

许可协议

Docling 代码库采用 MIT 许可证。 各模型的使用许可请参考原始软件包中的声明。

LF AI & Data 基金会

Docling 是 LF AI & Data 基金会的托管项目。

IBM ❤️ 开源 AI

本项目由 IBM 苏黎世研究院的知识智能团队发起。