Last translated: 16 Jun 2025

Translation Not Available Yet

This repository's README hasn't been translated yet. Once translated, it will be easier to read and understand in your native language (中文).

After translating, add the links to README so others can view it directly.

Docling

Docling

DS4SD%2Fdocling | Trendshift

arXiv Docs PyPI version PyPI - Python Version uv Ruff Pydantic v2 pre-commit License MIT PyPI Downloads Docling Actor OpenSSF Best Practices LF AI & Data

Docling simplifica el procesamiento de documentos, analizando diversos formatos —incluyendo comprensión avanzada de PDF— y proporcionando integraciones fluidas con el ecosistema de IA generativa.

Características

  • 🗂️ Análisis de múltiples formatos de documentos incl. PDF, DOCX, XLSX, HTML, imágenes y más
  • 📑 Comprensión avanzada de PDF incl. diseño de página, orden de lectura, estructura de tablas, código, fórmulas, clasificación de imágenes y más
  • 🧬 Formato unificado y expresivo DoclingDocument
  • ↪️ Varios formatos de exportación y opciones, incluyendo Markdown, HTML y JSON sin pérdida
  • 🔒 Capacidades de ejecución local para datos sensibles y entornos aislados
  • 🤖 Integraciones plug-and-play integraciones incl. LangChain, LlamaIndex, Crew AI & Haystack para IA agentiva
  • 🔍 Soporte extensivo de OCR para PDF escaneados e imágenes
  • 🥚 Soporte de varios Modelos de Lenguaje Visual (SmolDocling)
  • 💻 CLI simple y conveniente

Próximamente

  • 📝 Extracción de metadatos, incluyendo título, autores, referencias e idioma
  • 📝 Comprensión de gráficos (Barras, Tarta, Líneas, etc)
  • 📝 Comprensión avanzada de química (Estructuras moleculares)

Instalación

Para usar Docling, simplemente instala docling desde tu gestor de paquetes, ej. pip:

pip install docling

Funciona en entornos macOS, Linux y Windows. Tanto en arquitecturas x86_64 como arm64.

Más instrucciones detalladas de instalación disponibles en la documentación.

Primeros pasos

Para convertir documentos individuales con python, usa convert(), por ejemplo:

from docling.document_converter import DocumentConverter

source = "https://arxiv.org/pdf/2408.09869"  # document per local path or URL
converter = DocumentConverter()
result = converter.convert(source)
print(result.document.export_to_markdown())  # output: "## Docling Technical Report[...]"

Más opciones avanzadas de uso están disponibles en la documentación.

CLI

Docling incluye una CLI integrada para ejecutar conversiones.

docling https://arxiv.org/pdf/2206.01062

También puedes usar 🥚SmolDocling y otros VLMs mediante la CLI de Docling:

docling --pipeline vlm --vlm-model smoldocling https://arxiv.org/pdf/2206.01062

Esto utilizará aceleración MLX en hardware Apple Silicon compatible.

Lee más aquí

Documentación

Consulta la documentación de Docling para detalles sobre instalación, uso, conceptos, recetas, extensiones y más.

Ejemplos

Ponte manos a la obra con nuestros ejemplos, que muestran cómo abordar diferentes casos de uso con Docling.

Integraciones

Para acelerar aún más tu desarrollo de aplicaciones de IA, revisa las integraciones nativas de Docling con frameworks y herramientas populares.

Obtén ayuda y soporte

No dudes en contactarnos usando la sección de discusión.

Informe técnico

Para más detalles sobre el funcionamiento interno de Docling, consulta el Informe Técnico de Docling.

Contribuciones

Por favor lee Contribuyendo a Docling para detalles.

Referencias

Si usas Docling en tus proyectos, considera citar lo siguiente:

@techreport{Docling,
  author = {Deep Search Team},
  month = {8},
  title = {Docling Technical Report},
  url = {https://arxiv.org/abs/2408.09869},
  eprint = {2408.09869},
  doi = {10.48550/arXiv.2408.09869},
  version = {1.0.0},
  year = {2024}
}

Licencia

El código base de Docling está bajo licencia MIT. Para el uso de modelos individuales, consulta las licencias de los modelos en los paquetes originales.

LF AI & Data

Docling es un proyecto alojado en la LF AI & Data Foundation.

IBM ❤️ Open Source AI

El proyecto fue iniciado por el equipo de IA para conocimiento en IBM Research Zurich.