Docling simplifica el procesamiento de documentos, analizando diversos formatos —incluyendo comprensión avanzada de PDF— y proporcionando integraciones fluidas con el ecosistema de IA generativa.
Para usar Docling, simplemente instala docling
desde tu gestor de paquetes, ej. pip:
pip install docling
Funciona en entornos macOS, Linux y Windows. Tanto en arquitecturas x86_64 como arm64.
Más instrucciones detalladas de instalación disponibles en la documentación.
Para convertir documentos individuales con python, usa convert()
, por ejemplo:
from docling.document_converter import DocumentConverter
source = "https://arxiv.org/pdf/2408.09869" # document per local path or URL
converter = DocumentConverter()
result = converter.convert(source)
print(result.document.export_to_markdown()) # output: "## Docling Technical Report[...]"
Más opciones avanzadas de uso están disponibles en la documentación.
Docling incluye una CLI integrada para ejecutar conversiones.
docling https://arxiv.org/pdf/2206.01062
También puedes usar 🥚SmolDocling y otros VLMs mediante la CLI de Docling:
docling --pipeline vlm --vlm-model smoldocling https://arxiv.org/pdf/2206.01062
Esto utilizará aceleración MLX en hardware Apple Silicon compatible.
Lee más aquí
Consulta la documentación de Docling para detalles sobre instalación, uso, conceptos, recetas, extensiones y más.
Ponte manos a la obra con nuestros ejemplos, que muestran cómo abordar diferentes casos de uso con Docling.
Para acelerar aún más tu desarrollo de aplicaciones de IA, revisa las integraciones nativas de Docling con frameworks y herramientas populares.
No dudes en contactarnos usando la sección de discusión.
Para más detalles sobre el funcionamiento interno de Docling, consulta el Informe Técnico de Docling.
Por favor lee Contribuyendo a Docling para detalles.
Si usas Docling en tus proyectos, considera citar lo siguiente:
@techreport{Docling,
author = {Deep Search Team},
month = {8},
title = {Docling Technical Report},
url = {https://arxiv.org/abs/2408.09869},
eprint = {2408.09869},
doi = {10.48550/arXiv.2408.09869},
version = {1.0.0},
year = {2024}
}
El código base de Docling está bajo licencia MIT. Para el uso de modelos individuales, consulta las licencias de los modelos en los paquetes originales.
Docling es un proyecto alojado en la LF AI & Data Foundation.
El proyecto fue iniciado por el equipo de IA para conocimiento en IBM Research Zurich.