Docling simplifie le traitement de documents en analysant divers formats — y compris la compréhension avancée des PDF — et en fournissant des intégrations transparentes avec l'écosystème d'IA générative.
Pour utiliser Docling, installez simplement docling
depuis votre gestionnaire de paquets, par exemple pip :
pip install docling
Fonctionne sur macOS, Linux et Windows. Architectures x86_64 et arm64.
Des instructions d'installation détaillées sont disponibles dans la documentation.
Pour convertir des documents individuels avec Python, utilisez convert()
, par exemple :
from docling.document_converter import DocumentConverter
source = "https://arxiv.org/pdf/2408.09869" # document per local path or URL
converter = DocumentConverter()
result = converter.convert(source)
print(result.document.export_to_markdown()) # output: "## Docling Technical Report[...]"
Des options d'utilisation avancées sont disponibles dans la documentation.
Docling dispose d'une interface en ligne de commande intégrée pour effectuer des conversions.
docling https://arxiv.org/pdf/2206.01062
Vous pouvez également utiliser 🥚SmolDocling et d'autres VLMs via la CLI de Docling :
docling --pipeline vlm --vlm-model smoldocling https://arxiv.org/pdf/2206.01062
Cela utilisera l'accélération MLX sur les matériels Apple Silicon compatibles.
En savoir plus ici
Consultez la documentation de Docling pour des détails sur l'installation, l'utilisation, les concepts, les recettes, les extensions, et plus encore.
Mettez la main à la pâte avec nos exemples, qui montrent comment aborder différents cas d'utilisation avec Docling.
Pour accélérer davantage le développement de vos applications d'IA, découvrez les intégrations natives de Docling avec les frameworks et outils populaires.
N'hésitez pas à nous contacter via la section discussions.
Pour plus de détails sur le fonctionnement interne de Docling, consultez le Rapport technique de Docling.
Veuillez lire Contribuer à Docling pour plus de détails.
Si vous utilisez Docling dans vos projets, veuillez considérer citer ce qui suit :
@techreport{Docling,
author = {Deep Search Team},
month = {8},
title = {Docling Technical Report},
url = {https://arxiv.org/abs/2408.09869},
eprint = {2408.09869},
doi = {10.48550/arXiv.2408.09869},
version = {1.0.0},
year = {2024}
}
Le codebase de Docling est sous licence MIT. Pour l'utilisation des modèles individuels, veuillez vous référer aux licences des modèles trouvées dans les packages d'origine.
Docling est hébergé en tant que projet dans la Fondation LF AI & Data.
Le projet a été initié par l'équipe AI for knowledge d'IBM Research Zurich.