Docling vereinfacht die Dokumentenverarbeitung, analysiert diverse Formate – inklusive erweitertem PDF-Verständnis – und bietet nahtlose Integrationen mit der Gen-AI-Ökosystem.
Um Docling zu verwenden, installieren Sie einfach docling
über Ihren Paketmanager, z.B. pip:
pip install docling
Funktioniert in macOS-, Linux- und Windows-Umgebungen. Sowohl x86_64- als auch arm64-Architekturen.
Detailliertere Installationsanleitungen finden Sie in der Dokumentation.
Um einzelne Dokumente mit Python zu konvertieren, verwenden Sie convert()
, zum Beispiel:
from docling.document_converter import DocumentConverter
source = "https://arxiv.org/pdf/2408.09869" # document per local path or URL
converter = DocumentConverter()
result = converter.convert(source)
print(result.document.export_to_markdown()) # output: "## Docling Technical Report[...]"
Weitere erweiterte Nutzungsoptionen sind in der Dokumentation verfügbar.
Docling verfügt über eine integrierte CLI zur Durchführung von Konvertierungen.
docling https://arxiv.org/pdf/2206.01062
Sie können auch 🥚SmolDocling und andere VLMs über die Docling CLI verwenden:
docling --pipeline vlm --vlm-model smoldocling https://arxiv.org/pdf/2206.01062
Dies nutzt MLX-Beschleunigung auf unterstützter Apple-Silicon-Hardware.
Mehr dazu hier
Werfen Sie einen Blick in die Dokumentation von Docling für Details zu Installation, Nutzung, Konzepten, Rezepten, Erweiterungen und mehr.
Machen Sie sich mit unseren Beispielen vertraut, die zeigen, wie Sie verschiedene Anwendungsfälle mit Docling lösen können.
Um die Entwicklung Ihrer KI-Anwendungen weiter zu beschleunigen, sehen Sie sich Doclings native Integrationen mit beliebten Frameworks und Tools an.
Zögern Sie nicht, uns über den Diskussionsbereich zu kontaktieren.
Für weitere Details zu den internen Abläufen von Docling lesen Sie den Docling Technical Report.
Bitte lesen Sie Contributing to Docling für Details.
Wenn Sie Docling in Ihren Projekten verwenden, ziehen Sie bitte folgende Zitierung in Betracht:
@techreport{Docling,
author = {Deep Search Team},
month = {8},
title = {Docling Technical Report},
url = {https://arxiv.org/abs/2408.09869},
eprint = {2408.09869},
doi = {10.48550/arXiv.2408.09869},
version = {1.0.0},
year = {2024}
}
Die Docling-Codebasis steht unter MIT-Lizenz. Für die Nutzung einzelner Modelle beachten Sie bitte die Modelllizenzen der Originalpakete.
Docling wird als Projekt in der LF AI & Data Foundation gehostet.
Das Projekt wurde vom AI for knowledge-Team bei IBM Research Zürich initiiert.