O Docling simplifica o processamento de documentos, analisando diversos formatos — incluindo compreensão avançada de PDF — e oferecendo integrações perfeitas com o ecossistema de IA generativa.
Para usar o Docling, basta instalar docling
através do seu gerenciador de pacotes, por exemplo pip:
pip install docling
Funciona em ambientes macOS, Linux e Windows. Tanto em arquiteturas x86_64 quanto arm64.
Instruções de instalação mais detalhadas estão disponíveis na documentação.
Para converter documentos individuais com Python, use convert()
, por exemplo:
from docling.document_converter import DocumentConverter
source = "https://arxiv.org/pdf/2408.09869" # document per local path or URL
converter = DocumentConverter()
result = converter.convert(source)
print(result.document.export_to_markdown()) # output: "## Docling Technical Report[...]"
Mais opções avançadas de uso estão disponíveis na documentação.
O Docling possui uma CLI integrada para executar conversões.
docling https://arxiv.org/pdf/2206.01062
Você também pode usar 🥚SmolDocling e outros VLMs via CLI do Docling:
docling --pipeline vlm --vlm-model smoldocling https://arxiv.org/pdf/2206.01062
Isso utilizará aceleração MLX em hardware Apple Silicon compatível.
Leia mais aqui
Consulte a documentação do Docling para detalhes sobre instalação, uso, conceitos, receitas, extensões e mais.
Ponha a mão na massa com nossos exemplos, demonstrando como abordar diferentes casos de uso de aplicações com o Docling.
Para acelerar ainda mais o desenvolvimento de suas aplicações de IA, confira as integrações nativas do Docling com frameworks e ferramentas populares.
Sinta-se à vontade para entrar em contato conosco usando a seção de discussões.
Para mais detalhes sobre o funcionamento interno do Docling, consulte o Relatório Técnico do Docling.
Por favor, leia Contribuindo para o Docling para detalhes.
Se você usar o Docling em seus projetos, por favor considere citar o seguinte:
@techreport{Docling,
author = {Deep Search Team},
month = {8},
title = {Docling Technical Report},
url = {https://arxiv.org/abs/2408.09869},
eprint = {2408.09869},
doi = {10.48550/arXiv.2408.09869},
version = {1.0.0},
year = {2024}
}
O código do Docling está sob licença MIT. Para uso de modelos individuais, consulte as licenças dos modelos encontradas nos pacotes originais.
O Docling está hospedado como um projeto na LF AI & Data Foundation.
O projeto foi iniciado pela equipe de IA para conhecimento da IBM Research Zurich.