Contato 📫
O principal colaborador deste repositório é um estudante de mestrado que se formará em 2026, sinta-se à vontade para entrar em contato para colaborações ou oportunidades.>
本仓库的主要贡献者是一名 2026 届硕士毕业生,欢迎联系合作或交流机会。
Novidades 📅
- [2026/03]: Agora suportamos CLI e lançamos nossos modelos ajustados no Hugging Face 🤗!
- [2026/01]: Suportamos geração livre e por template com exportação para PPTX, modo offline agora disponível! Gerenciamento de contexto adicionado para evitar estouro de contexto.
- [2025/12]: 🔥 Versão V2 lançada com grandes melhorias - Integração Profunda de Pesquisa, Design Visual Livre, Criação Autônoma de Ativos, Geração de Texto para Imagem, e Ambiente de Agente com sandbox & mais de 20 ferramentas.
- [2025/09]: 🛠️ Suporte ao servidor MCP adicionado - veja Servidor MCP para detalhes de configuração
- [2025/09]: 🚀 Lançada a v2 com grandes melhorias - veja notas de lançamento para detalhes
- [2025/08]: 🎉 Artigo aceito na EMNLP 2025!
- [2025/05]: ✨ Lançamento da v1 com funcionalidade principal e 🌟 marco: alcançamos 1.000 estrelas no GitHub! - veja notas de lançamento para detalhes
- [2025/01]: 🔓 Código-fonte aberto, com código experimental arquivado em lançamento experimental
Uso 📖
[!IMPORTANTE]
Windows não é suportado. Se você estiver no Windows, use o WSL.>
Recomendamos fortemente começar pelo CLI e pela tarefa mínima para confirmar se as dependências e o ambiente estão configurados corretamente.
Configuração
Se você usar o CLI, pptagent onboard pode ajudar a criar e atualizar essas configurações interativamente. Se usar Docker Compose ou construir a partir do código-fonte, prepare-as manualmente:
cp deeppresenter/config.yaml.example deeppresenter/config.yaml
cp deeppresenter/mcp.json.example deeppresenter/mcp.json#### Serviços Opcionais Que Melhoram a Qualidade
Os seguintes serviços podem melhorar visivelmente a qualidade da geração, especialmente para profundidade de pesquisa, análise de PDF e criação de ativos visuais:
- Tavily: melhora a qualidade da pesquisa na web. Solicite uma chave de API em tavily.com, depois defina
TAVILY_API_KEYemdeeppresenter/mcp.json. - MinerU: melhora a qualidade da análise de PDF. Você pode solicitar uma chave de API em mineru.net e definir
MINERU_API_KEYemdeeppresenter/mcp.json, ou implantar o MinerU localmente e definirMINERU_API_URLem vez disso. - Modelo de texto para imagem: melhora a qualidade da geração de imagens. Configure
t2i_modelemdeeppresenter/config.yaml.
offline_mode: true em deeppresenter/config.yaml para evitar o uso de ferramentas dependentes de rede, como pesquisa na web.Mais variáveis configuráveis podem ser encontradas em constants.py.
1. Uso Pessoal / Integração com OpenClaw: CLI
[!NOTA]
No macOS, o CLI pode instalar automaticamente várias dependências locais, incluindo Homebrew, Node.js, Docker, poppler, Playwright e llama.cpp.>
No Linux, você deve preparar o ambiente manualmente.
Use este modo se deseja a configuração local mais rápida ou se quiser conectar o DeepPresenter ao OpenClaw via CLI.
# Install uv
curl -LsSf https://astral.sh/uv/install.sh | shFirst-time interactive setup
uvx pptagent onboardGenerate a presentation
uvx pptagent generate "Single Page with Title: Hello World" -o hello.pptxGenerate with attachments
uvx pptagent generate "Q4 Report" \
-f data.xlsx \
-f charts.pdf \
-p "10-12" \
-o report.pptx| Comando | Descrição |
| ------------------- | ------------------------------------------------- |
| pptagent onboard | Assistente de configuração interativo |
| pptagent generate | Gerar apresentações |
| pptagent config | Visualizar a configuração atual |
| pptagent reset | Redefinir configuração |
| pptagent serve | Iniciar o serviço local de inferência usado pelo CLI |
2. Configuração Mínima / Desenvolvimento: Compilar a partir do código-fonte
Use este modo se deseja a menor camada de abstração e controle total sobre as dependências durante o desenvolvimento.
uv pip install -e .
playwright install-deps
playwright install chromium
npm install --prefix deeppresenter/html2pptx
modelscope download forceless/fasttext-language-iddocker pull forceless/deeppresenter-sandbox
docker pull forceless/deeppresenter-host
docker tag forceless/deeppresenter-sandbox deeppresenter-sandbox
or build from dockerfile
docker build -t deeppresenter-sandbox -f deeppresenter/docker/SandBox.Dockerfile .Inicie o aplicativo:
python webui.py3. Implantação do Servidor: Docker Compose
Use este modo para um ambiente de servidor estável com dependências explícitas.
# Pull the public images to avoid build from source
docker pull forceless/deeppresenter-sandbox
docker tag forceless/deeppresenter-sandbox deeppresenter-sandboxOr build from source
docker build -t deeppresenter-sandbox -f deeppresenter/docker/SandBox.Dockerfile .Start the host service
docker compose up -dThe service exposes the web UI on http://localhost:7861.
Case Study 💡
- #### Prompt: Please present the given document to me.










- #### Prompt: 请介绍小米 SU7 的外观和价格






- #### Prompt: 请制作一份高中课堂展示课件,主题为“解码立法过程:理解其对国际关系的影响”














Contribuidores 🌟
|
Force1ess |
Puelloc |
hongyan |
Dnoob |
|
|
KurisuMakiseSame |
Angelen |
BrandonHu |
Eliot White |
EvolvedGhost |
|
ISCAS-zwl |
James Brown |
JunZhang |
Open AI Tx |
Sense_wang |
|
SuYao |
Zakir Jiwani |
Zhenyu |
lnennnn |
Citação 🙏
Se você achar este projeto útil, utilize o seguinte para citá-lo:
@inproceedings{zheng-etal-2025-pptagent,
title = "{PPTA}gent: Generating and Evaluating Presentations Beyond Text-to-Slides",
author = "Zheng, Hao and
Guan, Xinyan and
Kong, Hao and
Zhang, Wenkai and
Zheng, Jia and
Zhou, Weixiang and
Lin, Hongyu and
Lu, Yaojie and
Han, Xianpei and
Sun, Le",
editor = "Christodoulopoulos, Christos and
Chakraborty, Tanmoy and
Rose, Carolyn and
Peng, Violet",
booktitle = "Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing",
month = nov,
year = "2025",
address = "Suzhou, China",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2025.emnlp-main.728/",
doi = "10.18653/v1/2025.emnlp-main.728",
pages = "14413--14429",
ISBN = "979-8-89176-332-6",
abstract = "Automatically generating presentations from documents is a challenging task that requires accommodating content quality, visual appeal, and structural coherence. Existing methods primarily focus on improving and evaluating the content quality in isolation, overlooking visual appeal and structural coherence, which limits their practical applicability. To address these limitations, we propose PPTAgent, which comprehensively improves presentation generation through a two-stage, edit-based approach inspired by human workflows. PPTAgent first analyzes reference presentations to extract slide-level functional types and content schemas, then drafts an outline and iteratively generates editing actions based on selected reference slides to create new slides. To comprehensively evaluate the quality of generated presentations, we further introduce PPTEval, an evaluation framework that assesses presentations across three dimensions: Content, Design, and Coherence. Results demonstrate that PPTAgent significantly outperforms existing automatic presentation generation methods across all three dimensions."
}@misc{zheng2026deeppresenterenvironmentgroundedreflectionagentic,
title={DeepPresenter: Environment-Grounded Reflection for Agentic Presentation Generation},
author={Hao Zheng and Guozhao Mo and Xinru Yan and Qianhao Yuan and Wenkai Zhang and Xuanang Chen and Yaojie Lu and Hongyu Lin and Xianpei Han and Le Sun},
year={2026},
eprint={2602.22839},
archivePrefix={arXiv},
primaryClass={cs.AI},
url={https://arxiv.org/abs/2602.22839},
}
--- Tranlated By Open Ai Tx | Last indexed: 2026-04-09 ---