🌐 Idioma

Contato 📫

O principal colaborador deste repositório é um estudante de mestrado que se formará em 2026, sinta-se à vontade para entrar em contato para colaborações ou oportunidades.

本仓库的主要贡献者是一名 2026 届硕士毕业生，欢迎联系合作或交流机会。

Novidades 📅

[2026/03]: Agora suportamos CLI e lançamos nossos modelos ajustados no Hugging Face 🤗!
[2026/01]: Suportamos geração livre e por template com exportação para PPTX, modo offline agora disponível! Gerenciamento de contexto adicionado para evitar estouro de contexto.
[2025/12]: 🔥 Versão V2 lançada com grandes melhorias - Integração Profunda de Pesquisa, Design Visual Livre, Criação Autônoma de Ativos, Geração de Texto para Imagem, e Ambiente de Agente com sandbox & mais de 20 ferramentas.
[2025/09]: 🛠️ Suporte ao servidor MCP adicionado - veja Servidor MCP para detalhes de configuração
[2025/09]: 🚀 Lançada a v2 com grandes melhorias - veja notas de lançamento para detalhes
[2025/08]: 🎉 Artigo aceito na EMNLP 2025!
[2025/05]: ✨ Lançamento da v1 com funcionalidade principal e 🌟 marco: alcançamos 1.000 estrelas no GitHub! - veja notas de lançamento para detalhes
[2025/01]: 🔓 Código-fonte aberto, com código experimental arquivado em lançamento experimental

Uso 📖

[!IMPORTANTE]

Windows não é suportado. Se você estiver no Windows, use o WSL.

Recomendamos fortemente começar pelo CLI e pela tarefa mínima para confirmar se as dependências e o ambiente estão configurados corretamente.

Configuração

Se você usar o CLI, pptagent onboard pode ajudar a criar e atualizar essas configurações interativamente. Se usar Docker Compose ou construir a partir do código-fonte, prepare-as manualmente:

cp deeppresenter/config.yaml.example deeppresenter/config.yaml
cp deeppresenter/mcp.json.example deeppresenter/mcp.json

#### Serviços Opcionais Que Melhoram a Qualidade

Os seguintes serviços podem melhorar visivelmente a qualidade da geração, especialmente para profundidade de pesquisa, análise de PDF e criação de ativos visuais:

Tavily: melhora a qualidade da pesquisa na web. Solicite uma chave de API em tavily.com, depois defina TAVILY_API_KEY em deeppresenter/mcp.json.
MinerU: melhora a qualidade da análise de PDF. Você pode solicitar uma chave de API em mineru.net e definir MINERU_API_KEY em deeppresenter/mcp.json, ou implantar o MinerU localmente e definir MINERU_API_URL em vez disso.
Modelo de texto para imagem: melhora a qualidade da geração de imagens. Configure t2i_model em deeppresenter/config.yaml.

Se você deseja uma configuração totalmente offline, implante o MinerU localmente e defina offline_mode: true em deeppresenter/config.yaml para evitar o uso de ferramentas dependentes de rede, como pesquisa na web.

Mais variáveis configuráveis podem ser encontradas em constants.py.

1. Uso Pessoal / Integração com OpenClaw: CLI

[!NOTA]

No macOS, o CLI pode instalar automaticamente várias dependências locais, incluindo Homebrew, Node.js, Docker, poppler, Playwright e llama.cpp.

No Linux, você deve preparar o ambiente manualmente.

Use este modo se deseja a configuração local mais rápida ou se quiser conectar o DeepPresenter ao OpenClaw via CLI.

# Install uv
curl -LsSf https://astral.sh/uv/install.sh | sh
First-time interactive setup
uvx pptagent onboard
Generate a presentation
uvx pptagent generate "Single Page with Title: Hello World" -o hello.pptx
Generate with attachments
uvx pptagent generate "Q4 Report" \
  -f data.xlsx \
  -f charts.pdf \
  -p "10-12" \
  -o report.pptx

| Comando | Descrição | | ------------------- | ------------------------------------------------- | | pptagent onboard | Assistente de configuração interativo | | pptagent generate | Gerar apresentações | | pptagent config | Visualizar a configuração atual | | pptagent reset | Redefinir configuração | | pptagent serve | Iniciar o serviço local de inferência usado pelo CLI |

2. Configuração Mínima / Desenvolvimento: Compilar a partir do código-fonte

Use este modo se deseja a menor camada de abstração e controle total sobre as dependências durante o desenvolvimento.

uv pip install -e .
playwright install-deps
playwright install chromium
npm install --prefix deeppresenter/html2pptx
modelscope download forceless/fasttext-language-id
docker pull forceless/deeppresenter-sandbox
docker pull forceless/deeppresenter-host
docker tag forceless/deeppresenter-sandbox deeppresenter-sandbox
or build from dockerfile
docker build -t deeppresenter-sandbox -f deeppresenter/docker/SandBox.Dockerfile .

Inicie o aplicativo:

python webui.py

3. Implantação do Servidor: Docker Compose

Use este modo para um ambiente de servidor estável com dependências explícitas.

# Pull the public images to avoid build from source
docker pull forceless/deeppresenter-sandbox
docker tag forceless/deeppresenter-sandbox deeppresenter-sandbox
Or build from source
docker build -t deeppresenter-sandbox -f deeppresenter/docker/SandBox.Dockerfile .
Start the host service
docker compose up -d

The service exposes the web UI on http://localhost:7861.

Case Study 💡

#### Prompt: Please present the given document to me.

#### Prompt: 请介绍小米 SU7 的外观和价格

#### Prompt: 请制作一份高中课堂展示课件，主题为“解码立法过程：理解其对国际关系的影响”

Contribuidores 🌟

_Force1ess	_Puelloc	_hongyan	_Dnoob	_Sadahlu
_{KurisuMakiseSame}	_Angelen	_BrandonHu	_{Eliot White}	_EvolvedGhost
_ISCAS-zwl	_{James Brown}	_JunZhang	_{Open AI Tx}	_{Sense_wang}
_SuYao	_{Zakir Jiwani}	_Zhenyu	_lnennnn

Citação 🙏

Se você achar este projeto útil, utilize o seguinte para citá-lo:

@inproceedings{zheng-etal-2025-pptagent, title = "{PPTA}gent: Generating and Evaluating Presentations Beyond Text-to-Slides", author = "Zheng, Hao and Guan, Xinyan and Kong, Hao and Zhang, Wenkai and Zheng, Jia and Zhou, Weixiang and Lin, Hongyu and Lu, Yaojie and Han, Xianpei and Sun, Le", editor = "Christodoulopoulos, Christos and Chakraborty, Tanmoy and Rose, Carolyn and Peng, Violet", booktitle = "Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing", month = nov, year = "2025", address = "Suzhou, China", publisher = "Association for Computational Linguistics", url = "https://aclanthology.org/2025.emnlp-main.728/", doi = "10.18653/v1/2025.emnlp-main.728", pages = "14413--14429", ISBN = "979-8-89176-332-6", abstract = "Automatically generating presentations from documents is a challenging task that requires accommodating content quality, visual appeal, and structural coherence. Existing methods primarily focus on improving and evaluating the content quality in isolation, overlooking visual appeal and structural coherence, which limits their practical applicability. To address these limitations, we propose PPTAgent, which comprehensively improves presentation generation through a two-stage, edit-based approach inspired by human workflows. PPTAgent first analyzes reference presentations to extract slide-level functional types and content schemas, then drafts an outline and iteratively generates editing actions based on selected reference slides to create new slides. To comprehensively evaluate the quality of generated presentations, we further introduce PPTEval, an evaluation framework that assesses presentations across three dimensions: Content, Design, and Coherence. Results demonstrate that PPTAgent significantly outperforms existing automatic presentation generation methods across all three dimensions." }

@misc{zheng2026deeppresenterenvironmentgroundedreflectionagentic, title={DeepPresenter: Environment-Grounded Reflection for Agentic Presentation Generation}, author={Hao Zheng and Guozhao Mo and Xinru Yan and Qianhao Yuan and Wenkai Zhang and Xuanang Chen and Yaojie Lu and Hongyu Lin and Xianpei Han and Le Sun}, year={2026}, eprint={2602.22839}, archivePrefix={arXiv}, primaryClass={cs.AI}, url={https://arxiv.org/abs/2602.22839}, }

--- Tranlated By Open Ai Tx | Last indexed: 2026-04-09 ---