Contatti 📫
Il principale contributore di questo repository è uno studente magistrale che si laureerà nel 2026, sentiti libero di contattare per collaborazioni o opportunità.>
本仓库的主要贡献者是一名 2026 届硕士毕业生,欢迎联系合作或交流机会。
Novità 📅
- [2026/03]: Ora supportiamo la CLI e abbiamo rilasciato i nostri modelli ottimizzati su Hugging Face 🤗!
- [2026/01]: Supportiamo la generazione libera e tramite template, esportazione PPTX, ora anche in modalità offline! La gestione del contesto è stata aggiunta per evitare overflow di contesto.
- [2025/12]: 🔥 Rilasciata la V2 con miglioramenti significativi - Integrazione Profonda della Ricerca, Design Visivo Libero, Creazione Autonoma di Risorse, Generazione Testo-immagine e Ambiente Agent con sandbox e 20+ strumenti.
- [2025/09]: 🛠️ Aggiunto il supporto al server MCP - vedi MCP Server per dettagli sulla configurazione
- [2025/09]: 🚀 Rilasciata la v2 con importanti miglioramenti - vedi note di rilascio per dettagli
- [2025/08]: 🎉 Articolo accettato a EMNLP 2025!
- [2025/05]: ✨ Rilasciata la v1 con funzionalità principali e 🌟 traguardo: raggiunte 1.000 stelle su GitHub! - vedi note di rilascio per dettagli
- [2025/01]: 🔓 Codice reso open-source, con codice sperimentale archiviato alla release sperimentale
Utilizzo 📖
[!IMPORTANTE]
Windows non è supportato. Se usi Windows, utilizza WSL.>
Raccomandiamo vivamente di iniziare con la CLI e il task minimo per confermare che le dipendenze e l’ambiente siano configurati correttamente.
Configurazione
Se utilizzi la CLI, pptagent onboard può aiutare a creare e aggiornare queste configurazioni in modo interattivo. Se usi Docker Compose o compili dal sorgente, dovrai prepararle manualmente:
cp deeppresenter/config.yaml.example deeppresenter/config.yaml
cp deeppresenter/mcp.json.example deeppresenter/mcp.json#### Servizi opzionali che migliorano la qualità
I seguenti servizi possono migliorare sensibilmente la qualità della generazione, soprattutto per la profondità della ricerca, l'analisi dei PDF e la creazione di asset visivi:
- Tavily: migliora la qualità della ricerca web. Richiedi una chiave API su tavily.com, poi imposta
TAVILY_API_KEYindeeppresenter/mcp.json. - MinerU: migliora la qualità dell'analisi dei PDF. Puoi richiedere una chiave API su mineru.net e impostare
MINERU_API_KEYindeeppresenter/mcp.json, oppure installare MinerU localmente e impostare inveceMINERU_API_URL. - Modello text-to-image: migliora la qualità della generazione delle immagini. Configura
t2i_modelindeeppresenter/config.yaml.
offline_mode: true in deeppresenter/config.yaml per evitare il caricamento di strumenti dipendenti dalla rete come la ricerca web.Altre variabili configurabili sono disponibili in constants.py.
1. Uso personale / Integrazione OpenClaw: CLI
[!NOTE]
Su macOS, la CLI potrebbe installare automaticamente diverse dipendenze locali, inclusi Homebrew, Node.js, Docker, poppler, Playwright e llama.cpp.>
Su Linux, dovrai preparare l'ambiente autonomamente.
Usa questa modalità se vuoi la configurazione locale più rapida o se vuoi collegare DeepPresenter a OpenClaw tramite CLI.
# Install uv
curl -LsSf https://astral.sh/uv/install.sh | shFirst-time interactive setup
uvx pptagent onboardGenerate a presentation
uvx pptagent generate "Single Page with Title: Hello World" -o hello.pptxGenerate with attachments
uvx pptagent generate "Q4 Report" \
-f data.xlsx \
-f charts.pdf \
-p "10-12" \
-o report.pptx| Comando | Descrizione |
| ------------------- | ------------------------------------------------- |
| pptagent onboard | Procedura guidata di configurazione interattiva |
| pptagent generate | Genera presentazioni |
| pptagent config | Visualizza la configurazione corrente |
| pptagent reset | Reimposta la configurazione |
| pptagent serve | Avvia il servizio di inferenza locale usato dal CLI |
2. Configurazione minima / Sviluppo: Compilazione dal sorgente
Usa questa modalità se desideri il livello di astrazione più piccolo e il pieno controllo sulle dipendenze durante lo sviluppo.
uv pip install -e .
playwright install-deps
playwright install chromium
npm install --prefix deeppresenter/html2pptx
modelscope download forceless/fasttext-language-iddocker pull forceless/deeppresenter-sandbox
docker pull forceless/deeppresenter-host
docker tag forceless/deeppresenter-sandbox deeppresenter-sandbox
or build from dockerfile
docker build -t deeppresenter-sandbox -f deeppresenter/docker/SandBox.Dockerfile .Avvia l'app:
python webui.py3. Distribuzione del server: Docker Compose
Utilizza questa modalità per un ambiente server stabile con dipendenze esplicite.
# Pull the public images to avoid build from source
docker pull forceless/deeppresenter-sandbox
docker tag forceless/deeppresenter-sandbox deeppresenter-sandboxOr build from source
docker build -t deeppresenter-sandbox -f deeppresenter/docker/SandBox.Dockerfile .Start the host service
docker compose up -dThe service exposes the web UI on http://localhost:7861.
Case Study 💡
- #### Prompt: Please present the given document to me.










- #### Prompt: 请介绍小米 SU7 的外观和价格






- #### Prompt: 请制作一份高中课堂展示课件,主题为“解码立法过程:理解其对国际关系的影响”














Contributori 🌟
|
Force1ess |
Puelloc |
hongyan |
Dnoob |
|
|
KurisuMakiseSame |
Angelen |
BrandonHu |
Eliot White |
EvolvedGhost |
|
ISCAS-zwl |
James Brown |
JunZhang |
Open AI Tx |
Sense_wang |
|
SuYao |
Zakir Jiwani |
Zhenyu |
lnennnn |
Citazione 🙏
Se ritieni che questo progetto sia utile, utilizza il seguente per citarlo:
@inproceedings{zheng-etal-2025-pptagent,
title = "{PPTA}gent: Generating and Evaluating Presentations Beyond Text-to-Slides",
author = "Zheng, Hao and
Guan, Xinyan and
Kong, Hao and
Zhang, Wenkai and
Zheng, Jia and
Zhou, Weixiang and
Lin, Hongyu and
Lu, Yaojie and
Han, Xianpei and
Sun, Le",
editor = "Christodoulopoulos, Christos and
Chakraborty, Tanmoy and
Rose, Carolyn and
Peng, Violet",
booktitle = "Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing",
month = nov,
year = "2025",
address = "Suzhou, China",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2025.emnlp-main.728/",
doi = "10.18653/v1/2025.emnlp-main.728",
pages = "14413--14429",
ISBN = "979-8-89176-332-6",
abstract = "Automatically generating presentations from documents is a challenging task that requires accommodating content quality, visual appeal, and structural coherence. Existing methods primarily focus on improving and evaluating the content quality in isolation, overlooking visual appeal and structural coherence, which limits their practical applicability. To address these limitations, we propose PPTAgent, which comprehensively improves presentation generation through a two-stage, edit-based approach inspired by human workflows. PPTAgent first analyzes reference presentations to extract slide-level functional types and content schemas, then drafts an outline and iteratively generates editing actions based on selected reference slides to create new slides. To comprehensively evaluate the quality of generated presentations, we further introduce PPTEval, an evaluation framework that assesses presentations across three dimensions: Content, Design, and Coherence. Results demonstrate that PPTAgent significantly outperforms existing automatic presentation generation methods across all three dimensions."
}@misc{zheng2026deeppresenterenvironmentgroundedreflectionagentic,
title={DeepPresenter: Environment-Grounded Reflection for Agentic Presentation Generation},
author={Hao Zheng and Guozhao Mo and Xinru Yan and Qianhao Yuan and Wenkai Zhang and Xuanang Chen and Yaojie Lu and Hongyu Lin and Xianpei Han and Le Sun},
year={2026},
eprint={2602.22839},
archivePrefix={arXiv},
primaryClass={cs.AI},
url={https://arxiv.org/abs/2602.22839},
}
--- Tranlated By Open Ai Tx | Last indexed: 2026-04-09 ---