[arXiv] On-device Sora: Habilitando la Generación de Video a partir de Texto Basada en Difusión para Dispositivos Móviles
- El código se basa en la implementación de Open-Sora
Implementación del código de [arXiv] On-device Sora: Habilitando la Generación de Video a partir de Texto Basada en Difusión para Dispositivos Móviles. Código base referido -> Open-Sora : Democratizando la Producción Eficiente de Video para Todos
Introducción
Este repositorio proporciona código para On-device Sora, que es una implementación de código abierto del artículo llamado On-device Sora: Habilitando la Generación de Video a partir de Texto Basada en Difusión para Dispositivos Móviles.
On-Device Sora
On-device Sora aplica Linear Proportional Leap (LPL), Temporal Dimension Token Merging (TDTM) y Concurrent Inference with Dynamic Loading (CI-DL) para permitir la generación eficiente de video en el iPhone 15 Pro.
Open-Sora
Open-Sora es un modelo base de On-Device Sora, un proyecto de código abierto para generación de video, y un modelo de difusión T2V que puede producir videos basados en entrada de texto.
Cómo convertir cada modelo a MLPackage para On-device Sora
Dependencias del Paquete
Dependencias
cd Device_conversionconda create -n convert python=3.10
conda activate convert
pip install -r requirements/requirements-convert.txt
pip install -v .
Conversión
Conversión T5
cd t5
python3 export-t5.pyCubierta STDiT
cd stdit3
python3 export-stdit3.pyConversión de VAE
Cuando ejecutesexport-vae-spatial.py, puede aparecer un error que dice Fatal Python error: PyEval_SaveThread.
Para solucionar este error, debes ejecutar solo un bloque de código para cada parte del VAE. Comenta el resto.cd vaefor vae's temporal part
python3 export-vae-temporal.pyfor vae's spatial part
python3 export-vae-spatial.pyCómo usar
Requisitos
- Dispositivo Mac para xcode
- Cuenta Apple para compilar y lanzar la app
- iPhone: iPhone 15 pro o superior
- Versión iOS: 18 o superior
- Todos los MLPackage (T5, STDiT, VAE)
Descargar MLPackage convertido (si no quieres convertir cada modelo a MLPackage)
Puedes descargar y usar los modelos convertidos desde el siguiente enlace. [Descargar]
Ejecutar la app
- Implementa el proyecto xcode haciendo clic en On-device/On-device-Sora.xcodeproj
- Cambia el Equipo (Ninguno -> Tu cuenta Apple) en TARGETS/Signing&Capabilities
- Lanza la app
Ejemplo de artefactos

--- Tranlated By Open Ai Tx | Last indexed: 2026-02-18 ---