Web Analytics

On-device-Sora

⭐ 131 stars Korean by eai-lab

[arXiv] 온-디바이스 소라: 모바일 기기를 위한 확산 기반 텍스트-투-비디오 생성 구현

논문: https://arxiv.org/abs/2502.04363

[arXiv] 온-디바이스 소라: 모바일 기기를 위한 확산 기반 텍스트-투-비디오 생성 구현의 코드 구현입니다. 참고한 기본 코드 -> Open-Sora : 모두를 위한 효율적인 비디오 제작 민주화

소개

이 저장소는 On-device Sora의 코드를 제공합니다. 이는 On-device Sora: Enabling Diffusion-Based Text-to-Video Generation for Mobile Devices 라는 논문의 오픈 소스 구현체입니다.

온-디바이스 소라

On-device Sora는 Linear Proportional Leap (LPL), Temporal Dimension Token Merging (TDTM), 그리고 Concurrent Inference with Dynamic Loading (CI-DL)을 적용하여 iPhone 15 Pro에서 효율적인 비디오 생성을 가능하게 합니다.

On-Device_Sora

오픈-소라

Open-Sora는 온-디바이스 소라의 베이스라인 모델로, 비디오 생성을 위한 오픈 소스 프로젝트이며 텍스트 입력을 기반으로 영상을 생성할 수 있는 T2V 확산 모델입니다.

온-디바이스 소라를 위한 각 모델의 MLPackage 변환 방법

패키지 의존성

의존성

cd Device_conversion

conda create -n convert python=3.10

conda activate convert

pip install -r requirements/requirements-convert.txt

pip install -v .

변환

T5 변환

cd t5
python3 export-t5.py

STDiT 커버링

cd stdit3
python3 export-stdit3.py

VAE 변환

export-vae-spatial.py를 실행할 때 Fatal Python error: PyEval_SaveThread라는 오류가 발생할 수 있습니다. 이 오류를 해결하려면 각 VAE 부분에 대해 한 개의 코드 블록만 실행해야 합니다. 나머지는 주석 처리하세요.

cd vae

for vae's temporal part

python3 export-vae-temporal.py

for vae's spatial part

python3 export-vae-spatial.py

사용 방법

필수 사항

변환된 MLPackage 다운로드 (각 모델을 MLPackage로 변환하고 싶지 않은 경우)

아래 링크에서 변환된 모델을 다운로드하여 사용할 수 있습니다. [다운로드]

앱 실행

예제 아티팩트

On-device-Sora-Example1

--- Tranlated By Open Ai Tx | Last indexed: 2026-02-18 ---