Mira cómo BACH convierte tokens en bruto en música estructurada—paso a paso.
BACH: Asistente de Composición por IA a Nivel de Compás
> "De la partitura al rendimiento: generación eficiente de canciones largas controlable por humanos con notación simbólica a nivel de compás" > Envío a ICASSP 2026 – Aceptado
🎼 Resumen en una frase
BACH es el primer generador de canciones simbólicas a nivel de compás editable por humanos: LLM escribe las letras → Transformer emite partitura ABC → renderizadores estándar producen música de varios minutos, nivel Suno. 1 B de parámetros, inferencia a nivel de minutos, SOTA de código abierto.📦 ¿Qué contiene este repositorio? (lanzamiento preliminar)
| Ruta | Descripción | |------|-------------| |README.md | Este archivo |
| code/ | código de inferencia |
| example.mp3 | una canción de ejemplo |
| fig/ | Figura de arquitectura |🏗️ Arquitectura del modelo (de un vistazo)
Solicitud del usuario Qwen3 — letras y etiquetas de estilo BACH-1B Transformer solo decodificador Partitura ABC (Dual-NTP + Chain-of-Score) ABC → MIDI → FluidSynth + VOCALOID Mezcla estéreo
| Componente | Idea clave |
|------------|------------|
| Dual-NTP | Predecir {vocal_patch, accomp_patch} conjuntamente en cada paso |
| Chain-of-Score | Etiquetas de sección [START:Chorus] ... [END:Chorus] para coherencia prolongada |
| Bar-stream patch | Parches de 16 caracteres no superpuestos por compás |
🧪 Inicio rápido (compatible con CPU)
# 1. Clone
git clone https://github.com/your-github/BACH.git
cd BACH2. Install
pip install -r requirements.txt # transformers>=4.41 mido abcpy fluidsynth3. Generate ABC
python bach/generate.py \
--prompt "A rainy-day lo-fi hip-hop song about missing the last train" \
--out_abc demo/rainy_lofi.abc4. Render audio
🎧 Escuchar ahora
example.mp3 está listo para ti, es una canción completa. Puedes compararlo con Suno🙂Lanzamiento completo tras la aceptación del artículo relacionado
- Conjunto de entrenamiento completo (ABC + letras + etiquetas de estructura)
- Pesos BACH-1B (formato Transformers)
- Scripts de entrenamiento (multifase + multitarea + ICL)
- Código completo
📎 Citación
El artículo está publicado en Arxiv,@misc{wang2025scoreperformanceefficienthumancontrollable,
title={De la Partitura al Rendimiento: Generación Eficiente de Canciones Largas Controlables por Humanos con Notación Simbólica a Nivel de Compás},
author={Tongxi Wang and Yang Yu and Qing Wang and Junlang Qian},
year={2025},
eprint={2508.01394},
archivePrefix={arXiv},
primaryClass={cs.SD},
url={https://arxiv.org/abs/2508.01394},
}
---
Tranlated By Open Ai Tx | Last indexed: 2026-03-08
---