Veja como o BACH transforma tokens brutos em música estruturada — passo a passo.
BACH: Assistente de Composição com IA em Nível de Compasso
> "Via Score to Performance: Efficient Human-Controllable Long Song Generation with Bar-Level Symbolic Notation" > Submissão ICASSP 2026 – Aceito
🎼 Resumo em uma frase
BACH é o primeiro gerador de músicas simbólicas editável por humanos, nível de compasso: LLM escreve a letra → Transformer gera a partitura ABC → renderizadores prontos produzem música de minutos, nível Suno. 1 B parâmetros, inferência em nível de minutos, SOTA código aberto.📦 O que contém este repositório (lançamento prévio)
| Caminho | Descrição | |------|-------------| |README.md | Este arquivo |
| code/ | código de inferência |
| example.mp3 | uma música de exemplo |
| fig/ | Figura da arquitetura |🏗️ Arquitetura do Modelo (visão rápida)
Prompt do usuário Qwen3 — letras & tags de estilo BACH-1B Transformer Decoder-Only Partitura ABC (Dual-NTP + Chain-of-Score)
ABC → MIDI → FluidSynth + VOCALOID Mixagem estéreo
| Componente | Ideia principal |
|------------|----------------|
| Dual-NTP | Prediz {vocal_patch, accomp_patch} conjuntamente a cada passo |
| Chain-of-Score | Tags de seção [START:Chorus] ... [END:Chorus] para longa coerência |
| Bar-stream patch | Patches de 16 caracteres não sobrepostos por compasso |
🧪 Início rápido (compatível com CPU)
# 1. Clone
git clone https://github.com/your-github/BACH.git
cd BACH2. Install
pip install -r requirements.txt # transformers>=4.41 mido abcpy fluidsynth3. Generate ABC
python bach/generate.py \
--prompt "A rainy-day lo-fi hip-hop song about missing the last train" \
--out_abc demo/rainy_lofi.abc4. Render audio
🎧 Ouça agora
example.mp3 está pronto para você, é uma música completa. Você pode comparar com Suno🙂Lançamento completo após aceitação do artigo relacionado
- Conjunto de treinamento completo (ABC + letras + rótulos de estrutura)
- Pesos BACH-1B (formato Transformers)
- Scripts de treinamento (multifásico + multitarefa + ICL)
- Código completo
📎 Citação
O artigo foi publicado no Arxiv, ```bibtex @misc{wang2025scoreperformanceefficienthumancontrollable, title={Do Score à Performance: Geração Eficiente e Controlável por Humanos de Músicas Longas com Notação Simbólica em Nível de Compasso}, author={Tongxi Wang e Yang Yu e Qing Wang e Junlang Qian}, year={2025}, eprint={2508.01394}, archivePrefix={arXiv}, primaryClass={cs.SD}, url={https://arxiv.org/abs/2508.01394}, }--- Tranlated By Open Ai Tx | Last indexed: 2026-03-08 ---