Obejrzyj, jak BACH zamienia surowe tokeny w uporządkowaną muzykę — krok po kroku.
BACH: Asystent AI do komponowania na poziomie taktów
> "Via Score to Performance: Efficient Human-Controllable Long Song Generation with Bar-Level Symbolic Notation" > Zgłoszenie na ICASSP 2026 – Zaakceptowano
🎼 Jednozdaniowe podsumowanie
BACH to pierwszy edytowalny przez człowieka, na poziomie taktów generator utworów symbolicznych: LLM pisze teksty → Transformer generuje zapis ABC → gotowe renderery tworzą wielominutową muzykę na poziomie Suno. 1 mld parametrów, wnioskowanie na poziomie minut, najlepszy open-source.📦 Co zawiera to repozytorium (wersja podglądowa)
| Ścieżka | Opis | |------|-------------| |README.md | Ten plik |
| code/ | kod do wnioskowania |
| example.mp3 | przykładowy utwór |
| fig/ | Rysunek architektury |🏗️ Architektura modelu (na pierwszy rzut oka)
Podpowiedź użytkownika Qwen3 — teksty i tagi stylu BACH-1B Transformer dekoder-only Zapis ABC (Dual-NTP + Chain-of-Score)
ABC → MIDI → FluidSynth + VOCALOID Miks stereo
| Komponent | Kluczowa idea |
|-----------|--------------|
| Dual-NTP | Przewiduje {vocal_patch, accomp_patch} wspólnie na każdym kroku |
| Chain-of-Score | Tagi sekcji [START:Chorus] ... [END:Chorus] dla długiej spójności |
| Bar-stream patch | 16-znakowe, niepokrywające się patche na takt |
🧪 Szybki start (przyjazny dla CPU)
# 1. Clone
git clone https://github.com/your-github/BACH.git
cd BACH2. Install
pip install -r requirements.txt # transformers>=4.41 mido abcpy fluidsynth3. Generate ABC
python bach/generate.py \
--prompt "A rainy-day lo-fi hip-hop song about missing the last train" \
--out_abc demo/rainy_lofi.abc4. Render audio
🎧 Posłuchaj teraz
example.mp3 jest gotowy dla Ciebie, to cały utwór. Możesz go porównać z Suno🙂Pełna publikacja po akceptacji powiązanego artykułu
- Pełny zestaw treningowy (ABC + teksty + etykiety struktury)
- Wagi BACH-1B (format Transformers)
- Skrypty treningowe (wielofazowe + wielozadaniowe + ICL)
- Pełny kod
📎 Cytowanie
Artykuł został opublikowany na Arxiv, ```bibtex @misc{wang2025scoreperformanceefficienthumancontrollable, title={Od partytury do wykonania: Efektywne, kontrolowane przez człowieka generowanie długich utworów z wykorzystaniem symbolicznej notacji taktowej}, author={Tongxi Wang i Yang Yu i Qing Wang i Junlang Qian}, year={2025}, eprint={2508.01394}, archivePrefix={arXiv}, primaryClass={cs.SD}, url={https://arxiv.org/abs/2508.01394}, }--- Tranlated By Open Ai Tx | Last indexed: 2026-03-08 ---