Посмотрите, как BACH превращает исходные токены в структурированную музыку — шаг за шагом.
BACH: Помощник по композитору на уровне такта
> "От партитуры к исполнению: эффективная генерация длинных песен с возможностью управления человеком на уровне тактов с использованием символической нотации" > Заявка на ICASSP 2026 – Принято
🎼 Одно предложение – краткое описание
BACH — первый редактируемый человеком генератор песен с символикой на уровне тактов: LLM пишет текст → Transformer создает партитуру ABC → стандартные рендереры воспроизводят музыку минутной длины, уровня Suno. 1 млрд. параметров, вывод на уровне минут, SOTA с открытым кодом.📦 Что находится в этом репозитории (предварительный релиз)
| Путь | Описание | |------|-------------| |README.md | Этот файл |
| code/ | код для вывода |
| example.mp3 | пример песни |
| fig/ | Схема архитектуры |🏗️ Архитектура модели (быстрый взгляд)
Пользовательский запрос Qwen3 — теги текста и стиля BACH-1B Transformer только-декодер Партитура ABC (Dual-NTP + Chain-of-Score)
ABC → MIDI → FluidSynth + VOCALOID Стерео-микс
| Компонент | Ключевая идея |
|-----------|--------------|
| Dual-NTP | Совместное предсказание {vocal_patch, accomp_patch} на каждом шаге |
| Chain-of-Score | Теги секций [START:Chorus] ... [END:Chorus] для долгосрочной связности |
| Bar-stream patch | 16-символьные неперекрывающиеся патчи на такт |
🧪 Быстрый старт (дружественно к CPU)
# 1. Clone
git clone https://github.com/your-github/BACH.git
cd BACH2. Install
pip install -r requirements.txt # transformers>=4.41 mido abcpy fluidsynth3. Generate ABC
python bach/generate.py \
--prompt "A rainy-day lo-fi hip-hop song about missing the last train" \
--out_abc demo/rainy_lofi.abc4. Render audio
🎧 Слушайте сейчас
example.mp3 готов для вас, это целая песня. Вы можете сравнить её с Suno🙂Полный релиз после принятия соответствующей статьи
- Полный обучающий набор (ABC + тексты песен + метки структуры)
- Веса BACH-1B (формат Transformers)
- Скрипты для обучения (многоэтапное + многозадачное + ICL)
- Полный код
📎 Цитирование
Статья опубликована на Arxiv, @misc{wang2025scoreperformanceefficienthumancontrollable, title={От партитуры к исполнению: эффективная генерация длинных музыкальных произведений с возможностью управления человеком на уровне тактов с использованием символической нотации}, author={Тонгси Ван и Янг Ю и Цин Ван и Джунлан Цянь}, year={2025}, eprint={2508.01394}, archivePrefix={arXiv}, primaryClass={cs.SD}, url={https://arxiv.org/abs/2508.01394}, }--- Tranlated By Open Ai Tx | Last indexed: 2026-03-08 ---