شاهد كيف يحول BACH الرموز الخام إلى موسيقى منظمة - خطوة بخطوة.
باخ: مساعد التأليف بالذكاء الاصطناعي على مستوى المقاطع
> "من النوتة إلى الأداء: توليد أغاني طويلة بكفاءة مع إمكانية التحكم البشري على مستوى المازورة باستخدام الترميز الرمزي" > تقديم إلى ICASSP 2026 – تم القبول
🎼 ملخص بجملة واحدة
BACH هو أول مولد أغاني رمزية قابل للتحرير البشري وعلى مستوى المازورة: النموذج اللغوي يكتب الكلمات → المحول يُنتج نوتة ABC → برامج التوليف الجاهزة تعطي موسيقى طويلة بالدقائق، بمستوى Suno. مليار معلمة، استنتاج بمستوى الدقائق، أفضل أداء مفتوح المصدر.📦 ما يحتويه هذا المستودع (إصدار معاينة)
| المسار | الوصف | |------|-------------| |README.md | هذا الملف |
| code/ | كود الاستنتاج |
| example.mp3 | أغنية مثال |
| fig/ | شكل البنية المعمارية |🏗️ بنية النموذج (نظرة سريعة)
طلب المستخدم Qwen3 — كلمات الأغاني وعلامات النمط BACH-1B Transformer مع فك التشفير فقط نوتة ABC (ثنائي-NTP + سلسلة النوتات)
ABC → MIDI → FluidSynth + VOCALOID مزيج ستيريو
| المكون | الفكرة الرئيسية |
|-----------|----------|
| التحكم المزدوج NTP | توقع {vocal_patch, accomp_patch} معًا في كل خطوة |
| سلسلة العلامات الموسيقية | علامات الأقسام [START:Chorus] ... [END:Chorus] للحفاظ على الترابط الطويل |
| تصحيح شريط التدفق | تصحيحات غير متداخلة من 16 حرفًا لكل شريط |
🧪 البدء السريع (متوافق مع وحدة المعالجة المركزية)
# 1. Clone
git clone https://github.com/your-github/BACH.git
cd BACH2. Install
pip install -r requirements.txt # transformers>=4.41 mido abcpy fluidsynth3. Generate ABC
python bach/generate.py \
--prompt "A rainy-day lo-fi hip-hop song about missing the last train" \
--out_abc demo/rainy_lofi.abc4. Render audio
🎧 استمع الآن
example.mp3 جاهز لك، إنه أغنية كاملة. يمكنك مقارنته مع Suno🙂الإصدار الكامل عند قبول الورقة العلمية ذات الصلة
- مجموعة التدريب الكاملة (ABC + كلمات الأغاني + تسميات الهيكل)
- أوزان BACH-1B (صيغة المحولات)
- سكريبتات التدريب (متعدد المراحل + متعدد المهام + ICL)
- الكود الكامل
📎 الاقتباس
تم نشر الورقة العلمية على Arxiv، @misc{wang2025scoreperformanceefficienthumancontrollable, title={من النوتة إلى الأداء: توليد أغاني طويلة بكفاءة وقابلية تحكم بشرية باستخدام التدوين الرمزي على مستوى المازورة}, author={تونغشي وانغ ويانغ يو وتشينغ وانغ وجونلانغ تشيان}, year={2025}, eprint={2508.01394}, archivePrefix={arXiv}, primaryClass={cs.SD}, url={https://arxiv.org/abs/2508.01394}, }--- Tranlated By Open Ai Tx | Last indexed: 2026-03-08 ---