ComfyUI_Fill-ChatterBox
यदि आपको यह प्रोजेक्ट पसंद है, तो कृपया मुझे Patreon पर समर्थन देने पर विचार करें!
ComfyUI के लिए एक कस्टम नोड एक्सटेंशन, जो Chatterbox लाइब्रेरी का उपयोग करके टेक्स्ट-टू-स्पीच (TTS) और वॉयस कन्वर्जन (VC) क्षमताएँ जोड़ता है। अधिकतम 40 सेकंड का समर्थन करता है। मैंने इस सीमा को हटाने की कोशिश की, लेकिन मॉडल इससे अधिक समय पर बहुत खराब परिणाम देता है, इसलिए इसे बरकरार रखा गया है।

स्थापना
- इस रिपॉजिटरी को अपनी ComfyUI custom_nodes डायरेक्टरी में क्लोन करें:
bash
cd /path/to/ComfyUI/custom_nodes
git clone https://github.com/filliptm/ComfyUI_Fill-ChatterBox.git
`
- आधारभूत डिपेंडेंसीज़ स्थापित करें:
`bash
pip install -r ComfyUI_Fill-ChatterBox/requirements.txt
`
- (वैकल्पिक) वॉटरमार्किंग समर्थन स्थापित करें:
`bash
pip install resemble-perth
`
नोट: resemble-perth` पैकेज में Python 3.12+ के साथ संगतता संबंधी समस्याएँ हो सकती हैं। यदि आपको इंपोर्ट त्रुटियाँ मिलती हैं, तो नोड्स वॉटरमार्किंग के बिना भी काम करेंगे।उपयोग
टेक्स्ट-टू-स्पीच नोड (FL Chatterbox TTS)
- अपने वर्कफ़्लो में "FL Chatterbox TTS" नोड जोड़ें
- टेक्स्ट इनपुट और पैरामीटर (exaggeration, cfg_weight, temperature) कॉन्फ़िगर करें
- वॉयस क्लोनिंग के लिए वैकल्पिक रूप से एक ऑडियो प्रॉम्प्ट दें
वॉयस कन्वर्ज़न नोड (FL Chatterbox VC)
- अपने वर्कफ़्लो में "FL Chatterbox VC" नोड जोड़ें
- इनपुट ऑडियो और टार्गेट वॉयस कनेक्ट करें
- दोनों नोड्स में, यदि CUDA त्रुटियाँ आती हैं तो CPU फॉलबैक सपोर्ट है
चेंज लॉग
24/6/2025
- टीटीएस और वीसी दोनों नोड्स में पुनरुत्पादन योग्य जनरेशन के लिए सीड पैरामीटर जोड़ा गया
- सीड रेंज: 0 से 4,294,967,295 (32-बिट पूर्णांक)
- डिबगिंग और वर्कफ़्लो नियंत्रण के लिए सुसंगत ऑडियो आउटपुट सक्षम करता है
- Python 3.12+ संगतता समस्याओं को ठीक करने के लिए Perth वॉटरमार्किंग को वैकल्पिक बनाया गया
- resemble-perth इंपोर्ट विफल होने पर अब नोड्स वॉटरमार्किंग के बिना भी काम करते हैं
31/5/2025
- पर्सिस्टेंट मॉडल लोडिंग और लोडिंग बार फ़ंक्शनलिटी जोड़ी गई
- Mac सपोर्ट जोड़ा गया (टेस्टिंग ज़रूरी है, इसलिए संपर्क करें)
- chatterbox-tts लाइब्रेरी हटाई गई और नेटिव इनफेरेंस कोड लागू किया गया।