ComfyUI_Fill-ChatterBox
หากคุณชื่นชอบโปรเจกต์นี้ โปรดพิจารณาสนับสนุนผมบน Patreon!
ส่วนขยายโหนดแบบกำหนดเองสำหรับ ComfyUI ที่เพิ่มความสามารถแปลงข้อความเป็นเสียง (TTS) และแปลงเสียง (VC) โดยใช้ไลบรารี Chatterbox รองรับสูงสุด 40 วินาที ผมพยายามลบข้อจำกัดนี้แล้ว แต่โมเดลจะผิดเพี้ยนมากหากเกินกว่านั้น จึงยังคงต้องมีข้อจำกัดนี้

การติดตั้ง
- โคลน repository นี้ไปยังไดเรกทอรี custom_nodes ของ ComfyUI ของคุณ:
bash
cd /path/to/ComfyUI/custom_nodes
git clone https://github.com/filliptm/ComfyUI_Fill-ChatterBox.git
`
- ติดตั้ง dependencies พื้นฐาน:
`bash
pip install -r ComfyUI_Fill-ChatterBox/requirements.txt
`
- (ตัวเลือก) ติดตั้งการรองรับลายน้ำ:
`bash
pip install resemble-perth
`
หมายเหตุ: แพ็กเกจ resemble-perth` อาจมีปัญหาความเข้ากันได้กับ Python 3.12+ หากคุณพบข้อผิดพลาดในการนำเข้า โหนดจะยังคงทำงานได้โดยไม่มีลายน้ำการใช้งาน
โหนดแปลงข้อความเป็นเสียงพูด (FL Chatterbox TTS)
- เพิ่มโหนด "FL Chatterbox TTS" ลงในเวิร์กโฟลว์ของคุณ
- กำหนดค่าข้อความอินพุตและพารามิเตอร์ต่างๆ (exaggeration, cfg_weight, temperature)
- สามารถให้พรอมต์เสียงสำหรับการโคลนเสียงได้ตามต้องการ
โหนดแปลงเสียงพูด (FL Chatterbox VC)
- เพิ่มโหนด "FL Chatterbox VC" ลงในเวิร์กโฟลว์ของคุณ
- เชื่อมต่อเสียงอินพุตและเสียงเป้าหมาย
- ทั้งสองโหนดรองรับการทำงานแบบ fallback ไปยัง CPU หากเกิดข้อผิดพลาดของ CUDA
บันทึกการเปลี่ยนแปลง
24/6/2025
- เพิ่มพารามิเตอร์ seed ในทั้งสองโหนด TTS และ VC เพื่อให้การสร้างซ้ำได้
- ช่วงของ seed: 0 ถึง 4,294,967,295 (จำนวนเต็ม 32 บิต)
- ทำให้ผลลัพธ์เสียงออกมาสอดคล้องกันสำหรับการดีบักและควบคุมเวิร์กโฟลว์
- ทำให้การใส่ลายน้ำ Perth เป็นตัวเลือกเพื่อแก้ปัญหาความเข้ากันได้กับ Python 3.12+
- ขณะนี้โหนดจะทำงานได้แม้การนำเข้า resemble-perth ล้มเหลว
31/5/2025
- เพิ่มฟังก์ชันโหลดโมเดลแบบถาวร และแถบโหลด
- เพิ่มการรองรับ Mac (ต้องทดสอบต่อ ติดต่อฉันได้)
- ลบไลบรารี chatterbox-tts และพัฒนาโค้ด inference เอง