Nvidia تعلن عن نموذج ذكاء اصطناعي لتوليد الأصوات
أعلنت شركة Nvidia عن تطوير نموذج ذكاء اصطناعي لتوليد الأصوات بناء على بيانات نصية.
وأشارت الشركة إلى أن النموذج الجديد “Fugatto” هو اختصار لـ”Foundational Geneative Audio Transformer Opus”، ويمكنه توليد أصوات متنوعة اعتمادا على معلومات بيانات مكتوبة يحددها المستخدم.
وعلى سبيل المثال يمكن لـ”Fugatto” إنشاء مقطوعة موسيقية بناء على كلمات أغنية معينة، أو إزالة أصوات معينة من موسيقى الأغاني، كما يمكنه توليد أصوات جديدة شبيهة بأصوات الآلات الموسيقية.
وقال مدير أبحاث الصوت التطبيقية في NVIDIA NVIDIA رافئيل فالي:” Fugatto هو خطوتنا الأولى نحو تطوير ذكاء اصطناعي قادر على توليد الأصوات، هذا النموذج يدعم العديد من مهام توليد الصوت وتحويله، غايتنا كانت تطوير نموذج ذكاء اصطناعي يولد الأصوات ويفهمها مثل البشر”.
وتبعا للمعلومات المتوفرة فإن مطوري ألعاب الفيديو ومصممي الفيديوهات سيكون بإمكانهم الاعتماد على “Fugatto” مستقبلا لدعم الفيديوهات بمؤثرات صوتية مختلفة.