"إنفيديا" تكشف عن نموذج ذكاء اصطناعي لتحويل النصوص إلى أصوات

ينتج أصواتا تحاكي البشر

المصدر: الرياض - العربية Business
نشر في: آخر تحديث:
وضع القراءة
100% حجم الخط
دقيقتان للقراءة

أعلنت شركة "إنفيديا" عن إطلاق نموذج ذكاء اصطناعي توليدي جديد يحمل اسم "Fugatto"، يتميز بقدرته على إنشاء الأصوات وتعديل ملفات الموسيقى بناءً على تعليمات نصية، في خطوة تسلط الضوء على إمكانيات الذكاء الاصطناعي في قطاع الصوتيات.

صمم النموذج فريق عالمي من الباحثين في الذكاء الاصطناعي، مما ساهم في تعزيز قدراته على التعامل مع لغات ولهجات متعددة، وفقًا لتقرير نشره موقع "Engadget"، واطلعت عليه "العربية Business".

وأوضح رافائيل فالي، مدير أبحاث الأصوات التطبيقية في "إنفيديا"، أن الهدف من تطوير النموذج كان "إنشاء تقنية قادرة على فهم وإنتاج الصوت بطريقة تحاكي البشر".

أدرجت "إنفيديا" في إعلانها عددًا من السيناريوهات التي يمكن أن يكون النموذج فيها مفيدًا. على سبيل المثال، يمكن لمنتجي الموسيقى استخدامه لتطوير نماذج أولية لأفكار الأغاني، ومن ثم تعديلها بسهولة لاستكشاف أنماط وأصوات وآلات موسيقية جديدة.

كما يمكن لمطوري ألعاب الفيديو الاستفادة من النموذج لتوليد نسخ مختلفة من المقاطع الصوتية لتناسب تغييرات اللعبة التي تعتمد على اختيارات اللاعبين.

ومن المثير للاهتمام أن النموذج يتمتع بالقدرة على تنفيذ مهام غير مشمولة في تدريبه المسبق. على سبيل المثال، يمكنه توليد أصوات بمزاج معين، مثل صوت غاضب بلهجة معينة، أو أصوات تتغير ديناميكيًا بمرور الوقت، مثل "هدير عاصفة مطيرة تتحرك عبر منطقة".

سباق الذكاء الاصطناعي في الصوتيات

ورغم أهمية نموذج "Fugatto"، فإنه ليس الأول من نوعه. فقد أطلقت "Meta" سابقًا أدوات مفتوحة المصدر لإنشاء أصوات بناءً على أوصاف نصية، بينما قدمت "غوغل" نموذجها الخاص لتحويل النصوص إلى موسيقى تحت اسم "MusicLM".

تمثل هذه التطورات نقلة نوعية في استخدامات الذكاء الاصطناعي بمجال الصوتيات، حيث بات بإمكان هذه التقنيات تجاوز الإبداع التقليدي، وفتح آفاق جديدة في صناعة الموسيقى، الألعاب، والإنتاج الإعلامي.

الأكثر قراءة مواضيع شائعة

تم اختيار مواضيع "العربية" الأكثر قراءة بناءً على إجمالي عدد المشاهدات اليومية. اقرأ المواضيع الأكثر شعبية كل يوم من هنا.

  • وضع القراءة
    100% حجم الخط