أعلنت Meta عن إطار عمل audio2photoreal الذكاء الاصطناعي ، والذي يمكنه إنشاء مشاهد حوار الشخصيات عن طريق إدخال ملفات الدبلجة

2024-01-12 08:21:43

أعلنت Bit News Meta مؤخرا عن إطار عمل الذكاء الاصطناعي يسمى audio2photoreal ، وهو قادر على إنشاء سلسلة من نماذج شخصيات NPC الواقعية و "مزامنة الشفاه" تلقائيا و "وضع" نماذج الشخصيات بمساعدة ملفات التعليق الصوتي الموجودة.

أشار تقرير البحث الرسمي إلى أنه بعد استلام ملف الدبلجة ، سيقوم إطار عمل Audio2 photoreal أولا بإنشاء سلسلة من نماذج NPC ، ثم استخدام تقنية التكميم وخوارزمية الانتشار لإنشاء إجراءات النموذج ، حيث توفر تقنية التكميم مرجع عينة العمل للإطار ويتم استخدام خوارزمية الانتشار لتحسين تأثير إجراءات الشخصية الناتجة عن الإطار.

كان ثلاثة وأربعون بالمائة من المقيمين في التجربة الخاضعة للرقابة "راضين بشدة" عن مشاهد حوار الشخصيات الناتجة عن الإطار ، لذلك شعر الباحثون أن إطار Audio2 photoreal كان قادرا على توليد حركات "أكثر ديناميكية وتعبيرا" من المنتجات المنافسة في الصناعة. يذكر أن فريق البحث قد جعل الآن الكود ومجموعة البيانات ذات الصلة عامة على GitHub.

AUDIO4.43%

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

تسجيلات الإعجاب 1

أعجبني
1
تعليق
مشاركة

تعليق

0/400

لا توجد تعليقات

الموضوع
Gate 2025 Q2 Report Released
14k درجة الشعبية
CPI Data Incoming
44k درجة الشعبية
Altcoin Season Update
2k درجة الشعبية
4Gate Derivatives Volume Hits New High
15k درجة الشعبية
5Join Gate VIP to Win MacBook
30k درجة الشعبية
6MicroStrategy Buys More Bitcoin
568 درجة الشعبية
7BTC Hits New High
109k درجة الشعبية
8My Gate Moments
26k درجة الشعبية
9VIP Exclusive Airdrop Carnival
26k درجة الشعبية
10Fed June Meeting Minutes
7k درجة الشعبية

تثبيت

خريطة الموقع