مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

53 خبر
  • العملية العسكرية الروسية في أوكرانيا
  • نبض الملاعب
  • هدنة بين حزب الله وإسرائيل
  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • نبض الملاعب

    نبض الملاعب

  • هدنة بين حزب الله وإسرائيل

    هدنة بين حزب الله وإسرائيل

  • هدنة وحصار المضيق

    هدنة وحصار المضيق

  • نيويورك.. تظاهرات حاشدة إحياء لذكرى يوم الأسير الفلسطيني

    نيويورك.. تظاهرات حاشدة إحياء لذكرى يوم الأسير الفلسطيني

  • قطاع غزة.. فعاليات رمزية على شاطئ البحر تعبيرا عن معاناة الأطفال

    قطاع غزة.. فعاليات رمزية على شاطئ البحر تعبيرا عن معاناة الأطفال

  • اليابان.. افتتاح مسار تاتياما كوروبي في جبال الألب اليابانية في موسم 2026

    اليابان.. افتتاح مسار تاتياما كوروبي في جبال الألب اليابانية في موسم 2026

  • إسكتلندا.. فعالية في إدنبرة لإحياء ذكرى الطفلة هند رجب

    إسكتلندا.. فعالية في إدنبرة لإحياء ذكرى الطفلة هند رجب

الموناليزا تغني الراب! .. "مايكروسوفت" تطور نموذج ذكاء اصطناعي "واقعي بشكل مخيف"

طورت شركة "مايكروسوفت" نموذج ذكاء اصطناعي، يحول صور وجه الشخص ومقاطع الصوت إلى فيديو مع مزامنة الشفاه وتعبيرات الوجه وحركات الرأس بشكل مناسب.

الموناليزا تغني الراب! .. "مايكروسوفت" تطور نموذج ذكاء اصطناعي "واقعي بشكل مخيف"
لوحة الموناليزا / China News Service / Contributor / Gettyimages.ru

وتم تطوير نموذج الذكاء الاصطناعي الجديد بواسطة فريق من العلماء في مجال الذكاء الاصطناعي في Microsoft Research Asia، ويسمى VASA-1.

وقال الفريق في ورقة بحثية: "لقد قدمنا VASA، وهو إطار عمل لتوليد وجوه ناطقة نابضة بالحياة مع مهارات عاطفية بصرية جذابة (VAS) من خلال صورة ثابتة واحدة ومقطع صوتي للكلام. إن نموذجنا الأول، VASA-1، قادر ليس فقط على إنتاج حركات الشفاه المتزامنة بشكل رائع مع الصوت، ولكن أيضا التقاط مجموعة كبيرة من الفروق الدقيقة في الوجه وحركات الرأس الطبيعية التي تساهم في إدراك الأصالة والحيوية".

ويدعي الفريق أن طريقتهم لا توفر جودة فيديو عالية مع ديناميكيات واقعية للوجه والرأس فحسب، بل تدعم أيضا إنشاء مقاطع فيديو بحجم 512 × 512 عبر الإنترنت بسرعة تصل إلى 40 إطارا في الثانية مع زمن انتقال لا يكاد يذكر.

وهذا يمهد الطريق للتفاعلات في الوقت الفعلي مع الصور الرمزية النابضة بالحياة التي تحاكي سلوكيات المحادثة البشرية، وفقا لما ذكره العلماء.

ويشار إلى أن VASA هو اختصار لـ Visual Affective Skills Animator (بمعنى الرسوم المتحركة للمهارات البصرية العاطفية)، وهو نموذج قادر على تحويل أي صور ثابتة سواء تم التقاطها بواسطة الكاميرا، أو رسمها، إلى رسوم متحركة "متزامنة بشكل رائع".

ويمكن لـ VASA إنشاء فيديو حقيقي "مخيف"، حيث تحاكي "الوجوه الناطقة الواقعية" سلوكيات المحادثة البشرية من خلال إيماءات الوجه وحركة العين والرأس الطبيعية، وكل ذلك من صورة ثابتة واحدة للرأس.

واستخدم الفريق مجموعة بيانات VoxCeleb2 المتاحة للجمهور والتي تحتوي على مقاطع فيديو لأكثر من 6000 من المشاهير الواقعيين.

وبعد التخلص من المقاطع التي تتضمن عدة أفراد وذات جودة منخفضة، قام الفريق بتدريب نموذجهم على مجموعة البيانات المعالجة.

ومن اللافت للنظر أن نموذجهم يمكنه التعامل مع المدخلات خارج مجموعة التدريب، مثل الصور الفنية والكلام بغير الإنجليزية.

غناء الموناليزا

وباستخدام مقطع صوتي لأغنية Paparazzi بصوت آن هاثاواي، أجرى العلماء تجارب على الموناليزا.

وادعى الفريق أن نظام الذكاء الاصطناعي يمكن أن يعمل في الوقت الفعلي، حيث أظهروا مقطعا يوضح الأداة وهي تقوم على الفور بتحريك الصور باستخدام تعبيرات الوجه وحركات الرأس. كما يوفر النموذج التحكم في النظرة والمسافة والعواطف في الفيديو الذي تم إنشاؤه.

مخاوف انتحال الشخصية

في حين أن قدرات النموذج تثير مخاوف انتحال الشخصية، فإن العلماء يصرون على أن هدفهم من الأداة ليس تعزيز التزييف العميق.

وكتبوا في منشور: "نحن نستكشف توليد المهارات العاطفية البصرية للشخصيات الافتراضية والتفاعلية، وليس انتحال شخصية أي شخص في العالم الحقيقي".

ويؤكد فريق البحث أن النموذج سيتم استخدامه للتعليم وتوفير الرفقة. وقد رفضوا أيضا إصدار الكود الذي يدعم النموذج.

وأكد الفريق اهتمامه بتطبيق التقنية الجديدة لتعزيز اكتشاف التزوير. وأكدوا: "ليس لدينا أي خطط لإصدار عرض توضيحي عبر الإنترنت أو واجهة برمجة تطبيقات أو منتج أو تفاصيل تنفيذ إضافية أو أي عروض ذات صلة حتى نتأكد من استخدام التكنولوجيا بشكل مسؤول ووفقا للوائح المناسبة".

المصدر: Interesting Engineering

التعليقات

إغلاق باب المندب.. ورقة ضغط ونقطة نفوذ تهددان إسرائيل ووجودها

حرس الثورة الإيراني: الحرب قد تتحول إلى عالمية ونحتفظ بأوراق قوة لم تستخدم بعد

ترامب: مفاوضون يصلون إلى إسلام آباد.. لا مزيد من اللطف وسندمر محطات الكهرباء والجسور في إيران

لحظة بلحظة.. الهدنة تترنح: واشنطن تنتظر "انفراجة" وإيران تتمسك بشروطها وإسرائيل تستعد لانهيار مفاجئ

إعلام عبري: حماس ترفض مناقشة نزع السلاح وطالبت بتعديلات على اتفاق وقف إطلاق النار

الحوثيون: إذا قررنا إغلاق باب المندب فإن كل الإنس والجن سيكونون عاجزين تماما عن فتحه

"أكسيوس": صراع أمريكا وإيران عزز نفوذ الصين الدبلوماسي والاستخباراتي مجانا ودون إطلاق رصاصة واحدة

قاليباف حول المفاوضات: الفجوات مع واشنطن كبيرة وبعيدون عن النقاش النهائي.. حزب الله ضمن الشروط

الصفدي: إسرائيل هي مصدر التوتر في المنطقة ولا نريد أن نكون ضحية ورهينة بيد نتنياهو وحكومته

الجيش الأمريكي يستعد لمداهمة سفن مرتبطة بإيران ومصادرة سفن تجارية في المياه الدولية

هاريس تتهم نتنياهو بجر ترامب إلى حرب إيران

"أخطاء في الحسابات".. الحرب على إيران "تعري" نقطة ضعف ترامب

قاليباف: إذا لم ترفع واشنطن الحصار سيتم تقييد الملاحة.. مستحيل أحد عبور هرمز بينما نحن لا نستطيع

قاليباف: نعلن لشعبنا أن مضيق هرمز تحت سيطرتنا وتعاملنا بحزم مع محاولة أمريكا إزالة الألغام

ثالث حادث خلال ساعتين.. بلاغ عن استهداف جديد لسفينة في بحر عمان

ترامب: إيران لا تستطيع "ابتزاز" الولايات المتحدة من خلال مضيق هرمز

فيتسو: أزمة الطاقة الناجمة عن حرب إيران قد تخلص الاتحاد الأوروبي من هوس روسيا