مايكروسوفت تعمل عل أداة ذكاء إصطناعي تُحوّل صورة ومقطع صوتي إلى "وجه ناطق"
قام باحثون من شركة "مايكروسوفت Microsoft -" بإبتكار أداة ذكاء إصطناعي قادرة على تحويل صورة وجه ومقطع صوتي إلى فيديو واقعي جداً لـ"وجه يتكلّم"، بحسب وثيقة نشرتها شركة التكنولوجيا الكبرى هذا الأسبوع.
من جهتها، أشارت الشركة إلى أن "هدف الأداة لا يتمثل في إنشاء محتوى بقصد التضليل أو الخداع"، لافتة إلى أنّ "الاداة، وعلى غرار تقنيات إنشاء محتوى أخرى، قد تُستخدم لأهداف مسيئة وانتحال صفة أيّ كان".
والجدير ذكره، أن شركة "مايكروسوفت Microsoft -" هي أكبر مصنع للبرمجيات في العالم من ناحية العائدات إعتباراً من عام 2016، فهي تطوّر وتصنِّع وترخِّص مدى واسعاً من البرمجيات للأجهزة الحاسوبيّة. يقع المقر الرئيسي للشركة في ضواحي ريدمونت، سياتل، بولاية واشنطن، الولايات المتحدة.
كما إنها واحدة من أكبر خمس شركات تكنولوجيا المعلومات الأميركية، إلى جانب غوغل، أمازون،Apple وMeta .
ولا تزال"مايكروسوفت Microsoft -" تسيطر على سوق نظام تشغيل الحاسوب الشخصي "أي بي أم" وعلى سوق البرمجيات المكتبية عن طريق "Microsoft Office"، كما أنتجت الشركة طيفاً واسعاً من البرامج الحاسوبية والخوادم، وإنتقلت إلى مجال محركات البحث في الإنترنت بمنتجها محرك Bing، وصناعة ألعاب الفيديو بمنصتها الشهيرة "Xbox".
وفي عام 2012 دخلت الشركة لأول مرة قطاع إنتاج الحواسيب اللوحية، وأطلقت منتجها مايكروسوفت "سيرفس"، وهو نوع من أنواع الحواسيب اللوحية.
في المقابل، يثير النمو السريع للذكاء الاصطناعي التوليدي، الذي يتيح بسهولة إنتاج مختلف أنواع المحتوى (نصوص وصور وأصوات...) بجودة عالية جداً، مخاوف كثيرة خصوصاً في ما يتعلق بالاستغلال لأغراض الاحتيال والتضليل.
بالإضافة إلى ذلك، أكّدت"مايكروسوفت Microsoft -" أن "بحثنا يركز على (...) الصور الرمزية الافتراضية (أفاتار)، بهدف الاستخدام الإيجابي"، مضيفة "نعارض أي سلوك يهدف إلى إنشاء محتوى مضلل أو ضار".
من ناحيتها، لا تعتزم شركة التكنولوجيا، وهي مستثمر رئيسي في "اوبن إيه آي Open AI" مبتكرة برنامج "تشات جي بي تي ChatGPt - "، إتاحة الأداة الجديدة أو تقديم معلومات تقنية "طالما اننا غير متأكدين من أنّ الأداة ستُستخدم بشكل مسؤول بحسب القوانين المعمول بها".
كما يلتقط البرنامج المسمى "فاسا-1" (VASA-1) صورة وجه بسيطة ويسجل مقطعاً صوتياً ويحولهما إلى شريط فيديو يظهر وجهاً يتحرك ويتكلم بطريقة واقعية جداً.
بالتزامن مع ذلك، تعمل شركات أخرى على هذه التقنية، على غرار "رَنواي" Runway، إحدى الشركات المتخصصة في الذكاء الاصطناعي التوليدي للفيديو. وأنشأ باحثون من "غوغل google-" برنامج ذكاء اصطناعي مسمى "فلوغر" قادر على إنشاء مقاطع فيديو واقعية لوجوه ناطقة.
وأشارت "مايكروسوفت Microsoft -" إلى أنّ فوائد ابتكار هذه الأداة "مثل تعزيز المساواة في مجال التعليم، ومساعدة مَن يعانون صعوبات في التواصل، وتوفير الدعم العلاجي لمَن يحتاجونه"، تبرر العمل عليها.