غوغل" عن إطلاق أداة جديدة لتوليد الصور بالذكاء الاصطناعي
"غوغل" عن إطلاق أداة جديدة لتوليد الصور بالذكاء الاصطناعي تحمل اسم "Whisk"، والتي تتيح للمستخدمين تأعلنتقديم مدخلات على شكل صور وإجراء تعديلات عليها باستخدام النصوص.
وفقًا لما ذكرته "غوغل" في مدونة رسمية، تتيح أداة Whisk للمستخدمين تقديم صورة كمصدر للموضوع أو المشهد أو النمط، حيث تستخدم الأداة هذه المدخلات لإعادة تصميم أو "إعادة مزج" الصور وتوليد عناصر جديدة، مثل "دمى رقمية محشوة" أو "دبابيس معدنية أو ملصقات"، أو صور تمثل هذه العناصر.
كيف تعمل أداة Whisk؟
تستخدم Whisk تقنية الذكاء الاصطناعي الخاصة بغوغل المسماة "Gemini AI" لتحليل الصور المدخلة وتحويلها إلى وصف نصي تفصيلي. ثم يتم إدخال هذه النصوص إلى الجيل الثالث من أداة Imagen للذكاء الاصطناعي لتوليد الصور. وأوضحت "غوغل" أن هذه العملية تهدف إلى استخراج "جوهر" الصور المقدمة، ما يسمح بإنتاج صور فريدة بناءً على المدخلات.
ومع ذلك، أشارت "غوغل" إلى أن الأداة قد تولد صوراً تختلف عن توقعات المستخدم، حيث يتم استخراج بعض الخصائص الأساسية فقط من الصور الأصلية. على سبيل المثال، قد يختلف ارتفاع أو وزن أو تصفيفة شعر أو لون بشرة العناصر في الصور الناتجة.
لهذا السبب، توفر Whisk إمكانية تعديل النصوص المُنتَجة من Gemini للسماح للمستخدمين بتخصيص النتائج بشكل أكبر لتكون أقرب إلى ما يريدون.