طورت Google Research محول رؤية جديدًا من نص إلى صورة. يتيح StyleDrop من Google للمستخدمين وصف الكائنات وتحديد الأنماط الفنية التي يريدون دمجها. يقوم StyleDrop بإخراج الصور التي تعكس مواصفات المستخدم في حوالي ثلاث دقائق.
يرى المطورون هذا البرنامج ، الذي لم يتم إصداره للجمهور بعد ، على أنه مساعدة كبيرة لمديري الفن ومصممي الجرافيك الذين يمكنهم إنشاء صور واقعية لمنتجات أو سمات معينة تتضمن نصًا يعكس نفس الألوان والبنية والأسلوب.
كيف يمكنني استخدام الإصدار التالي؟
وفقًا لموقع “techxplore” ، قالت Google في تقريرها: “النمط المقترح متعدد الاستخدامات للغاية ويلتقط الفروق الدقيقة وتفاصيل الأسلوب الذي يقدمه المستخدم ، مثل أنظمة الألوان والتظليل وأنماط التصميم والتأثيرات المحلية والعالمية . ”
ينشئ StyleDrop أيضًا أسلوب طباعة يدمج ميزات أسلوبية للصور ، على سبيل المثال ، يمكن للمستخدمين اقتراح صورة لجسر وشخصية ثم تحديد نمط رسم ، ويمكن أن تكون هذه الأنماط “نحت على الخشب” أو “عرض ثلاثي الأبعاد” أو “رسوم متحركة” أو أي نمط مفضل آخر ، خيال المرء هو المسيطر.
ستعمل StyleDrop بعد ذلك على إنشاء عروض رائعة للكائنات ، أو ربما نسخة شبيهة بالرسوم المتحركة ، جنبًا إلى جنب مع الأحرف التي لها نفس الخصائص.
يعمل StyleDrop بالاتصال مع Google Muse ، محول الرؤية التوليدية الذي تم الكشف عنه في وقت سابق من هذا العام والذي يوفر درجة جيدة من الواقعية. تم تدريب Muse على 3 مليارات معلم ، مما يضمن القدرة على إنشاء صور عالية الجودة.
قام الباحثون بتقييم دقة وجودة مخرجات StyleDrop باستخدام البرامج النصية CLIP المعيارية للصناعة وتسجيل الأنماط بالإضافة إلى ملاحظات المستخدم ، ووجدوا أن StyleDrop “يتفوق بشكل مقنع” على طرق إنشاء الصور والنصوص الرائدة الأخرى.
















