تطرح جوجل مجموعة واسعة من التحديثات لواجهة الذكاء الاصطناعي الخاصة بها، بما في ذلك أداة جديدة لتحويل النص إلى صورة. ولعل الأمر المختلف في أداة Google الجديدة، ImageFX، هو أنها تحتوي على واجهة تحتوي على “شرائح معبرة”.
وبحسب ما أورده موقع “engadget”، فإن الصور والتسجيلات الصوتية التي تم إنشاؤها باستخدام ImageFX وتم إنشاؤها باستخدام MusicFX تم تمييزها بـ SynthID، وهي علامة مائية رقمية تهدف إلى توضيح أن هذه الصور تستخدم الذكاء الاصطناعي، خاصة عندما تظهر في البحث. أو كروم.
ستتضمن إبداعات ImageFX أيضًا بيانات تعريف IPTC، وهذا، وفقًا لجوجل، سيزود الأشخاص بمزيد من المعلومات كلما واجهوا صورًا تم إنشاؤها بواسطة الذكاء الاصطناعي.
يمكن للأشخاص في الولايات المتحدة وكينيا ونيوزيلندا وأستراليا تجربة هذه الأدوات الجديدة والمتجددة في AI Test Kitchen بدءًا من اليوم، ولكنها متاحة باللغة الإنجليزية فقط في الوقت الحالي.
يعمل نموذج Imagen 2 على تشغيل ميزات إنشاء الصور الجديدة في ImageFX، وهو أيضًا التكنولوجيا التي تقود خيارات الذكاء الاصطناعي التوليدية الجديدة في Bard وSearch وAds وDuet AI في Workspace وVertex AI.
تقول Google إن Imagen 2 يساعد في تقديم صور عالية الجودة تم إنشاؤها بواسطة الذكاء الاصطناعي حتى الآن.
وتشير الشركة إلى أن النموذج يساعد في الحفاظ على الصور خالية من القطع الأثرية ويحسن مجالات توليد الصور التي ابتليت بها هذه الأدوات حتى الآن.
بالإضافة إلى ذلك، تقول جوجل إنها قامت “باستثمارات كبيرة” في التدريب على سلامة البيانات في Imagen 2، حيث أضافت حواجز حماية للحد من المخرجات الإشكالية مثل المحتوى العنيف أو المسيء أو الجنسي الصريح بالإضافة إلى تنفيذ المرشحات لتقليل مخاطر إنشاء صور لأفراد محددين.
ويرجع ذلك إلى تحسين قدرة النموذج على إنشاء صور واقعية، وتدعي الشركة أنها تجري أيضًا اختبارات مكثفة للكشف عن المحتوى الذي قد يسبب مشاكل.
إلى جانب ظهور ImageFX لأول مرة، تقول Google إنها قامت بتحسين MusicFX وTextFX. تدعي الشركة أنها قامت بإجراء ترقيات لنموذج MusicLM الذي يتضمن توليد موسيقى أسرع وصوت عالي الجودة، إلى جانب ميزات جديدة. يمكن الآن أن تستمر الأغاني التي تم إنشاؤها لمدة تصل إلى 70 ثانية. أما بالنسبة لـ TextFX، فقد طرحت Google تحديثات قابلية الاستخدام تهدف إلى تحسين التنقل وتجربة المستخدم الشاملة.
أصبح Gemini Pro in Bard متاحًا على نطاق أوسع، وهو متوفر الآن بأكثر من 40 لغة و230 دولة ومنطقة.
















