Sber رسميًا أدخلت الشبكة العصبية كاندينسكي. هذه نسخة محسّنة من نظام ruDALL-E متعدد الوسائط ، والذي يُنشئ صورًا وفقًا للوصف وقد تم طرحه العام الماضي.
لاحظ المطورون أنهم كانوا قادرين على تحسين جودة هذا النموذج بشكل كبير من خلال إعادة تدريبه على 179 مليون صورة بأوصاف نصية. يمكن لـ Kandinsky إنشاء صور ذات نسبة عرض إلى ارتفاع عشوائية ، ويمكنه أيضًا استخدام طريقة جديدة لزيادة الدقة.
يتم إنشاء الصورة على ثلاث مراحل:
- أولاً ، تنشئ شبكة عصبية واحدة (Kandinsky) عددًا معينًا من الصور وفقًا للوصف.
- ثم يختار الثاني (ruCLIP Large) الأكثر نجاحًا والأكثر صلة بالوصف النصي المحدد للعمل.
- وبعد الثالث يزيد حجم الصورة.
الميزة المميزة لنموذج Kandinsky مقارنة بالإصدارات السابقة هي درجة أعلى من التفاصيل في الصور التي تم إنشاؤها.
يمكن لأي شخص تجربة شبكة Kandinsky العصبية. وهي متوفرة في تطبيق Salyut للهاتف المحمول وعلى أجهزة Sberbank الذكية بناءً على طلب “Turn on the artist”.
سيطلب منك Kandinsky أن تقول وصفًا ، وبعد بضع دقائق سيعود بتسعة خيارات للصور. يبقى فقط اختيار واحد منهم لزيادة الحجم.
appbox الاحتياطي https://apps.apple.com/ru/app/салют-виртуальные-ассистенты/id1520007827
اقرأ أيضا 🧐