أطلقت Stability AI نموذج الذكاء الاصطناعي الجديد لتوليد الصور من النص Stable Cascade.
ويعتمد هذا النموذج على معمارية Würstchen، وهي معمارية تحويل النص إلى صورة لنماذج Diffusion. وتجمع هذه المعمارية بين الأداء التنافسي والفعالية غير المسبوقة من ناحية التكلفة لنماذج Diffusion.
ويتميز Stable Cascade بقدرته على الالتزام الوثيق بمطالبات المستخدم، وهي ميزة أبرزها مجتمع الذكاء الاصطناعي HackerNews لدقتها في توليد الصور ذات الصلة.
ويشير مستخدمو HackerNews إلى أن هذا النموذج يتميز بسرعته، إذ يقدم تحسنًا كبيرًا في أوقات المعالجة دون التضحية بجودة المخرجات، ويلبي الحاجة الماسة إلى الكفاءة في المهام التي تعتمد على الذكاء الاصطناعي.
كما أنه متاح للاستخدام غير التجاري، ويقدم عملية من ثلاث مراحل مصممة للعمل بكفاءة عبر الأجهزة الاستهلاكية.
ويختلف نموذج Stability AI الجديد عن النماذج السابقة Stable Diffusion لأنه يستخدم نظامًا ثلاثي الأجزاء لضغط الصور وتوليدها.
وعلى عكس النماذج الرائدة Stable Diffusion، فإن Stable Cascade ليس نموذجًا لغويًا واحدًا كبيرًا، بل إنه ثلاثة نماذج مختلفة تعتمد على معمارية Würstchen.
ويسمح هذا بتقليل الموارد اللازمة للتدريب. ويتكون النموذج من المراحل A و B و C، مع تركيز المرحلة C على توليد نسخة مضغوطة من الصورة التي يجري توسيعها بعد ذلك في المرحلتين A و B.
وتحول المرحلة C المطالبات النصية إلى أجزاء صغيرة من التعليمات البرمجية التي تمرر بعد ذلك إلى المرحلتين A و B لفك تشفير الطلب.
ويؤدي تقسيم الطلبات إلى أجزاء صغيرة إلى تقليل الذاكرة المطلوبة والعمل بسرعة.
وأصدرت Stability AI أيضًا أدوات للتدريب وتخصيص النموذج، ويشمل ذلك نصوص برمجية للضبط الدقيق والتعديلات الأخرى، وهي متوفرة عبر صفحة Stability GitHub.
ويدعم النموذج مزايا، مثل اختلافات الصورة وتوليد صورة من صورة، مما يزيد من تنوعه.
ويستطيع النموذج تحرير جزء معين فقط من الصورة، بالإضافة إلى Canny Edge، وهي ميزة تتيح للمستخدمين توليد صورة جديدة باستخدام حافات الصورة الموجودة.
وأظهر Stable Cascade في اختبارات المقارنة نتائج فضلى فيما يتعلق بالسرعة والجودة مقارنةً بالنماذج الأخرى، حتى تلك التي تحتوي المزيد من المعلمات.
ويوفر النموذج خيارات متنوعة للمستخدمين، ويشمل ذلك أحجام النماذج المختلفة لاستيعاب قدرات الأجهزة المختلفة.
وأتاحت Stability AI جميع التعليمات البرمجية ذات الصلة للمستخدمين من أجل تعديلها وتجربتها.
ويتضمن ذلك مزايا لتحسين الصور وتوليد صور من الرسومات وزيادة دقة الصورة.
في حين أن Stable Cascade ليس للاستخدام التجاري، فإن Stability AI تقترح نماذج أخرى للمهتمين بالتطبيقات التجارية.