Сбер разрабатывает собственную мультимодальную нейросеть, способную отвечать на вопросы пользователей, поддерживать диалог, писать программный код, также генерировать изображения по текстовому описанию. Пока доступ к ней предоставляется в режиме бета-тестирования по приглашениям.
Архитектура GigaChat основана на модели NeONKA (NEural Omnimodal Network with Knowledge-Awareness), которая включает различные нейросетевые модели и метод supervised fine-tuning, reinforcement learning with human feedback. Благодаря этому ИИ может поддерживать беседу, также писать тексты и отвечать на фактологические вопросы. За счет же присутствия в ансамбле модели Kandinsky 2.1 предусмотрена возможность создания изображений по текстовому описанию.
Сервис приводят как альтернативу ChatGPT, а в качестве конкурентных преимуществ указывают изначальную поддержку мультимодальности и более грамотное общение на русском языке. В блоге компании сообщается о планах публикации в открытый доступ модели NeONKA ru-GPT 3.5 с 13 миллиардами параметров. Главная цель – ускорение развития open-source-сообщества и технологий в области искусственного интеллекта.
Нейросеть уже внедряют в большинство продуктов и сервисов Сбера, и одним из первых стал виртуальный ассистент Салют. При этом первую версию платформы NeONKA оптимизировали по размеру и скорости для применения в высоконагруженных сервисах. В будущем для разработчиков и бизнеса откроют доступ к GigaChat через облачное API.
Комментарии