Компания DeepSeek выпустила мультимодальную нейросеть Janus-Pro-7B, которая может распознавать и генерировать изображения. Заявлено, что нейросеть в бенчмарках выдает показатели лучше, чем DALL-E 3 от OpenAI и Stable Diffusion.
Janus Pro является улучшенной версией ИИ-модели Janus, которая была выпущена несколько ранее. В данной версии разработчики оптимизировали стратегию обучения, увеличили датасет и масштабировали размер самой нейросети. Благодаря этому она отлично справляется с генерацией картинок по текстовому описанию, также с их анализом.
Источник: DeepSeek
Однако текущая версия может генерировать изображения с разрешением 384 × 384 пикселей, что ниже стандартов современных моделей.
Модель машинного обучения Janus-Pro-7B опубликована на площадке Hugging Face. Команда призывает сторонних исследователей и разработчиков присоединиться к проекту. Код модели открыт и распространяется по лицензии MIT, а сама нейросеть доступна по лицензии DeepSeek.
Напомним, что в этом же месяце DeepSeek выпустили приложение с бесплатным чат-ботом на iOS и Android. При этом функционал его аналогичен его главному конкуренту ChatGPT, включая такие задачи, как обработку информационных запросов, помощь в обучении, творчество, планирование и организация и так далее.
Комментарии