DeepSeek выпустила мультимодальную нейросеть Janus-Pro-7B

Обсудить

Реклама. АО «ТаймВэб». erid: 2W5zFG4a2cx

Компания DeepSeek выпустила мультимодальную нейросеть Janus-Pro-7B, которая может распознавать и генерировать изображения. Заявлено, что нейросеть в бенчмарках выдает показатели лучше, чем DALL-E 3 от OpenAI и Stable Diffusion.

Janus Pro является улучшенной версией ИИ-модели Janus, которая была выпущена несколько ранее. В данной версии разработчики оптимизировали стратегию обучения, увеличили датасет и масштабировали размер самой нейросети. Благодаря этому она отлично справляется с генерацией картинок по текстовому описанию, также с их анализом.

Как справляется с генерацией картинок ИИ-модель Janus-Pro-7B от DeepSeek

Источник: DeepSeek

Однако текущая версия может генерировать изображения с разрешением 384 × 384 пикселей, что ниже стандартов современных моделей.

Модель машинного обучения Janus-Pro-7B опубликована на площадке Hugging Face. Команда призывает сторонних исследователей и разработчиков присоединиться к проекту. Код модели открыт и распространяется по лицензии MIT, а сама нейросеть доступна по лицензии DeepSeek.

Напомним, что в этом же месяце DeepSeek выпустили приложение с бесплатным чат-ботом на iOS и Android. При этом функционал его аналогичен его главному конкуренту ChatGPT, включая такие задачи, как обработку информационных запросов, помощь в обучении, творчество, планирование и организация и так далее.

Новости

Если человек настраивает сервер, это не новость; новость – если сервер настраивает человека.

Новый подкаст от Timeweb

DeepSeek выпустила мультимодальную нейросеть Janus-Pro-7B

Комментарии

Рекомендуем