Корпорация Google выпустила Gemma 2B и 7B – языковые модели с открытым исходным кодом с 2 и 7 млн параметров соответственно. При их создании использовались методы и технологии, ранее задействованные в закрытой Gemini.
Сторонние разработчики могут использовать некоторые инструменты для обучения моделей и применения их в своих проектах, такие как Colab, Kaggle, также интеграцию с Hugging Face, MaxText, Nvidia NeMo и TensorRT-LLM.
Как пишет Хабр, предварительно обученные и настроенные модели доступны для запуска как локально, так и в облаке Vertex AI и Google Kubernetes Engine (GKE). Их дополнительно оптимизировали для работы на графических процессорах Nvidia и Google Cloud TPU.
Источник: блог Google (здесь и на обложке)
Воспользоваться моделями Gemma можно будет по коммерческой лицензии независимо от размера организации, числа пользователей или типа проекта. Компания Google также запретила использовать их для некоторых задач, например, разработки оружия.
Языковые модели Gemma хоть и не столь сложны по сравнению с флагманской версией, но отличаются высокой скоростью работы и низкой стоимостью развертывания. Заметим, что если Gemini считается прямым конкурентом OpenAI от ChatGPT, то Gemma подходит для решения относительно небольших задач, таких как простые чат-боты или подготовка сводок текста.
Комментарии