Реклама ООО Таймвэб
Реклама ООО Таймвэб
Реклама ООО Таймвэб

Что нового показала Google на презентации для разработчиков I/O 2024

Обсудить
Что нового показала Google на презентации для разработчиков I/O 2024
Реклама. ООО «ТаймВэб». erid: LjN8KKUT7

14 мая прошла традиционная презентация для разработчиков Google I/O 2024, на которой компания ежегодно представляет новинки устройств и технологий. Ожидался выход обновленной версии Android 15 и новые смартфоны Pixel, однако вместо этого преобладали разработки в области искусственного интеллекта. Подробнее о них расскажем далее.

Модель для создания изображений Imagen 3

Компания презентовала новую генеративную модель Imagen 3, которая создает изображения по текстовому запросу. В качестве ее преимуществ отмечается высокий уровень детализации, генерация реалистичных изображений с меньшим количеством артефактов – по сравнению с прошлыми версиями. Модель понимает естественный язык и позволяет в запросе уточнять детали, а также стилистику изображений.

Как работает Imagen 3

Пример работы Imagen 3. Источник: Google (здесь, далее и на обложке)

Пока Imagen 3 доступен для избранных авторов по программе предварительного тестирования в ImageFX и при вступлении в список ожидания. Планируется внедрение новой модели в Vertex AI.

Комьюнити теперь в Телеграм
Подпишитесь и будьте в курсе последних IT-новостей
Подписаться

Veo: генерация видео с помощью ИИ

Новая генеративная модель Veo, «ответ Google на Sora от OpenAI», как пишет The Verge, создает видео длительностью более минуты и разрешением 1080p в разных кинематографических и визуальных стилях. Нейросеть воспринимает запросы на естественном языке, при этом может улавливать детали по длинным подсказкам. На кадрах видно плавную смену кадров, позволяя таким образом создавать эффект реалистичного движения.

Пример работы Veo

Пример работы Veo

На данный момент Google предлагает кинематографистам и авторам отправить запрос для попадания в список ожидания и принять участие в закрытом предварительном тестировании в VideoFX.

Поиск по видео в Google Lens

В Google Lens теперь можно искать не только по фотографиям, но и по видео. Для этого интересующий объект можно отснять, задать уточняющие вопросы, а затем отправить запрос. Уже после этого ИИ Google начнет искать нужную информацию.

В качестве примера во время презентации был показан фрагмент, где выступающая засняла неработающий виниловый проигрыватель, затем задала вопрос сервису о возможных причинах. В результате ей были предложены варианты проблемы и их решения.

Project Astra

Astra – это многофункциональный ИИ-помощник, который компания в будущем предполагает превратить в виртуального ассистента. Взаимодействие с ним производится через камеру устройства. Благодаря этому он сможет проводить наблюдение, запоминать местоположение вещей и выполнять задачи от имени пользователя.

Обновление флагманского ИИ Gemini

На презентации была продемонстрирована версия Gemini 1.5 Flash, названная самой быстрой в серии и работающая на базе API. Она направлена на обработку больших объемов информации и высокочастотных задач в широком масштабе. 1.5 Flash может делать краткие пересказы, работает в режиме чата, создает субтитры к изображениям и видео, извлекает информацию из длинных документов и таблиц и многое другое.

Была значительно улучшена модель Gemini 1.5 Pro. Теперь она лучше выполняет такие задачи, как создание кода, планирование и логическое рассуждение, многоэтапные разговоры. Создатели добавили обработку нейросетью аудио и изображений, также длинное контекстное окно вместительностью до 2 млн токенов, позволяющее давать более сложные инструкции. Gemini 1.5 Pro предполагается интегрировать в продукты Google, включая Gemini Advanced, и в приложения Workspace. Обновление станет доступно платным подписчикам в следующем месяце.

Gemini Live позволит пообщаться с Gemini, где он выступит в роли собеседника. Нейросеть даст ответы на вопросы, расскажет, что видит вокруг, определяя объекты через камеру в режиме реального времени. Речь идет не только о камере смартфонов, но и про очки. Данная функция пока находится в разработке.

Обновление Google Search

В поисковой системе в будущем будет внедрена функция AI Overviews. При вводе запросов она создаст страницы результатов с краткими ответами из интернета. Для этого сервис выберет ссылки, отображаемые в выдаче по запросу и по которым зафиксировано больше кликов. Новинка станет доступна для всех пользователей в США на этой неделе.

Что еще интересного

Помимо вышеперечисленного, в презентации фигурировали другие важные новинки и обновления:

  • SynthID. Это водяные знаки, с помощью которых предполагается маркировать фотографии, видео и даже музыку. Это решение направлено на борьбу с дипфейками и защиту авторских прав.
  • Circle to Search. Функция помогает пользователям решать сложные математические задачи, разбивая их на шаги. Для этого потребуется выделить объект, после система выдаст подсказку.
  • Google Gems. Представляется как персонифицированный ассистент для пользователей платной версии Gemini Advanced.
  • Gemini Nano. Это ассистент, которого интегрируют в Chrome на десктопных версиях. Предполагается, что с его помощью можно будет создавать тексты для социальных сетей, заметки и многое другое, причем прямо в окне браузера.
Если человек настраивает сервер, это не новость; новость – если сервер настраивает человека.
Новый подкаст от Timeweb

Комментарии

С помощью соцсетей
У меня нет аккаунта Зарегистрироваться
С помощью соцсетей
У меня уже есть аккаунт Войти
Инструкции по восстановлению пароля высланы на Ваш адрес электронной почты.
Пожалуйста, укажите email вашего аккаунта
Ваш баланс 10 ТК
1 ТК = 1 ₽
О том, как заработать и потратить Таймкарму, читайте в этой статье
Чтобы потратить Таймкарму, зарегистрируйтесь на нашем сайте