Предстоящие функции Google Gemini: Взгляд в будущее

Компания Google представила долгожданный шаг — интеграцию своей мощной модели искусственного интеллекта Gemini в широкий спектр своих продуктов и сервисов. Представленная на конференции для разработчиков I/O 2024, Gemini изменит способ взаимодействия пользователей с экосистемой Google, от поиска и Gmail до YouTube и Android.

App Interactions: Новый уровень взаимодействия с помощью ИИ

Одним из ключевых моментов интеграции Gemini является возможность более удобного взаимодействия с приложениями. Вскоре пользователи смогут обращаться к Gemini для выполнения различных задач, например перетаскивания сгенерированных ИИ изображений в сообщения. Кроме того, пользователи YouTube смогут нажимать кнопку «Спросить это видео», чтобы получить конкретную информацию от ИИ в самом видео, что еще больше улучшит впечатления от просмотра.

Gemini в Gmail: Оптимизация задач электронной почты

Интеграция Gemini принесет пользу и почтовой платформе Google, Gmail. Пользователи смогут использовать ИИ-помощника для поиска, обобщения и даже составления черновиков писем. ИИ также сможет выполнять действия с письмами для решения более сложных задач, например, помогать в оформлении возвратов товаров электронной коммерции, осуществляя поиск в почтовом ящике, находя квитанцию и заполняя онлайн-формы.

Gemini Live: Беседа с помощником ИИ

Google также представила новый опыт под названием Gemini Live, в котором пользователи могут участвовать в «глубоких» голосовых чатах с ИИ на своих смартфонах. Чатбота можно прервать на полуслове для уточнения ответа, и он будет адаптироваться к особенностям речи пользователей в режиме реального времени. Кроме того, Gemini может видеть и реагировать на окружающую обстановку с помощью фотографий или видео, снятых на устройство, что еще больше расширяет возможности интерактивного общения.

Мультимодальные достижения: Расширение возможностей ИИ

Google также работает над созданием интеллектуальных агентов ИИ, которые могут рассуждать, планировать и выполнять сложные многоэтапные задачи под контролем пользователя. Эти мультимодальные агенты ИИ могут обрабатывать широкий спектр входных данных, включая текст, изображения, аудио и видео, что позволяет им решать более сложные задачи.
Среди первых примеров использования этих мультимодальных технологий — автоматизация возврата покупок и изучение новых городов, где ИИ может использовать различные источники данных для оказания всесторонней и индивидуальной помощи.

Будущее Android и экосистемы искусственного интеллекта Google

Помимо вышеупомянутых обновлений, Google также раскрыла планы по замене Google Assistant на Android на Gemini, который будет полностью интегрирован в мобильную операционную систему. Эта интеграция позволит пользователям получать доступ к расширенным возможностям Gemini прямо со своих Android-устройств.
Кроме того, новая функция «Спросить фотографии» позволит пользователям осуществлять поиск в своей фототеке с помощью запросов на естественном языке, созданных Gemini. ИИ сможет понимать контекст, распознавать объекты и людей и даже обобщать фотовоспоминания в ответ на вопросы.
Карты Google также получат преимущества от интеграции Gemini: платформа будет отображать резюме мест и областей, созданные искусственным интеллектом, используя данные картографии платформы.
Поскольку технологический гигант продолжает расширять границы искусственного интеллекта, интеграция Gemini в его основные продукты и сервисы обещает пересмотреть способы взаимодействия пользователей с экосистемой Google, предлагая заглянуть в будущее интеллектуальных и контекстных вычислений.