Google представила Gemini 2.0 Flash и ИИ-агентов
16:24, 13.12.2024
Gemini 2.0 Flash: мощь и скорость
Google анонсировала новую модель Gemini 2.0 Flash, которая превзошла своего предшественника Gemini 1.5 Pro по производительности, скорости работы и мультимодальности. Модель стала вдвое быстрее, поддерживает мультимодальный вывод, включая генерацию изображений, аудио с текстом и преобразование текста в речь. Она принимает на вход изображения, видео и аудио, а также может вызывать сторонние инструменты, например, Google Search или для выполнения кода.
Для разработчиков Gemini 2.0 Flash доступна в AI Studio и Vertex AI, а также представлен новый API Multimodal Live с поддержкой потокового видео и аудио в реальном времени. Появление модели в пользовательском приложении Gemini запланировано на январь 2025 года.
Инновационные ИИ-агенты от Google
Вместе с Gemini 2.0 Flash Google представила проекты с агентными возможностями:
- В Project Astraреализована поддержка многоязычного общения, включая смешанные языки, и возможность использования Google Search, Lens и Maps.
- Project Marinerпомогает анализировать и интерпретировать данные в браузере, демонстрируя эффективность в 83,5%.
- Jules — инструмент для разработки кода, интегрированный с GitHub, упрощает рабочий процесс программистов, позволяя планировать и решать задачи под контролем пользователя.
- Новый инструмент Deep Researchот Google позволяет привлекать Gemini для поиска данных в интернете и создания подробных аналитических отчетов.