Компания Google DeepMind объявила о скором включении мультимодальной модели Gemini Omni Flash в API для разработчиков. Модель заняла первое место в рейтинге Video Arena, опередив конкурентов по качеству обработки видео.
Google DeepMind представила обновлённые данные о производительности своей мультимодальной модели Gemini Omni Flash. Согласно опубликованным результатам, модель возглавила бенчмарк Video Arena — специализированный тест для оценки возможностей ИИ в анализе и генерации видеоконтента. В рейтинге Omni Flash опередила аналогичные решения от других разработчиков, включая модели конкурентов.
Объявление о лидерстве совпало с анонсом интеграции модели в API для разработчиков. Как уточнили представители Google DeepMind, доступ к Gemini Omni Flash через программный интерфейс откроется в ближайшее время. Это позволит сторонним компаниям и исследователям использовать модель в собственных приложениях, включая инструменты для работы с видео, аудио и текстом.
Gemini Omni Flash позиционируется как облегчённая версия флагманской модели Gemini, оптимизированная для задач, требующих высокой скорости обработки данных при сохранении точности. В Google DeepMind подчёркивают, что модель демонстрирует сбалансированные результаты в мультимодальных сценариях, что подтверждается независимыми тестами.
Ранее компания уже предоставляла доступ к отдельным версиям Gemini через API, однако включение Omni Flash расширит возможности разработчиков в области обработки видеоконтента. Подробности о технических характеристиках и условиях использования модели будут опубликованы в официальном блоге Google DeepMind.