IT-новости

Google DeepMind анонсировала Gemma 3 — эффективные AI-модели для различных задач

Google DeepMind представила новое поколение открытых AI-моделей — Gemma 3. Они сочетают высокую производительность с компактностью, что делает их оптимальными для работы даже на отдельных графических процессорах и TPU.

Характеристики Gemma 3
Серия включает четыре модели с числом параметров от 1 до 27 миллиардов. Несмотря на небольшой размер, они показывают результаты, превосходящие более крупные языковые модели, такие как Llama-405B и DeepSeek-V3, согласно первым тестам.

Многоязычность и мультимодальность
Модели поддерживают более 140 языков, при этом 35 из них работают без дополнительного обучения. Они способны анализировать текст, изображения (кроме версии 1B) и даже короткие видео. Контекстное окно достигает 128 000 токенов, что позволяет эффективно обрабатывать большие объемы информации.

Продвинутые технологии обучения
В основе Gemma 3 лежит дистилляция знаний, дополненная специализированным обучением с подкреплением. Такой подход усиливает их способности в области математики, понимания инструкций, ведения диалогов и многоязычного взаимодействия.

Эффективность и безопасность
Google впервые выпустила квантованные версии моделей, которые снижают потребление ресурсов без потери точности. Также разработчики заявляют, что Gemma 3 минимизирует генерацию дословных фрагментов текста и персональных данных. Проверить модели в работе можно через платформу BotHub.

Оценка качества и сравнение с конкурентами
Эксперты в сфере AI-чат-ботов присвоили Gemma 3-27B-IT рейтинг Эло 1338, включив её в топ-10 лучших моделей. Компактная Gemma 3-4B показала эффективность, сравнимую с более крупной Gemma 2-27B-IT, а 27B-модель в некоторых тестах соответствует уровню Gemini 1.5-Pro.

Дополнительные инструменты
Вместе с Gemma 3 Google представила ShieldGemma 2, модель с 4 миллиардами параметров, предназначенную для проверки контента на безопасность. Она выявляет потенциально опасные изображения, сцены насилия и откровенные материалы.

Доступность и поддержка
Модели Gemma 3 можно протестировать и использовать через Hugging Face, Kaggle и Google AI Studio. Они совместимы с PyTorch, JAX, Keras и работают на GPU NVIDIA, TPU Google Cloud и AMD. Разработчики также выпустили Gemma.cpp для работы на центральных процессорах.

Преподаватели могут получить до $10 000 облачных кредитов в рамках академической программы Google.

RU/KZ