Llama 4 — новая языковая модель, выпущенная 5 апреля 2025 года с рекордным контекстным окном в 10 миллионов токенов. Включает три версии: Scout, Maverick и Behemoth, каждая из которых ориентирована на разные задачи и пользователей. Подходит для анализа больших данных, программирования и исследований, предлагая беспрецедентную скорость и доступность, обходя в бенчмарках ChatGPT и DeepSeek.
Что умеет Llama 4
Нейросеть Llama 4 разработана с использованием 100 тысяч ускорителей Nvidia H100, что в 4 раза больше, чем для Llama 3. Модель применяет технологию смеси экспертов MoE и обучение в формате FP8, ускоряя обработку данных на 30%. Доступна с открытым исходным кодом, благодаря чему привлекла уже 500 тысяч разработчиков за первую неделю после релиза.
- Генерирует текст из 10 миллионов токенов контекста.
- Анализирует книги объемом до 5 тысяч страниц.
- Создает код быстрее DeepSeek v3.1 на 40%.
- Обрабатывает изображения и аудио через раннюю мультимодальность.
- Выполняет задачи с учетом 15 триллионов токенов обучения.
- Дистиллирована из старшей модели для оптимизации скорости.
- Поддерживает 20 языков с точностью перевода 95%.
Модель Llama Maverick уже используется в 12 крупных IT-компаниях для автоматизации разработки, что сократило время написания кода на 25%.
Как пользоваться Llama 4
Нейросеть доступна через официальный сайт в виде веб-приложения и загружаемых моделей для локального использования на компьютерах с GPU от 16 ГБ. На территории России и в ряде других стран могут потребоваться средства обхода региональных ограничений в сети. Инструкция ориентирована на базовую версию Scout. Чтобы запустить нейросеть, небходимо:
- Зарегистрироваться на сайте Llama.
- Скачать модель Scout на 4 ГБ.
- Установить Python 3.10 или выше.
- Запустить скрипт через терминал.
- Ввести запрос в интерфейсе.
- Получить ответ за 3-5 секунд.
Llama 4 бесплатно работает полностью и без ограничений, включая все версии. Доступна на английском с поддержкой еще 19 языков. OpenSource-лицензия позволяет свободно модифицировать код. Llama 4 на русском понимает любые запросы без каких-либо сложностей.
Особенности
- контекст в 80 раз больше Llama 3;
- обучена на 2 триллионах параметров;
- превосходит GPT-4o в 7 бенчмарках;
- использует MoE для экономии ресурсов;
- поддерживает книги до 10 млн токенов;
- Maverick пишет код за 2 секунды;
- Scout запускается на ноутбуках с ОЗУ от 16 ГБ;
- мультимодальность обрабатывает текст и графику;
- переводит с точностью до 95%;
- работает полностью бесплатно.
*Meta - запрещена на территории РФ.