Авито выпускает в открытый доступ ИИ-модели для электронной коммерции

Технологическая платформа Авито выпускает в опенсорс обновленные версии собственных ИИ-моделей: текстовую A-Vibe и мультимодальную A-Vision с 8 млрд параметров. Это первые открытые нейросети от российской компании, обученные специально для электронной коммерции и адаптированные под русский язык. Разработчики, стартапы, бизнес и исследователи смогут получить готовые инструменты для анализа документов, автоматизации контента и создания ИИ-ассистентов, сокращая затраты на запуск и работу моделей до 50% в сравнении с другими опенсорс-нейросетями.

Модели оснащены собственным токенизатором и поддерживают возможность вызова внешних инструментов (function calling) для создания автономных систем и агентов. В разработку компания проинвестировала около полумиллиарда рублей, включая затраты на оборудование, команду и эксперименты. A-Vibe заняла первое место в классе легких нейросетей в популярных открытых тестах на понимание русского языка, работы с кодом и решение сложных задач. Модели доступны под открытой лицензией Apache 2.0 для любого использования.

"Открытие наших генеративных ИИ-моделей — это инвестиция в будущее российской технологической экосистемы. Благодаря таким инициативам ИИ становится доступным не только корпорациям, но и студентам, стартапам, исследователям и небольшим командам. Чем больше разработчиков вовлечено в создание ИИ-решений, тем быстрее развивается вся отрасль. Мы хотим внести свой вклад в этот процесс", — Андрей Рыбинцев, управляющий директор по искусственному интеллекту "Авито".

Возможности моделей

Текстовая A-Vibe и мультимодальная A-Vision созданы Авито Тех, дочерней технологической компанией Авито, на базе открытых моделей Qwen3 и Qwen2.5-VL с 8 млрд параметров, и глубоко адаптированы под российский рынок. Команда Авито разработала собственный токенизатор для русского текста — это ускоряет генерацию текста почти вдвое и делает результаты точнее, чем у зарубежных аналогов.

Модели обучались на реальных данных, в том числе из электронной коммерции. Поэтому они понимают контекст онлайн-торговли и эффективно работают с товарными описаниями, каталогами, запросами покупателей — без долгой адаптации под конкретный бизнес.

Нейросети работают с большими объемами текста — до 100 страниц за раз (32 тысячи токенов). Они готовы к использованию без сложной настройки: понимают простые команды, например: "сделай резюме документа" или "проанализируй таблицу" без дополнительных инструкций. Поддержка вызова внешних инструментов (function calling) позволяет создавать ИИ-агентов, которые не только отвечают на вопросы, но и сами выполняют действия за пользователя: ищут информацию в базах данных, делают расчеты, обращаются к другим сервисам по API.

Для каких задач будут полезны модели

Модели уже внедрены во многие сервисы Авито и теперь становятся доступными для образования, науки и бизнеса. Они подойдут как небольшим командам и стартапам, так и крупным компаниям или исследовательским центрам.

  • Бизнес сможет быстро внедрять ИИ с минимальными затратами: автоматизировать обработку документов, генерацию контента, создать чат-бота для клиентов.
  • Разработчики получат возможность дообучать модели под конкретные задачи и экспериментировать, разворачивая их на своей инфраструктуре без больших затрат.
  • Образование — студенты и преподаватели смогут работать с промышленными ИИ-моделями в обучении и исследованиях.
  • Наука — исследователи получат новые инструменты для изучения мультимодальных технологий и развития российской экосистемы ИИ.

"Рынок остро нуждается в качественных русскоязычных моделях с открытым кодом. Компании тратят месяцы на адаптацию зарубежных решений под российские реалии. Мы даем готовые инструменты, которые экономят миллионы рублей на разработке. Наши модели компактны и оптимизированы для эффективного использования ресурсов, что особенно важно для стартапов и образовательных инициатив", — Анастасия Рысьмятова, руководитель разработки больших языковых моделей "Авито".

Сравнение с другими популярными моделями

Большинство международных тестов для оценки языковых моделей созданы для английского языка и не подходят для объективной оценки качества работы на русском. Команда Авито перевела на русский четыре ведущих международных бенчмарка и выложила их в открытый доступ для всех разработчиков русскоязычных моделей:

  • MATH-500 — сложные математические задачи школьного и вузовского уровня, требующие многошагового решения
  • GPQA Diamond — научные вопросы уровня кандидата наук по физике, биологии, химии и другим дисциплинам
  • DROP_RU — задачи на понимание текста с рассуждениями и вычислениями
  • BFCL V3 — оценка способности модели работать с внешними инструментами для создания ИИ-агентов.

На популярных российских бенчмарках MERA и RU Arena Hard модель A-Vibe заняла первое место в классе лёгких нейросетей и опередила многие более крупные модели. Она показала сильные результаты в работе с кодом и отраслевых задачах. A-Vision эффективно справляется с анализом сложных документов, графиков, изображений с текстом и научных схем.

Модели доступны на платформе Hugging Face с подробной документацией и примерами использования. Команда также опубликовала техническую статью с разбором обучения и тестирования.

Последние комментарии

Микаэлло Франчини 26 января 2022 09:22 На Volga boat show в Тольятти покажут яхты, катера и другую водомоторную технику

А за границей как можно взять в аренду яхту? Большие планы на отпуск и морское путешествие в том числе.

Василий Бандитов 21 мая 2021 12:31 АвтоВАЗ нашел нового партнера в Казахстане

Хоть в Казахстане приглянулись наши ВАЗ....

Фото на сайте

Все фотогалереи

Новости раздела

Все новости
Архив
Пн Вт Ср Чт Пт Сб Вс
29 30 1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31 1 2