Авито открывает бесплатный доступ к своим нейросетям для онлайн-торговли

Авито открывает бесплатный доступ к своим нейросетям для онлайн-торговли

Авито выпускает в открытый доступ ИИ-модели для электронной коммерции, в создание которых компания инвестировала около полумиллиарда рублей.

Технологическая платформа Авито выпустила в открытый доступ обновленные версии собственных ИИ-моделей: текстовую A-Vibe и мультимодальную A-Vision. Это первые открытые нейросети от российской компании, которые создали специально для электронной коммерции и обучили работе с русским языком. На их разработку компания направила около полумиллиарда рублей.

Разработчики, стартапы и исследователи теперь могут использовать готовые инструменты для анализа документов, автоматизации контента и создания ИИ-ассистентов. По заявлению компании, эти модели сокращают затраты на запуск и эксплуатацию до 50% по сравнению с другими открытыми нейросетями. Модели оснащены собственным токенизатором и поддерживают функцию вызова внешних инструментов (function calling), что позволяет создавать автономные системы и агентов.

Текстовая модель A-Vibe заняла первое место в категории легких нейросетей в популярных открытых тестах на понимание русского языка, работу с кодом и решение сложных задач. Обе модели доступны под открытой лицензией Apache 2.0 для любого использования.

«Открытие наших генеративных ИИ-моделей — это инвестиция в будущее российской технологической экосистемы. Благодаря таким инициативам ИИ становится доступным не только корпорациям, но и студентам, стартапам, исследователям и небольшим командам. Чем больше разработчиков вовлечено в создание ИИ-решений, тем быстрее развивается вся отрасль. Мы хотим внести свой вклад в этот процесс», — рассказал управляющий директор по искусственному интеллекту «Авито» Андрей Рыбинцев.

Возможности моделей

Модели A-Vibe и A-Vision создала дочерняя компания Авито Тех на базе открытых моделей Qwen. Нейросети глубоко адаптировали под российский рынок. Команда разработала собственный токенизатор для русского текста, который, по их данным, ускоряет генерацию почти вдвое и делает результаты точнее, чем у зарубежных аналогов.

Модели обучали на реальных данных, в том числе из сферы электронной коммерции. Поэтому они хорошо понимают контекст онлайн-торговли и эффективно работают с товарными описаниями, каталогами и запросами покупателей без долгой дополнительной настройки.

Нейросети обрабатывают до 100 страниц текста за раз (32 тысячи токенов) и готовы к работе без сложной настройки. Они понимают простые команды вроде «сделай резюме документа» или «проанализируй таблицу». Поддержка вызова внешних инструментов позволяет создавать ИИ-агентов, которые не только отвечают на вопросы, но и самостоятельно выполняют действия: ищут информацию в базах данных, делают расчеты, обращаются к другим сервисам.

Кому полезны модели

  • Модели уже работают в сервисах Авито, а теперь стали доступны для образования, науки и бизнеса.
  • Бизнес сможет быстро внедрять ИИ с минимальными затратами: автоматизировать обработку документов, генерацию контента, создавать чат-ботов.
  • Разработчики смогут дообучать модели под свои задачи и экспериментировать, разворачивая их на своей инфраструктуре.
  • Образование — студенты и преподаватели получат доступ к промышленным ИИ-моделям для учебы и исследований.
  • Наука — исследователи смогут использовать их для изучения мультимодальных технологий.

«Рынок остро нуждается в качественных русскоязычных моделях с открытым кодом. Компании тратят месяцы на адаптацию зарубежных решений под российские реалии. Мы даем готовые инструменты, которые экономят миллионы рублей на разработке. Наши модели компактны и оптимизированы для эффективного использования ресурсов, что особенно важно для стартапов и образовательных инициатив», — отметила руководитель разработки больших языковых моделей «Авито» Анастасия Рысьмятова.

Сравнение с другими моделями

Поскольку большинство международных тестов созданы для английского языка, команда Авито перевела на русский четыре ведущих международных бенчмарка и также выложила их в открытый доступ:

  • MATH-500 — сложные математические задачи,
  • GPQA Diamond — научные вопросы высокого уровня,
  • DROP_RU — задачи на понимание текста,
  • BFCL V3 — оценка способности модели работать с внешними инструментами.

На российских бенчмарках MERA и RU Arena Hard модель A-Vibe заняла первое место в классе легких нейросетей, обогнав многие более крупные модели. A-Vision эффективно анализирует сложные документы, графики и изображения с текстом.

Модели доступны на платформе Hugging Face с подробной документацией. Команда также опубликовала техническую статью с деталями обучения и тестирования.

Сделать «TVTver.ru» основным источником новостей в Яндекс

Яндекс.Дзен

Подпишись и получай новости первым