Добавить новость

Российские ученые создали новый метод обучения больших языковых моделей

PR-compositions
745

Исследователи создали новый метод обучения больших языковых моделей, позволяющий развивать их способность к логическим рассуждениям без высоких затрат. Метод снижает стоимость и проясняет механизм освоения навыков рассуждений моделями.

В отличие от стандартных методов обучения с подкреплением, требующих корректировки миллиардов параметров модели, предложенное решение использует компактные векторы-настройки. Эти векторы действуют как регуляторы, усиливающие корректные логические цепочки в предобученной модели без необходимости ее полного переобучения.

Эффективность метода была проверена на шести международных тестовых наборах задач по математическим рассуждениям. В ходе тестирования моделей серий Qwen2.5 и LLaMa3.1 было достигнуто сохранение качества при изменении только 0,0016% параметров. Полученные результаты свидетельствуют о возможности развития сложных навыков рассуждения при минимальном вмешательстве в архитектуру модели.

Основным преимуществом метода является его эффективность при незначительных вычислительных затратах. Для модели объемом 14 миллиардов параметров изменения затрагивают лишь несколько сотен тысяч компонентов. Это позволяет сократить время отдельных этапов обучения с десятков минут до секунд и уменьшает требования к объему памяти с гигабайтов до сотен килобайт.

Предлагаемый метод также обеспечивает повышенную интерпретируемость работы модели. Проведенный анализ показывает, что векторы-настройки усиливают значимость ключевых слов логических конструкций, предоставляя исследователям дополнительный инструмент для анализа процессов рассуждения в модели.

Разработка была представлена на международной конференции EMNLP 2025 в Сучжоу. Технология совместима с существующими платформами и может быть интегрирована в различные системы, включая чат-боты, системы проверки кода и аналитические платформы. Благодаря умеренным вычислительным требованиям метод делает технологии логического мышления более доступными для академических учреждений и небольших компаний.

Метод может найти применение при создании интеллектуальных ассистентов для различных предметных областей, включая точные науки, программирование и медицинскую аналитику. По словам представителя исследовательской группы Вячеслава Синего, данный подход открывает новые возможности для развития доступного искусственного интеллекта, демонстрируя возможность формирования сложных навыков рассуждения без масштабного изменения параметров модели.

Источник

Этот материал опубликован пользователем сайта через форму добавления новостей.
Ответственность за содержание материала несет автор публикации. Точка зрения автора может не совпадать с позицией редакции.

Все новости Климовска на сегодня

Другие новости Климовска


Другие города Московской области

Все новости сегодня
















Moscow.media (Москва.Медиа) — региональный паблик медиа-новостей Москвы и Московской области (в том числе и в Климовске) на основе уникальной технологичной новостной информационно-поисковой системы с элементами искусственного интеллекта, гео-отбора и возможностью мгновенной публикации авторского контента в режиме Free Public от Smi24.net и "аксакала" новостей онлайн 103new.com.

Moscow.media — тематический гео-мониторинг медиапространства более 20 000 источников ежеминутно, в деталях. Москва.медиа — все Ваши новости сегодня и сейчас в Климовске онлайн.

Опубликовать свою новость в Климовске и в любом городе, регионе, стране на любом языке можно мгновенно — здесь.

Rss.plus

Климовск на Ria.city

Светские новости (слухи, сплетни, сарафанное радио, шоу-бизнес, рейтинги)


Власть


Россия


Жизнь


Блоги


Развлечения


Сегодня в мире


Другие новости сегодня




Все города России от А до Я

Мы собрали ВСЁ, что интересно по этому поводу — СЕГОДНЯ