• Виктор
  • Статьи
  • 1 мин. чтения

Российские ученые представили новую архитектуру быстрых языковых моделей


© Wallpaper Flare

ReBased требует меньше вычислительных ресурсов и ускоряет работу с длинным текстом, почти не теряя в качестве. Это важно для широкого коммерческого внедрения языковых моделей, а также имеет значение для экологии. Более низкая нагрузка на вычислительные мощности позволит сократить энергопотребление, а значит, работа крупных дата-центров будет меньше сказываться на окружающей среде.

В новой разработке ученые T-Bank AI Research проанализировали и откорректировали архитектуру Based, которую в конце 2023 года представили стэнфордские ученые. Они доработали механизм извлечения информации из текста, добавив новые обучаемые параметры, отвечающие за оптимальный поиск взаимосвязей между частями текста. Другое усовершенствование упростило алгоритм выделения информации из текста, что повысило производительность и качество работы архитектуры. В результате понимание взаимосвязей в тексте в среднем улучшилось на 10%.

Новая архитектура может снизить издержки на использование ИИ для специализированных задач с конкретной областью применения и рядом особенностей, которые нужно учитывать. Как пример — в области медицины это может быть классификация текстов на основе симптомов и диагнозов.

Основанные на ReBased модели менее требовательны к ресурсам, но при этом качество генерируемых текстов практически не страдает.

Специалисты T-Bank AI Research провели эксперименты на датасете MQAR (Multi-Query Associative Recall), позволяющем оценить способность модели к контекстуальному обучению, а именно к ассоциативному запоминанию (запоминанию не связанных пар объектов), например: лицо человека — его имя.

Подробное описание модели и результаты экспериментов они опубликовали в статье Linear Transformers with Learnable Kernel Functions are Better In-Context Models. Исходный код и дополнительные материалы доступны на GitHub.

Ученые представили это исследование на 63-й Международной ежегодной конференции по компьютерной лингвистике (ACL). Она прошла в Бангкоке (Таиланд) с 11 по 16 августа 2024 года и считается главным научным мероприятием в области обработки естественного языка в мире.

Выдержки из работы в своих статьях приводили представители Принстонского университета и Университета Карнеги-Меллона — одни из самых известных исследователей эффективности ИИ. Их наработки применяются почти во всех языковых моделях.

Ученые T-Bank AI Research убеждены, что в перспективе линейные модели, подобные ReBased, будут использоваться все чаще в комбинации с трансформерами в качестве составной части гибридных архитектур, поскольку они сочетают в себе скорость и высокое качество выполнения задач.


Источник: https://naked-science.ru/article/hi-tech/rossijskie-uchenye-predst


Source: https://lib.zaplata.ru/hi-tech/rossiiskie-ychenye-predstavili-novyu-arhitektyry-bystryh-iazykovyh-modelei.html

Межтекстовые Отзывы
Посмотреть все комментарии
guest

Пентагон использовал чат-боты для управления боевыми действиями в StarCraft II 

Скриншот из StarCraft II / © Blizzard Games Американские военные уже давно изучают потенциал использования технологий искусственного интеллекта...

Первый человек с чипом Neuralink смог управлять курсором «силой мысли»

Мозговой имплант Neuralink / © Neuralink Илон Маск еще в феврале 2021 года объявил об успешной имплантации беспроводного...

Скрытые перья подсказали, как создать самолет, которому не угрожает штопор

Установленные на самолете закрылки показали свою эффективность во время испытаний / @ Lori M. Nichols Инженеры из Принстонского...

Создан генератор, который вырабатывает электроэнергию за счет падения капель дождя

Схема работы нового генератора. Установка чем-то напоминает кастрюлю с неодимовым магнитом и крышкой из водоотталкивающей магнитной пленки, которая...

Гигантская экономия: как исследователи из Сибири снизят расход топлива самолетов

С.н.с ИТПМ СО РАН Андрей Иванов и доктор физ.-мат.наук, член-корреспондент РАН Андрей Бойко на фоне аэродинамической трубы Т-324...

Только «плохие» научные работы показали влияние радиоволн на живые организмы, а качественные — нет

Рабочие выполняют монтаж вышки сотовой связи в Сиднее, Австралия / © Dan Himbrechts, AAP Image, Reuters Свежее исследование...

Утконосы вдохновили ученых на создание мультирецепторной искусственной кожи

© Joel Sartore, National Geographic Photo Ark Инженеры и ученые разработали множество систем, имитирующих органы. Многие из них...

Нейросеть выстроила тактику футбольного матча лучше тренера

Матч Английской Премьер-Лиги между командами «Манчестер Сити» и «Ливерпуль» / © globallookpress.com Искусственный интеллект стремительно развивается и применяется...

Эволюция электромобилей не позволит им разрешить климатический кризис

В последние пять лет все электромобили в мире мигрировали в сторону особенностей Tesla. Помимо плюсов, такая эволюция принесла...

Российские ученые создали первую в мире открытую виртуальную среду для самообучающегося ИИ

Автомобили Waymo бибикают друг на друга ночью на парковке в США, 2024 год. Жители окрестных домов были не...

Китайские ученые изрешетили золото, чтобы сделать его прочнее

Снимок со сканирующего электронного микроскопа: можно наблюдать отверстия размером около 18 нанометров в поперечнике, которые пронизывают образец золота...

Увлажнитель воздуха — источник здоровья или опасных микрочастиц?

Реклама сообщает нам, что увлажнители воздуха решают многие проблемы со здоровьем. И в каком-то смысле все так. Но...

Ученые разработали умную ткань для мониторинга здоровья

Из умной ткани можно производить одежду и маски со встроенными индикаторами показателей здоровья / © Güder Research Group...

Ученые продлили время работы сверхпроводящих квантовых устройств

Схема кубита и изображение джозефсоновского перехода со сканирующего электронного микроскопа /© Ganjam et. al., Nature Communocations Ученые Йельского...

Мягкие нанопровода из золота помогут улучшить нейроинтерфейсы

Мягкие нанопровода из золота на силиконовой подложке / © Linköping University (LiU), Thor Balkhed Нейроинтерфейсы, позволяющие передавать информацию...

Ученые разработали беспроводное смарт-кольцо для управления умным домом

Компактный размер кольца позволяет носить его весь день и управлять девайсами без голосовых команд / @ Shyamnath Gollakota...

Навозный жук — робот научился толкать шары быстрее и проворнее настоящего

Робот ALPHA и жук-навозник во время перекатывания шара / @ Binggwong Leung et al. Жуки-навозники удивительны тем, что...

В ОАЭ построят крупнейшую в мире солнечно-накопительную электростанцию

В ОАЭ уже есть солнечные электростанции (одна из них на фото). Но все они куда меньше и, главное,...

Как спецодежда создала нашу моду — и куда идет теперь

© Wikimedia Commons Первая костяная игла древностью 50 тысяч лет считается сделанной денисовцами, а первым изображением, предположительно сшитой...

На «Фукусиме-1» началась операция по извлечению образца расплавленного материала реактора

АЭС Фукусима-1 с высоты птичьего полета / © AP Как сообщило агентство Associated Press, стартовавшая 10 сентября операция...