Русская языковая модель Сбера и SberDevices признана лучшей в мире

admin5008509.02.2023

0 29 2 minutes read

Языковая модель Сбера и SberDevices стала лучшей в мире по пониманию русских текстов

Фото: Shutterstock

Языковая модель от Сбера и SberDevices FRED-T5 (Full-scale Russian Enhanced Denoisers T5) стала лучшей в мире по пониманию текста в соответствии с результатами тестов главного русскоязычного бенчмарка для оценки больших текстовых моделей Russian SuperGLUE, уступая по точности только человеку. Она превзошла другие представленные на лидерборде модели для русского языка с существенным отрывом, несмотря на больший размер многих моделей-конкурентов.

Сбер давно работает с трансформерными моделями — еще в 2019 году были обучены русскоязычные модели ruBERT и ruGPT-2, а в 2020 году при помощи суперкомпьютера Christofari была создана ruGPT-3. Эта модель существует в разных вариантах, и самый большой из них насчитывает 13 миллиардов параметров.

В отличие от моделей семейства GPT, состоящих только из декодирующих блоков трансформера, модель FRED-T5 содержит также кодирующие блоки, что позволяет ей гораздо эффективнее решать различные задачи в области обработки естественного языка.

Лидерборд Russian SuperGLUE (General Language Understanding Evaluation) — первый рейтинг нейросетей для русского языка. Место в рейтинге зависит от того, насколько качественно нейросеть выполняет задания на логику, здравый смысл, целеполагание и понимание смысла текста. Это открытый проект, которым пользуются исследователи данных, работающие с русскоязычными нейросетями.

Архитектурно модель FRED-T5 реализована на базе нейросети T5 и имеет 1,7 миллиарда параметров и 24 слоя. Модель обучалась на задачах восстановления случайно удаленных фрагментов текста на суперкомпьютере Christofari Neo. Это заняло шесть недель и потребовало использования обучающей выборки, содержавшей около 300 гигабайт текста. В среде специалистов по автоматической обработке естественного языка эту задачу называют MoD (Mixture of Denoisers). Этот подход был предложен ранее командой из Google в модели UL2. Наши исследователи реализовали этот подход с рядом существенных изменений, основанных на результатах собственных исследований.

Читать так же: России предсказали рекордный профицит внешней торговли

«Ведущие исследовательские центры в области машинного обучения в последние годы создают все более и более крупные нейронные языковые модели. Количество параметров самых больших монолитных нейросетей уже перевалило за 500 миллиардов и продолжает расти. Это беспрецедентные в истории человечества вычислительные проекты. Но прогресс заключается не только в создании все более огромных нейросетевых монстров, но и в совершенствовании архитектур сетей и методов их обучения. Благодаря этому самые современные модели при том же количестве параметров интеллектуально превосходят своих предшественников. Хорошим примером этого эффекта является нейросеть FRED-T5, которая при сравнительно скромном по нынешним меркам числе параметров стала лидером в понимании русского языка», — рассказал директор Управления экспериментальных систем машинного обучения SberDevices Сергей Марков.

admin5008509.02.2023

0 29 2 minutes read

Читайте еще

Русская языковая модель Сбера и SberDevices признана лучшей в мире

Читайте еще

Review of Propecia (Finasteride) for Hair Loss

Ношение линз после истечения срока годности: самые частые осложнения

Экономия бензина на не новых отечественных автомобилях

Россиянам рассказали о ситуации с автозапчастями в стране

Китайскую модель развития назвали устаревшей

«Тинькофф» предупредил о прекращении работы карт UnionPay за границей

США сняли санкции с двух бывших членов набсовета «Открытия»

В Госдуму внесли законопроект о снижении НДС на часть детских товаров

Международные резервы России в июле выросли на миллиарды долларов

Основатель сети лабораторий «Инвитро» продал компанию «амбициозному акционеру»

Review of Propecia (Finasteride) for Hair Loss

Ношение линз после истечения срока годности: самые частые осложнения

Экономия бензина на не новых отечественных автомобилях

Россиянам рассказали о ситуации с автозапчастями в стране

Китайскую модель развития назвали устаревшей

«Тинькофф» предупредил о прекращении работы карт UnionPay за границей

США сняли санкции с двух бывших членов набсовета «Открытия»

В Госдуму внесли законопроект о снижении НДС на часть детских товаров

Международные резервы России в июле выросли на миллиарды долларов

Основатель сети лабораторий «Инвитро» продал компанию «амбициозному акционеру»

Добавить комментарий Отменить ответ

Автомобильный коврик: все, что нужно знать

Библиотека зарубежной классики: описание и особенности

Собственность: топ-5 курортов Таиланда для инвестиций в недвижимость

Доставка грузов из Китая: что это такое и как работает

Как выбрать новое авто: полное руководство

Автомобильный коврик: все, что нужно знать

Библиотека зарубежной классики: описание и особенности

Собственность: топ-5 курортов Таиланда для инвестиций в недвижимость

Доставка грузов из Китая: что это такое и как работает

Как выбрать новое авто: полное руководство

Читайте еще

Review of Propecia (Finasteride) for Hair Loss

Ношение линз после истечения срока годности: самые частые осложнения

Экономия бензина на не новых отечественных автомобилях

Россиянам рассказали о ситуации с автозапчастями в стране

Китайскую модель развития назвали устаревшей

«Тинькофф» предупредил о прекращении работы карт UnionPay за границей

США сняли санкции с двух бывших членов набсовета «Открытия»

В Госдуму внесли законопроект о снижении НДС на часть детских товаров

Международные резервы России в июле выросли на миллиарды долларов

Основатель сети лабораторий «Инвитро» продал компанию «амбициозному акционеру»

Статьи по теме

Добавить комментарий Отменить ответ

Автомобильный коврик: все, что нужно знать

Библиотека зарубежной классики: описание и особенности

Собственность: топ-5 курортов Таиланда для инвестиций в недвижимость

Доставка грузов из Китая: что это такое и как работает

Как выбрать новое авто: полное руководство