В блоге Microsoft возник свежайший пост, в каком спецы компании поведали о успехах метода DeBERTa. Ему удалось обойти человека в одном из самых сложных тестов осознания естественного языка — SuperGLUE.
Так, если в среднем человек способен набрать 89,8 баллов в данном тестировании, то DeBERTa удалось достигнуть показателя в 90,3 балла. Для этого разрабам метода пришлось очень переработать архитектуру системы. Сейчас она состоит из 48 слоев и имеет 1,5 миллиардов разных параметра.
Результаты алгоритмов в тесте SuperGLUE / Источник: Блог Microsoft
Представители Microsoft уже заявили, что планируют создать начальный код DeBERTa открытым. Из ближайших планов компании также можно отметить желание интегрировать метод в последующую версию Microsoft Turing (Turing NLRv4).
Напомним, что тьюринговая модель компании употребляется в поисковике Bing, Office, Dynamics и Azure Cognitive Services.
Источник: Хабр
Источник: