Аватарка пользователя Аня Карташова
Аня Карташова

Сбер открыл доступ к модели ruGPT-3.5

Сбер открыл доступ к ruGPT-3.5. Модель находится под лицензией MIT, что позволяет разработчикам использовать модель в собственных продуктах.

644

Сбер открыл доступ к модели ruGPT-3.5, которая легла в основу продукта GigaChat. Модель находится под лицензией MIT, что позволяет разработчикам использовать модель в собственных коммерческих продуктах.

Количество параметров ruGPT-3.5 составляет 13 миллиардов. Также при ответах модель использует контекст длиной в 2048 токенов.

Сбер открыл доступ к модели ruGPT-3.5 1
https://habr.com/

Модель обучали в два этапа: в первый раз — на 300 Гб книг, научных статей и данных из социальных сетей в открытом доступе, во второй раз — на 110 Гб данных, которые включают в себя код, юридические документы и тексты из Википедии.

644