LHASA – Тибетският голям езиков модел, SunshineGLM V1.0, първият тибетски основен модел в Китай със стотици милиарди параметри, беше пуснат в сряда в Lhasa, столицата на автономния район Xizang в Югозападен Китай.

По време на събитието за стартиране в университета Xizang, Nyima Tashi, главен учен на изследователския екип и професор в университета, каза, че моделът е обучен с помощта на около 28,8 милиарда токена висококачествени данни на тибетски език.

Тези данни включват широкомащабен корпус от тибетски изречения и текстове, китайско-тибетски и тибетско-английски паралелни корпуси, както и записи от китайско-тибетски двуезични речници, обхващащи различни области като репортаж, право, медицина, философия, образование, култура, наука и технологии.

SunshineGLM V1.0 може да обработва сложни езикови структури и мултидомейн знания, според неговите разработчици. Той демонстрира опитно семантично разбиране на тибетския, способен да дава бързи отговори на запитвания, както и ясно и точно съдържание. Той се отличава в различни области, включително генериране на тибетски текст и машинен превод.

Като основен модел, SunshineGLM V1.0 може да се прилага широко в разработването на специфични за сектора модели, като например в селското стопанство, туризма, образованието, тибетските лекарства и здравеопазването на голяма надморска височина.

След като моделът бъде регистриран в регулаторните органи, той ще бъде официално пуснат за обществено ползване, каза Ниима Таши.

Нашия източник е Българо-Китайска Търговско-промишлена палaта

By admin