Morzsák

Oldal címe

Lexikai tudásreprezentáció

Címlapos tartalom

Az NyK Lexikai tudásreprezentáció kutatócsoport keretében futó projektünk célja egy új, korpuszvezérelt, 1 milliárd szó terjedelmű korpuszon alapuló, online és offline formában is elérhető magyar értelmező kéziszótár készítéséhez szükséges adatok és korpuszfeldolgozó eszközök létrehozása. A projekt jelen szakaszában a szótár alapjául szolgáló korpusz összeállítása és tisztítása áll előtérben, egyebek mellett neurális nyelvmodellek segítségével.

Publikációk

1 - 3 | 3
Megjelenés éve
2025

Középkori nyelvek feldolgozása ingyenes és kereskedelmi generatív nyelvmodellekkel

Szerzők
Pethő Gergely; Swaroop Krishna
Kapcsolódó projekt
Tovább
Megjelenés éve
2024

OCR-hibák kvantitatív elemzése több szövegváltozat összehasonlításával

Szerzők
Pethő, Gergely; Sass, Bálint; Simon, László; Lipp, Veronika
Kapcsolódó projekt
Tovább
Megjelenés éve
2023

Korpusztisztítás és sorvégi kötőjelek kezelése karakteralapú neurális nyelvmodellel

Szerzők
Pethő, Gergely; Sass, Bálint; Simon, László; Lipp, Veronika
Kapcsolódó projekt
Tovább