Morzsák

Oldal címe

Lexikai tudásreprezentáció

Címlapos tartalom

Az NyK Lexikai tudásreprezentáció kutatócsoport keretében futó projektünk célja egy új, korpuszvezérelt, 1 milliárd szó terjedelmű korpuszon alapuló, online és offline formában is elérhető magyar értelmező kéziszótár készítéséhez szükséges adatok és korpuszfeldolgozó eszközök létrehozása. A projekt jelen szakaszában a szótár alapjául szolgáló korpusz összeállítása és tisztítása áll előtérben, egyebek mellett neurális nyelvmodellek segítségével.

Publikációk

1 - 2 | 2
Megjelenés éve
2024

OCR-hibák kvantitatív elemzése több szövegváltozat összehasonlításával

Szerzők
Pethő, Gergely; Sass, Bálint; Simon, László; Lipp, Veronika
Kapcsolódó projekt
Tovább
Megjelenés éve
2023

Korpusztisztítás és sorvégi kötőjelek kezelése karakteralapú neurális nyelvmodellel

Szerzők
Pethő, Gergely; Sass, Bálint; Simon, László; Lipp, Veronika
Kapcsolódó projekt
Tovább