Morfologický analyzátor

Morfologický analyzátor tvarov v slovenčine sa začal vyvíjať v r. 2005 v oddelení Slovenského národného korpusu Jazykovedného ústavu Ľ. Štúra SAV v Bratislave. Primárne sa MA využíva na automatizovanú anotáciu textov v korpuse, v ktorom sa nachádzajú texty tak, ako boli vydané, teda aj s nespisovnými slovami a tvarmi. Slovník MA obsahuje približne 26 tisíc paradigiem podstatných mien, 13 tisíc paradigiem prídavných mien, 28 tisíc paradigiem slovies a v istom rozsahu aj ostatné slovné druhy. Východiskovým zdrojom MA boli heslové slová obsiahnuté v Krátkom slovníku slovenského jazyka, databáza sa postupne rozširuje o najfrekventovanejšie slová v korpuse, ktoré sa nenachádzali v KSSJ. Verejnosti môže MA slúžiť na overenie si tvaru alebo celej paradigmy konkrétneho slova, nenahrádza však kodifikačné príručky. Podrobnejšie informácie o morfologickej anotácii a použitých značkách nájdete tu.