Stĺpček

Friday, 16 June 2006 00:00 Katarína Potoková Poľnohospodár 19/50
Print

Keď sa povie Jazykovedný ústav Ľudovíta Štúra (JÚĽŠ), väčšine z nás sa v mysli vybaví jazyková poradňa, ktorá nás usmerní, čo je správne a čo nesprávne v našom vyjadrovaní. Je to síce pravda, ale zďaleka nie celá. Tento ústav sa v rámci programu starostlivosti o štátny jazyk venuje výskumu slovenčiny z najrôznejších uhlov pohľadu. Oddelenie zvané Slovenský národný korpus rieši od roku 2003 úlohu Komplexné spracovanie slovenského jazyka a jeho elektronizácia na účely jazykovedného výskumu.

A teraz otázky. Čo je to Slovenský národný korpus? Veľmi zjednodušene povedané, elektronický súbor jazykových dát. Ako vzniká? Vybrané texty (umelecké, odborné, publicistické, administratívne a iné) v elektronickej podobe sa spracujú do jednotného formátu, odstránia sa z neho netextové súčasti a text sa člení na najmenšie textové jednotky - slová a znaky. Korpus sa buduje ako všeobecný jednojazyčný korpus písaných textov súčasného slovenského jazyka v rozsahu 200 miliónov textových jednotiek. Komu takýto "obnažený" základ nášho jazyka slúži? Lexikografom, ktorí tvoria slovníky, gramatikom formulujúcim pravopisné pravidlá, učiteľom, redaktorom, prekladateľom, ale napríklad aj programátorom, vytvárajúcim nástroje na automatickú kontrolu pravopisu, no a mnohým ďalším profesiám, ktoré pracujú s jazykom. Domácim aj zahraničným používateľom. Ak vás, milí priatelia, táto téma zaujala, kliknite si na http://korpus.juls.savba.sk. Nebuďte prekvapení, ak medzi textami, ktoré sa do korpusu spracúvajú, natrafíte aj na text či výraz z nášho dvojtýždenníka. Sme radi, že nás tvorcovia korpusu oslovili...

K. POTOKOVÁ