Vehbi Neziri, Ali Caka, Nebi Caka
Publication year: 2012

ABSTRACT

Ndërlidhja e fuqishme e gjuhësisë dhe teknologjisë së informacionit solli deri tek zhvillimi i shpejtë i teknologjive gjuhësore në të cilat sot mbështeten studimet gjuhësore të shumë gjuhëve botërore. Dihet fare mirë se anglishtja prinë në këtë, e gjuha shqipe është prekur pak nga kjo fushë. Projekti i Qeverisë së Kosovës i gjuhës shqipe më 2005; Korpusi një milion fjalësh i gjuhës shqipe i vëllezërve Caka i punuar më 2006 me anë të konkordancierit e sipas modelit të korpusit të Braunit nga i cili autori i dytë i këtij punimi hartoi Fjalorët themelorë të gjuhës së sotme shqipe (2500, 5000 dhe 10000 fjalësh); Tageri-etiketuesi i gjuhës shqipe i punuar më 2011, dhe lematizuesi i gjuhës shqipe i punuar më 2012 nga autorët e parë të këtij punimi; Projekti i shndërrimit të tekstit në të folur; janë disa nga të arriturat e gjuhësisë shqiptare falë teknologjive gjuhësore dhe punës multidisiplinore të gjuhëtarëve dhe informaticientëve. Ky punim mëton të japë të arriturat e gjuhësisë shqiptare në këtë fushë dhe njëkohësisht të tregojë për rolin e teknologjisë gjuhësore në zhvillimin e gjuhësisë shqiptare.

Fjalët çelës: teknologji gjuhësore, lematizues, etiketues, gjuhë shqipe, korpus
Key- words: Language technology, lemmatizer, tagger, Albanian language, corpus