Ali Caka, Vehbi Neziri
Publication year: 2014

ABSTRACT

Sot gjuhësia moderne nuk mund të mendohet pa përdorimin e Teknologjive gjuhësore të cilat dita ditës po bëhen vegla të pazëvendësueshme për procesimin dhe analizën e gjuhës natyrale. Në pamundësi që të përdoren Teknologjitë gjuhësore të gjuhës angleze, e cila ka strukturë tjetër nga gjuha shqipe, së voni në gjuhësinë shqiptare janë bërë disa tentime për zhvillimin e Teknologjive gjuhësore të gjuhës shqipe. Kështu që tashmë është zhvilluar lematizuesi i gjuhës shqipe, softueri për nxjerrjen e lemave (fjalëformave përfaqësuse), e po ashtu edhe tageri i gjuhës shqipe, softueri për etiketimin (tagimin) e pjesëve të ligjëratës (part-of-speech-tagging) në korpuset tekstore. Problemi kryesor që del gjatë zhvillimit të Teknologjive gjuhësore që do të përdoren në korpuset tekstore të gjuhës shqipe është nxjerrja e fjalëformave të nyjshme. Qëllimi i këtij punimi është që të zhvillojë algoritmin e modelit kompjuterik i cili do të jetë në gjendje që me saktësi të nxjerrë fjalëformat (trajtëformat) e nyjshme në korpuset tekstore të gjuhës shqipe duke e dalluar nyjën përkatëse. Softueri i cili do të punohet bazuar në algoritmin e zhvilluar do të ketë komponentën e vetëmësimit për shkak të analizës dhe procesimit të korpuseve tekstore të poezisë. Algoritmi i modelit kompjuterik të nxjerrjes së nyjës do të përmirësojë punën e lematizuesit dhe të tagerit të gjuhës shqipe.