Fakultet elektrotehnike i računarstva na svojim je internetskim stranicama objavio podatke o najčešćim pravopisnim pogreškama korisnika alata Hašek u 2021. godini. Hašek odnosno ispravi.me je alata za ispravljanje gramatičkih pogrešaka.
Kako poručuju s Fakulteta, usluzi je pristupilo 450 tisuća korisnika iz preko 130 zemalja svijeta. Oni su obradili 8 milijuna tekstova koji su tvorili korpus od blizu 2 milijarde pojavnica. Ovo nedvojbeno govori o globalnoj popularnosti vrlo specifične usluge posvećene hrvatskom jeziku. Valja naglasiti da je hrvatski u svjetskim razmjerima “mali” jezik jer ga koristi manje od jednog promila svjetske populacije.
Najviše korisnika usluzi je pristupilo iz Hrvatske (83 %), zatim iz Bosne i Hercegovine (7 %), Njemačke (1 %) itd. Više od 40 % korisnika bilo je mlađe od 34 godine, a usluzi su u 75 posto slučajeva pristupali sa stolnog računala, najčešće radnim danima između 9 i 15 sati. Sve ovo upućuje da u Hrvatskoj treba posvećivati veću pozornost domaćem razvoju jezičnotehnoloških proizvoda i usluga.
U 2021. godini korisnici su najčešće griješili pri pisanju sljedećih riječi: če –> će, tiće –> tiče, riješenje –> rješenje, slijedeće –> sljedeće, mogučnosti –> mogućnosti, promjeniti –> promijeniti, čemo –> ćemo, več –> već, primjetiti –> primijetiti, djete –> dijete, samnom –> sa mnom, riješenja –> rješenja, reči –> reći, primjeniti –> primijeniti te razumijeti –> razumjeti.
Zahvaljujući bogatom osnovnom fondu riječi, ali i brojnim frazama specifičnima za hrvatski jezik, sustav Hašek učestale gramatičke i stilske greške kontekstno prepoznaje te po potrebi ispravlja, što ga svrstava u nekonvencionalne pravopisne provjernike. Njegova posebnost je kontinuirana nadogradnja koje se postiže putem sustava samoučenja. Iz pristiglih tekstova sustav prikuplja nove riječi i njihove oblike te sam izdvaja zanimljive elemente za nadogradnju jezičnog fonda, koji prolaze rigoroznu kontrolu radi očuvanja preciznosti rječnika, poručuju s Fakulteta elektrotehnike i računarstva.
Tekst se nastavlja ispod oglasa