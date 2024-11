Domača pamet

Letos smo dobili prve resne jezikovne modele, ki so bili ustvarjeni v slovenščini, s slovenskimi besedili za slovenske uporabnike. Njihove provenience so zelo različne, nameni uporabe tudi, sporočilo pa je obče. Takšne modele potrebujemo, njihova priprava pa zahteva nekaj znanja, računske moči in predvsem dovolj slovenskih besedil. Vse to pri nas imamo, o čemer smo se pogovorili tudi z avtorjem enega izmed slovenskih modelov.

Veliki jezikovni modeli, ki so jih pripravili tuji giganti in so danes na voljo, so se slovenščine naučili spotoma. Med zbiranjem in prebiranjem vseh mogočih vsebin z interneta so naleteli tudi na slovenska besedila, zato danes ChatGPT, Gemini in LLaMa zmorejo odgovarjati v slovenščini. Poznajo tudi za naš del sveta relevantne dogodke, denimo podrobnosti o slovenski osamosvojitvi, značilnosti Cerkniškega jezera in navezanost slovenskega gospodarstva na Nemčijo. Pa vendarle ti modeli ne dosegajo potenciala, ki je dosegljiv z osredotočenjem na slovenski jezik, torej učenjem na slovenskih vsebinah in ustreznimi usmeritvami.

