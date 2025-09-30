Ko je OpenAI jeseni 2022 širšim množicam predstavil prvi ChatGPT v obliki pogovornega pomočnika, smo mnogi sklepali, da gre za preizkus in začasen način komunikacije s »pametnimi« modeli. In vendar smo uporabniki z odrtimi usti sprejeli novost in se nemudoma navadili klepetanja z UI. Čeprav marsikdo dvomi, da sta izmenjava stavkov in kopiranje v pogovor ter iz njega res najpriročnejši način, strokovnjaki za uporabniško izkušnjo do danes še niso našli boljšega načina, ki bi ga uporabniki tudi zares pograbili in uporabljali.

Upam si trditi, da med bralci Monitorja skoraj ni več nikogar, ki bi ob omembi zadnjih modelov in sistemov LLM zamahnil z roko in jih označil za modno muho. Če smo še pred letom ali celo pred pol leta lahko bili skeptiki, si zdaj moramo priznati, da umetnointeligenčni pomočniki izjemno hitro napredujejo, so vedno natančnejši in uporabnejši in da očitno ne bodo preprosto izginili. Nerešena uganka pa ostaja, kako modele LLM in umetno inteligenco (UI) nasploh smiselno umestiti v uporabniške vmesnike naših naprav.

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Upam si trditi, da med bralci Monitorja skoraj ni več nikogar, ki bi ob omembi zadnjih modelov in sistemov LLM zamahnil z roko in jih označil za modno muho. Če smo še pred letom ali celo pred pol leta lahko bili skeptiki, si zdaj moramo priznati, da umetnointeligenčni pomočniki izjemno hitro napredujejo, so vedno natančnejši in uporabnejši in da očitno ne bodo preprosto izginili. Nerešena uganka pa ostaja, kako modele LLM in umetno inteligenco (UI) nasploh smiselno umestiti v uporabniške vmesnike naših naprav.

Ko je OpenAI jeseni 2022 širšim množicam predstavil prvi ChatGPT v obliki pogovornega pomočnika, smo mnogi sklepali, da gre za preizkus in začasen način komunikacije s »pametnimi« modeli. In vendar smo uporabniki z odrtimi usti sprejeli novost in se nemudoma navadili klepetanja z UI. Čeprav marsikdo dvomi, da sta izmenjava stavkov in kopiranje v pogovor ter iz njega res najpriročnejši način, strokovnjaki za uporabniško izkušnjo do danes še niso našli boljšega načina, ki bi ga uporabniki tudi zares pograbili in uporabljali.

V brskalniku

Večina nas pred uporabo izbranega modela LLM (po domače »umetne inteligence«) odpre brskalnik, prikliče spletno stran izbranega ponudnika, ne glede na to, ali iščemo pomoč pri ChatGPT, Claudu, Geminiji, Copilotu ali drugje, in začne tipkati, kopirati in lepiti. To počnemo, ko popravljamo ali sestavljamo elektronska sporočila, dokumente, želimo analizirati slikovno gradivo in še kaj. Velikokrat tak postopek uporabljajo tudi programerji, čeprav imajo na voljo druge možnosti.

Tak način rabe zagotavlja tudi zmerno stopnjo zasebnosti – uporabnik v popolnosti odloča, kaj bo poslal na strežnike, ki poganjajo UI, ti pa nimajo dostopa do ostalih podatkov. Pri bolj integriranih načinih rabe se stvari nekoliko zapletejo.

V žepu

Pri uporabi mobilnih naprav je prva misel uporaba aplikacije in ne uporaba spletnih aplikacij v brskalniku, zato smo seveda namestili namenske aplikacije različnih ponudnikov storitev UI. Da sta število prenosov mobilnih aplikacij in izpostavljenost na mobilnih tržnicah izjemno pomembna za uspeh izdelka in torej za podjetja, dokazuje nedavno pritoževanje Elona Muska nad Applom, ko jih je obtožil, da dajejo prednost ChatGPT in zato njegova aplikacija Grok ne more splezati na vrh priljubljenosti. Kritiki so ga hitro utišali, saj so pokazali, da ni tako. Tudi na dan pisanja tega prispevka na vrhu tržnice aplikacij za iphone najdemo več sorodnih izdelkov – tam kraljuje ChatGPT, sledijo mu Grok, Gemini in Copilot.

Na iphonu danes vsako vnosno polje omogoča, da z vgrajeno UI uporabnik izboljša pisanje, pri branju ta omogoča povzemanje besedila, na voljo pa je tudi (bolj ali manj …) pomoč pri urejanju slik.

Android Gemini.png in Ifon_5.png Če uporabljate katerega od telefonov, tablic in pametnih ur zadnjih generacij, bo UI v vas skakala izza vsakega vogala. (prvega umontiraš v pixel 10 pro xl, drugega v ifon 16)

Podobno, v marsičem bolje, ponujajo tudi proizvajalci telefonov z Androidom – tam Googlov Gemini pomaga rešiti uganiti, kaj je na sliki, ter pri iskanju po spletu in kupovanju izdelkov. Ko ne veste, kaj napisati, pomaga s predlogom, svetuje, kako najbolje zajeti fotografijo, iz zvoka izlušči besedilo in še marsikaj.

Zmožnosti so nedvomno našle pot do uporabnikov, a zdi se, da smo v fazi, ko še ni jasno, kako najbolje izkoristiti možnosti uporabe UI, zato proizvajalci v svoje načrte zapišejo »vsepovsod«, programerji neutrudno dodajajo možnosti, odločitev pa prepuščajo končnim uporabnikom.

Na namizju

Brskalniki, ki jih uporabljamo na računalnikih, postajajo uporabniški vmesnik za uporabo UI. Poleg nepregledne množice razširitev, s katerimi jih lahko dopolnimo, se spreminjajo tudi brskalniki sami. Chrome že ima vgrajen vmesnik za Googlove modele Gemini, a je za zdaj na voljo le uporabnikom v Združenih državah. Edge, ki postaja najbolj uporabljan brskalnik v poslovnih vodah, pa poka po šivih zaradi integracij z Microsoftovim Copilotom. Tudi Opera in drugi priljubljeni brskalniki dobivajo vedno več možnosti uporabe UI.

Ponudniki storitev UI, ki še nimajo svojih brskalnikov, menijo, da je prava pot do prstov, možganov in src svojih uporabnikov prav skozi okno brskalnika, zato OpenAI, Perplexity in druga sorodna podjetja razvijajo lastne brskalnike, ki bodo njihovim umetnointeligenčnim modelom omogočali agentsko delovanje – samostojno brskanje, iskanje in nakupovanje po spletu.

Manj znano je, da imajo nekateri veliki ponudniki storitev UI oziroma modelov LLM tudi namenske namizne aplikacije, ki delujejo na Windows in macOS. Primer sta namizni aplikaciji ChatGPT in Claude, ki sta si zelo podobni – po kratki namestitvi lahko s kombinacijo tipk (večinoma je to Alt + preslednica oziroma Command + preslednica na macOS) prikličemo iskalno okno, kamor vpišemo navodila oziroma vprašanje, in pogovor že steče.

Okno namizne klepetalnice z UI lahko prikličemo s pritiskom dveh tipk.

Pri tovrstnih aplikacijah gre sicer le za preoblečeno okno brskalnika, v katerem še vedno teče znana spletna aplikacija z nekaterimi dodanimi bombončki. A če z UI veliko klepetate, je tak način rabe vsekakor učinkovitejši in priročnejši kot preklapljanje med okni ali zavihki brskalnika.

Takšen način uporabe bo morda postal hit na domačih računalnikih, na službenih pa ne – uporabniki tam navadno nimamo pravice nameščati novih aplikacij.

Obogateni tradicionalni programi

Nekoliko drugače deluje Microsoftov Copilot. Ta je aplikacijo, ki se je nekdaj imenovala Microsoft Office in s katero smo lahko pognali namizne pisarniške programe, brskali po datotekah na OneDrivu in še kaj, sprva preimenoval v Microsoft 365, danes pa se imenuje kar Microsoft Copilot (logično, mar ne?) in je osrednji način uporabe storitve na Windows ali macOS.

Copilot je vgrajen tudi v namizne in spletne različice legendarnih programov Outlook, Word, Excel in Powerpoint. V Wordu in Outlooku uporabnikom pomaga začeti pisati in narediti prvi korak od praznega lista papirja ali sporočila do končnega dokumenta, svetuje popravke in besedilo pomaga prilagajati, povzemati, krajšati in daljšati. V Excelu svetuje pri sestavljanju formul, po novem pa lahko UI celo napolni celice tabele s podatki, ki jih sploh nimate. V Powerpointu lahko pripravi predstavitev, če je treba, lahko ustvari tudi vsebino.

Microsoft si zelo želi, da bi uporabniki spoznali Copilot in ga začeli uporabljati.

Videti je, da je integracija v pisarniška orodja Microsoft 365 (nekoč Office) in Google Workspace, ki jih mnogi uporabljamo dnevno, velika konkurenčna prednost za Microsoft in Google. Verjetno je Copilot ravno zato na lestvici najbolj priljubljenih orodij UI više, kot bi bil sicer.

Vendar pa nad vsiljevanjem rabe UI niso vsi navdušeni, podjetja pa so zaskrbljena zaradi varnosti in zasebnosti podatkov, ki jih njihovi zaposleni obdelujejo, če v podatkovne centre ponudnikov orodja nenehno pošiljajo interne informacije. Umetna inteligenca, ki ima o nas veliko konteksta in znanja/poznavanja našega dela, se sliši hkrati zelo uporabna in strašljiva.

Družabna omrežja

Za marsikoga je eden najspornejših načinov uporabe velikih jezikovnih modelov integracija v sodobna družabna omrežja. Model Grok je vgrajen v omrežje X, uporabniki z njim klepetajo, kot bi to počeli s prijatelji in z znanci.

Tudi Facebook se trudi v časovnico vplesti umetnointeligenčno generirane vsebine in celo trdi, da bo sčasoma takih vsebin večina. Ravno tako je mogoče v skupni klepet dodati »robota« na Whatsappu in v nekaterih drugih klepetalnikih.

Programerska orodja

Možnosti tehnologij LLM najspretneje izkoriščajo razvijalci programske kode, oblikovalci, upravitelji infrastrukture in vsi drugi, ki ustvarjajo strukturirano besedilo, namenjeno računalniški interpretaciji.

Ni torej presenetljivo, da posamezniki in podjetja z veseljem uporabljajo orodja in okolja z dodatkom UI, kot je GitHub Copilot, ki v Visual Studio Codu in sorodnih orodjih omogočajo klepetanje in neposredno spreminjanje in ustvarjanje kode. Pristop očitno deluje, saj je tudi seznam konkurenčnih orodij dolg, najobetavnejši pa se zdi Cursor ali Replit.

Ob nekaj več dela programerji dosegajo višjo produktivnost tudi z uporabo Claude Coda, podobne rezultate omogoča tudi Gemini CLI.

Enostavni urejevalniki besedil

Za vse, ki niste razvijalci in pomoč pomočnika pri urejanju besedilnih datotek potrebujete le občasno, je na voljo veliko urejevalnikov, ki so v novejših različicah dobili vgrajenega pomočnika. Med njimi je celo v Okna vgrajena Beležnica, v kateri bo pomagal Copilot, na macOS pa bo v Notes pomagal Apple Inteligence.

V zadnjih različicah sistema Windows je nameščena posodobljena različica urejevalnika Notepad, ki razume oblikovano besedilo v slogu markdowna in vključuje nekatere zmožnosti Microsoft Copilota.

Pomoč UI lahko prikličete tudi v urejevalnikih Notepad++, Zed, Sublime Text in mnogih drugih ali v zmogljivejših orodjih, kot so Notion, Obsidian in Typora.

Pri vas doma

Zgodovina nas uči, da se pri novih tehnologijah kot izjemna pokaže tista, ki do uporabnikov pride prva. Tudi pri sodobni UI ima OpenAI nedvomno ogromno prednost, saj je ChatGPT za občasnega uporabnika bolj ali manj sinonim za umetno inteligenco.

Poseben izziv za podjetja, ki v razvoj umetne inteligence vlagajo ogromna sredstva, predstavljajo odprti modeli, ki jih lahko prenesemo brezplačno in poganjamo lokalno, na svojih računalnikih in strežnikih. Verjetno najbolj priljubljen način uporabe takšnih modelov je program ollama, ki omogoča prenos in strežbo odprtih modelov, s katerimi se integrirajo drugi programi. Žal se je za njegovo uporabo treba znebiti strahu pred ukazno vrstico, zato mogoče ni primeren za vsakogar. Podobno nalogo opravlja LM Studio, s katerim enostavno na svoj strežnik ali računalnik prenesemo odprti model (enega ali več), nato pa z njimi klepetamo kar v istem programu.

LM Studio omogoča prenos najnovejših modelov in njihovo uporabo na lastni napravi. Hitrost delovanja je močno odvisna od zmogljivosti naprave, na kateri tečejo, modeli pa kakovostno seveda niso enakovredni komercialni/oblačni konkurenci.

Za splošno uporabo LLM v družini ali podjetju lahko strežnik ollama dopolnimo z znanim uporabniškim vmesnikom – klepetom. Priljubljena rešitev je strežnik Open WebUI, ki ga lahko enostavno namestimo na domači strežnik ali NAS, povežemo s strežnikom ollama in že imamo doma pripravljeno umetno inteligenco, ki ne bo posegala v našo zasebnost. Ali pa je vsaj manj verjetno, da bo …

Če vas postavitev strežnikov ne mika, te možnosti nimate ali pa boste edini uporabnik, velja pogledati odprtokodno rešitev Jan, ki na uporabniku prijazen način omogoča prenos in uporabo LLM z zagotavljanjem zasebnosti in veliko možnosti prilagoditve.

Naredi si sam

Tehnološki navdušenci lahko z rešitvami, kot je odprtokodni assistant-ui, vzpostavijo klon storitev, kot je ChatGPT ali Perplexity, ki teče na lastnem strežniku in uporablja programske vmesnike API. Sorodna rešitev GPT4All ponuja tudi različico Enterprise, ki je, kot ime pove, namenjana poslovni rabi in ravno tako zagotavlja, da bodo klepeti z UI ostali na lastni opremi in ne bodo odtekali v svet.

Programerji in zanesenjaki menijo, da sta za vnos besedila najboljši uporabniški vmesnik ukazna vrstica in njeno povsem besedilno okolje. Če je tak način primeren tudi za vas, potem si z GitHub prenesite odprtokodno rešitev llm prepoznavnega strokovnjaka za UI Simona Willisona. Ta način uporabe je uporaben tudi za klasičen klepet in vključevanje klepeta z UI v ukazne skripte.

Odprtokodni in hitro razvijajoči se llm omogoča učinkovito uporabo mnogih priljubljenih in še več obskurnih modelov kar iz ukazne vrstice.

Kaj pa govor?

Čeprav že desetletja poslušamo, da bomo za branje in vnos besedila prav kmalu prenehali uporabljati zaslone in tipkovnice, resnih premikov v to smer še ni zaznati. Kot že večkrat se je izkazalo, da si ljudje raje izmenjujemo besedilo, saj govorjenje in poslušanje zahtevata več energije in nista primerna (ali zaželena) ravno v vsakem okolju.

Z mobilno aplikacijo ChatGPT se lahko pogovarjamo, odgovori so generirani kot zares naravni govor, vključiti pa je mogoče tudi prepis.

ChatGPT in konkurenca ponujajo glasovne vmesnike za svoje modele, a se zdi, da se jih uporabniki ne moremo navaditi. Že pred leti smo z govornimi pomočniki dobili solidno pomoč, vendar se je njihov razvoj praktično zaustavil, Google, Amazon ali Apple pa še niso predstavili izdelka, ki bi uspešno združil prepoznavanje govora z odgovori, ki jih zna pripraviti sodobna UI. Nas pa seveda prav vsi tolažijo, da so tovrstni izdelki neposredno za vogalom.

Kaj uporabiti?

Ta članek bo zastarel, še preden bo prišel do vas, bralcev, (natisnjen v reviji ali preko spleta). Področje UI se razvija izjemno hitro, vložki v industrijo so astronomski, prav tako so astronomska pričakovanja vlagateljev.

Edini nasvet, ki ga lahko delimo z bralci, je zato – preizkušajte različne ponudnike, različne načine uporabe in poiščite tiste, ki ustrezajo vam in vašim potrebam ter dajejo ustrezne rezultate. Zaradi pestrega nabora načinov uporabe in hitrega razvoja je nemogoče objektivno ocenjevati, kaj je najbolje in kaj je cilj, ki ga industrija zasleduje. Pot do točke, ko bomo rekli, da so modeli LLM in UI nasploh dosegli svoj potencial, je verjetno še dolga, nedvomno pa ni ravna.