Ko brskalnik postane osebni pomočnik
Ali bo umetna inteligenca nadomestila brskalnik in iskalnik ter spremenila uporabniško izkušnjo pri uporabi interneta in spletnega brskalnika? Prav to poskuša manj znano podjetje Perplexity, ki je predstavilo brskalnik Comet. Kmalu zatem je sledil še OpenAI z brskalnikom Atlas, pravkar pa je tu še Opera s svojim Neom.

Priče smo trendu, da se spletni brskalniki in iskalniki vse bolj prepletajo z orodji generativne umetne inteligence. Opera je že pred časom prepoznala priložnost združitve umetne inteligence (UI) s pomočnikom Aria, Microsoft svojega asistenta povezuje z brskalnikom Edge, tudi Google pri iskanju odgovore najprej ponudi s povzetki, ustvarjenimi z umetno inteligenco. Na to področje se je pravkar podal tudi OpenAI.
Z integracijo umetne inteligence si uporabniki lahko obetamo hitrejše in bolj neposredne odgovore ter učinkovitejše brskanje. Namesto da bi sami prečesavali množico zadetkov in odprtih zavihkov, lahko vprašamo UI, ki izlušči bistvo ali opravi korake namesto nas. Brskalnik tako postaja pametni pomočnik, ki razume naš naravni jezik in nam pomaga krmariti po poplavi informacij na internetu.
Perplexity Comet
Ponudnik brskalnika Comet je podjetje Perplexity UI, ameriški startup, ustanovljen leta 2022, ki je sprva zaslovel z istoimenskim umetnointeligenčnim iskalnikom. V nasprotju s klasičnimi iskalniki Perplexity uporabnikom na naravna vprašanja ponuja strnjene odgovore, podprte s citati. Odgovore oblikuje ob pomoči velikih jezikovnih modelov in navaja vire informacij. Podjetje je hitro zraslo (med vlagatelji so Nvidia in drugi tehnološki velikani) in do poletja 2025 doseglo več milijard dolarjev vrednosti.

Perplexity se je odločil narediti korak naprej ter združiti iskalnik z UI in brskalnikom, pri čemer so za osnovo vzeli Chromium, odprtokodno različico brskalnika Chrome. Ta izbira ima zanimivo ozadje: izvršni direktor Perplexityja Aravind Srinivas je razkril, da so se na pot razvoja brskalnika podali tudi zato, ker jih je Google zavrnil kot mogočega ponudnika privzetega iskalnika v brskalniku Chrome.
Osnova na brskalniku Chromium pomeni, da je Comet na prvi pogled zelo podoben Chromu. Uporabniški vmesnik je znan, hitrost in združljivost sta enaki kot pri brskalniku Chrome, podprte so tudi vse razširitve. Za uporabnike, ki so vajeni Chroma, je prehod na Comet praktično neopazen: z enim klikom lahko uvozijo vse svoje zaznamke, shranjena gesla, zgodovino in nastavitve iz prejšnjega brskalnika. Kaj torej Comet konkretno prinaša novega v primerjavi z brskalnikom Chrome oziroma Chromium? Osnovna zamisel je, da brskalnik ni več le pasivno okno v splet, temveč postane dejaven pomočnik pri vsem, kar na spletu počnemo. V Cometu lahko uporabnik v naslovno vrstico oziroma iskalno polje vpiše vprašanje ali zahtevo v naravnem jeziku, dovolj je že nekaj ključnih besed. Brskalnik lahko nato namesto klasičnega seznama zadetkov vrne neposreden odgovor, podprt s podatki z različnih spletnih strani.
Comet ima vmesnik oblikovan tako, da je na desnem robu brskalnika stalno dosegljiv panel z umetnointeligenčnim asistentom. Kadarkoli lahko odpremo ta stranski chat in mu tam zastavimo vprašanje ali navodilo, ne glede na to, na kateri spletni strani smo. Asistent ima ves čas kontekst, katere strani imamo odprte in kaj gledamo, zato mu lahko naročimo, denimo, »Povzemi tole stran«, ali pa ga vprašamo: »Kje na tej strani je omenjena cena izdelka?«
Ena najuporabnejših funkcij je povzemanje spletnih vsebin. Namesto branja dolgih člankov lahko uporabnik označi besedilo na strani in dobi takojšen povzetek ali razlago označenega. Še bolje, asistentu lahko ukažemo, »Naredi povzetek te strani«, in v nekaj sekundah dobimo strnjeno poročilo. To ne deluje le v klasičnih člankih, temveč tudi pri dokumentih PDF, blog zapisih in celo videoposnetkih (Comet zna na Youtubu prebrati transkript videoposnetka in ga povzeti). Brskalnik je tudi večjezični prevajalec, saj lahko poljubno tujo stran povprašamo po pojasnilu v slovenščini ali pa asistentu naročimo, naj povzame besedilo v drug jezik.
Osebno se mi zdi najprivlačnejša funkcionalnost, kjer asistent omogoča obravnavo več odprtih zavihkov hkrati. To pomeni, da lahko preprosto naredimo povzetek iz več virov hkrati. Še bolje pa je, da lahko asistenta uporabimo za primerjavo vsebin, na primer izdelkov, cen ali informacij z natančnimi opredelitvami razlik. V številnih primerih je to lahko velik prihranek časa in truda. Ta funkcija zna tudi predlagati, katere strani so relevantne za trenutno nalogo in katere zgolj motijo. Brskalnik si tudi zapomni, kaj smo počeli, in zna iskati po zgodovini brskanja, na primer: »Kje sem prebral podatek o tem in tem prejšnji teden?«
To še ni vse. Comet ne le odgovarja na vprašanja, ampak naj bi znal opravljati tudi celovite naloge v več korakih. To je velika razlika v primerjavi z enostavnejšimi vgrajenimi UI-funkcijami v nekaterih drugih brskalnikih. Cometu lahko naročimo: »Najdi najugodnejši let iz Ljubljane v Alžirijo naslednji mesec, s čim manj postanki, in rezerviraj vozovnico.« Asistent je sposoben razumeti tako kompleksno nalogo. Poiskal bo lete glede na pogoje, primerjal cene in načelno lahko celo izvede postopek rezervacije. Pri našem testu je Comet pravilno našel najugodnejši let, a se je zataknilo pri sami rezervaciji vozovnice. V postopku je brskalnik dejansko obiskal spletno stran Lufthanse in poskusil opraviti nalogo. Take nove in napredne agentne zmožnosti še niso nezmotljive: Comet pri zahtevnejših ukazih včasih potrebuje več pojasnil ali poskusov, da pravilno izpelje celotno opravilo, toda smer razvoja je jasna.
Ker lahko Comet (z uporabnikovim dovoljenjem) dostopa do spletnih aplikacij, se odpirajo tudi možnosti za pametno avtomatizacijo osebnih opravil. Primer, ki ga lahko preizkusimo v Gmailu: namesto prebiranja cele mape Prejeto lahko asistentu naročimo, »Pokaži mi samo sporočila od šefa prejšnji teden«, in Comet bo iz Gmailovega vmesnika sam izluščil relevantna sporočila ter izpisal povzetek. Pri sestavljanju odgovorov je pomoč še bolj dobrodošla: asistentu lahko narekujemo osnutek odgovora, on pa ga v polju za sporočilo zapiše slovnično in stilsko izpiljeno. Comet zna poseči tudi v koledar, obenem lahko samodejno poišče podatke o udeležencih sestanka (npr. na LinkedInu) ali pripravi povzetek iz pogovorov po elektronski pošti kot pripravo na sestanek.
Kako pa je Comet videti s tehnične plati? Kot smo omenili, je osnova Chromium. Ključna komponenta vsakega pametnega asistenta je seveda jezikovni model v ozadju. Perplexity ima lastno UI-ogrodje, ki ga je doslej uporabljal za svoj iskalnik in pogovornega asistenta. Po navedbah podjetja Comet uporablja kombinacijo njihovih internih modelov (poimenovanih Sonar in R1) ter več zunanjih velikih jezikovnih modelov (LLM) elitnega razreda, kot sta ChatGPT in Anthropic Claude. Perplexity sicer ne razkriva natančno, kako deluje, saj uporabnik ne izbira ročno, kateri UI-model se bo uporabil.
Zanimivo je, da so pri Perplexityju veliko poudarka namenili lokalnemu procesiranju. Comet naj bi marsikatero lažje opravilo (npr. analiziranje trenutno odprte strani, osnovno razumevanje besedila) zmogel izvesti v sami napravi, brez pošiljanja vsebine v oblak. To je mogoče, ker sodobni osebni računalniki zmorejo poganjati srednje velike modele za specifične naloge (denimo prepoznavo konteksta strani, osnovno povzemanje) tudi lokalno. Ko pa zastavimo zahtevnejše vprašanje, ki zahteva široko razumevanje ali sveže podatke, brskalnik v ozadju pošlje poizvedbo na strežnike Perplexity.
Kar zadeva nastavitve UI-funkcij, Comet ponuja nekaj možnosti prilagoditve. V nastavitvah zasebnosti lahko določimo, v kolikšni meri naj asistent uporablja zgodovino brskanja za personalizacijo odgovorov (konservativnejši lahko to izključijo). Mogoče je tudi izklopiti, da bi asistent pasivno analiziral vse odprte zavihke, če mu raje eksplicitno naročimo, naj nekaj prebere. Drugih, bolj tehničnih nastavitev (npr. izbira modela ali »kreativnosti« odgovora) za zdaj vmesnik ne izpostavlja. Filozofija avtorjev je, da naj UI deluje čim bolj optimalno že ob prvi uporabi, ne da bi moral uporabnik o tem razmišljati.
ChatGPT Atlas
Za prihodnost razvoja brskalnikov in načina uporabe interneta je verjetno ključno vprašanje, kaj bo na tem področju naredil OpenAI. Zanimivo je, da smo morali na odgovor čakati le nekaj tednov, odkar smo prvič preizkusili prvi UI-brskalnik (Comet). OpenAI je namreč predstavil brskalnik ChatGPT Atlas, ki združuje najbolj priljubljeno orodje za umetno inteligenco z najbolj priljubljenim iskalnikom.

Tudi Atlas je brskalnik, ki temelji na odprtokodnem Chromiumu, kar pomeni, da so ubrali podobno pot kot Perplexity UI. Brskalnik uporabniku omogoča, da v kontekstu spletnega raziskovanja neposredno uporabi ChatGPT za povzetke strani, analizo, pisanje ali avtomatizacijo opravil. OpenAI poudarja, da gre za korak bliže »superasistentu«, ki razume spletni svet in ima dostop do uporabnikovih navad ter zgodovine brskanja.
Med opaznejšimi novostmi so integrirana klepetalna vrstica ChatGPT znotraj brskalnika, možnost postavljanja vprašanj glede trenutne spletne strani, povzemanje informacij, primerjave izdelkov in celo agentni način delovanja, kjer UI prevzame opravila namesto uporabnika (npr. rezervacija, nakup). Dodana je tudi funkcija »spomina«, kjer brskalnik beleži podatke o brskanju, preteklih poizvedbah in dejavnostih, da lahko ponuja bolj personalizirane predloge in odzive.
Brskalnik še vedno uporablja znane elemente spletnega iskanja iz Chroma. Ko uporabnik želi iskati slike, videoposnetke ali novice, Atlas ponudi te možnosti, čeprav je še vedno močno naslonjen na klasično strukturo brskanja. Prav tako je dizajn čist in brez navlake, kar za mnoge pomeni svež pristop.
Za tiste, ki veliko časa namenijo raziskovanju, branju spletnih člankov in želijo podporo pri sintezi informacij, Atlas prinaša dodano vrednost. Hitro povzemanje strani, kontekstno vnašanje vprašanj in možnost prehoda iz brskanja v klepet z asistenco lahko olajšajo delo.
Ker gre za brskalnik, ki temelji na stabilni osnovi (Chromium), pri uporabi in deloavnju ni presenečenj, čeprav se včasih pojavi čakanje pri zahtevnejših poizvedbah, kar lahko pripišemo uporabi UI-funkcij v oblaku OpenAI. Prav tako se agentni način občasno zatakne. Naloge agenta včasih trajajo dlje, kot bi pričakovali, ali pa naletijo na ovire in se ne izvršijo. To opažamo tudi pri drugih UI-brskalnikih in je simptom trenutnega stanja odzivnosti ter stabilnosti odgovorov na področju UI-agentov.
Najpomembnejši alarm ob prihodu Atlasa predstavljata varnost in zasebnost. Zaradi funkcije spomina brskalnika in integracije UI-asistenta, ki lahko deluje samostojno, so strokovnjaki že opozorili na mogoče zlorabe, kot so nenadzorovano zbiranje podatkov, avtomatizirana dejanja na uporabnikovem računu ter potencial za vstavljanje zlonamernih ukazov v jedro UI prek na videz nedolžnih spletnih vsebin.
OpenAI poudarja, da podatki, ki jih Atlas zbira v spominu brskalnika, niso namenjeni oglaševanju in naj bi bili hranjeni le omejen čas, na primer 30 dni, preden se izbrišejo. Motijo pa privzete nastavitve. Uporabnik ima sicer možnost izklopiti beleženje za določene spletne strani ali izbrisati posamezne »spomine«. Prav tako je agentni način privzeto nastavljen tako, da mora uporabnik potrditi izvajanje naloge, če ta vključuje občutljive podatke. Kljub temu ostaja občutek, da je nadzor nad podatki zapleten in ni povsem pregleden za povprečnega uporabnika.
Atlas je v nasprotju s tekmeci že na voljo vsem uporabnikom, ne le ozkemu krogu preizkuševalcev ali zgolj v posameznih državah. Trenutno je na voljo le za macOS, načrtovane različice za Windows, iOS in Android pa bodo na vrsti nekoliko kasneje.
Zgodnje pomanjkljivosti in dvomi
Vsak, ki razmišlja o uporabi naprednih brskalnikov, opremljenih z orodji UI, se gotovo vpraša o varnosti in zasebnosti. Na področju varnosti Comet in Atlas temeljita na Chromiumu, kar pomeni, da sta privzeto približno tako varna kot Chrome ali Edge. Glavna skrb se nanaša na to, da brskalnik z vgrajeno UI dobi velik vpogled v naše aktivnosti. Če želimo v celoti izkoristiti njegove zmožnosti, bomo brskalniku dejansko dovolili brati naše spletne vsebine, e-pošto, koledar, morda celo shranjevati povzetke. To pomeni, da moramo ponudnikom zelo zaupati. Tako Perplexity kot OpenAI trdita, da uporabniških podatkov ne bosta zlorabljala in jih brez privolitve ne bosta uporabljala za urjenje svojih modelov. V njunem pravilniku o zasebnosti je navedeno, da se zbrani podatki lahko uporabljajo za izboljšanje storitve, vendar v anonimizirani obliki. Ali je to povsem res, bo pokazal čas.
Perplexity na nekatere pomisleke odgovarja s t. i. lokalnim načinom obdelave (Strict Mode), kjer naj bi se občutljive naloge (npr. povzemanje e-pošte) izvajale izključno lokalno. Pri hitrem testu zgodnje različice se nam sicer zdi, da ta obljuba še ne deluje tako, kot je zapisano. Kljub obljubam o zasebnosti se je dobro zavedati, da popolne zasebnosti ni. Če uporabljamo oblačne UI-storitve, vedno obstaja tveganje, da se kak podatek prenese na strežnik ali tam shrani. Za povprečnega domačega uporabnika to verjetno ne bo kritično, za podjetja in poslovne uporabnike pa bo treba dobro premisliti, kaj zaupajo takemu orodju.
Omeniti velja še, da Perplexity (v nasprotju z Googlom) ne služi z oglasi in nima neposrednega interesa profilirati uporabnikov za marketinške namene. Njihov poslovni model temeljí na plačljivih naročninah za napredne funkcije. Od tod izhaja tudi glavni razlog, zakaj Cometa verjetno ne bo uporabljalo prav veliko ljudi. Trenutno je brskalnik mogoče uporabljati le z naročnino Max, za katero je treba mesečno odšteti zajetnih 200 dolarjev. Mesečno! Ali pa dobiti povabilo za preizkus, kar se je z malo sreče zgodilo v mojem primeru. Verjamem, da bo Perplexity sčasoma ponudil cenejše pakete, vendar je to daleč od tega, da bi brskalnik lahko resnično nadomestil (brezplačne) konkurente.
Atlas gre v drugo smer, saj je brskalnik povsem brezplačen, raven UI-storitev, vgrajenih v brskalnik, pa je odvisna od plačljivega (ali brezplačnega) modela za ChatGPT, ki ga uporabniki že imajo. Jasno je, da merijo više (beri: Google). Slutimo, da se bo to v prihodnje spremenilo, dejstvo pa je, da ima OpenAI precej več denarnih sredstev za brezplačne storitve, kot si jih lahko privošči startup, kot je Perplexity. Žal se spet ponavlja zgodba Davida proti Goljatu.
Naj bo nova tehnologija še tako revolucionarna, nikoli ni brez hib. Comet je ob svoji splavitvi navdušil, a uporabniki so opazili tudi nekatere pomanjkljivosti. Če upoštevamo, da je brskalnik trenutno še v beta fazi, ni presenetljivo, da šepa v zanesljivosti delovanja. Kompleksna navodila je zato včasih treba preoblikovati ali postopno razdeliti, da jih uspešno izvede. Odgovori so pogosto hitri, drugič pa nerazumljivo počasni. Ker gre v osnovi za Chromium brskalnik, je Comet precej požrešen pri pomnilniku, še bolj kot Chrome. Nekaj uporabnikov poroča o opazno večjem številu halucinacij, čeprav se Perplexity sicer ponaša z natančnostjo svojih odgovorov in citiranja virov. Na našem testu je večino odgovorov opravil korektno, brez opazno izmišljenih odgovorov.
(Ne)varnost …
Strokovnjaki za varnost opozarjajo na nov tip nevarnosti, ki jo prinaša nova generacija UI-brskalnikov. Ti obljubljajo zmožnost samodejnega izvajanja opravil, od iskanja po spletu do spletnih nakupov, vendar tak »agentski« pristop prinaša tudi novo vrsto nevarnosti, imenovano prompt injection.
Tak način varnostnih napadov pomeni, da sistem prejme skrita navodila, ki jih uporabnik sam ni vnesel. Lahko gre za neposreden vnos besedila v poziv ali za posredno obliko, kjer so zlonamerni ukazi skriti v spletnih straneh, dokumentih ali slikah, ki jih UI poskuša povzemati. Brskalnik takšna navodila razume kot zakonita dejanja – na primer, da odpre e-pošto, prebere naslov zadnjega sporočila in ga pošlje na tuj strežnik.
Raziskovalci so že dokazali, da so zgodnje različice Cometa na ta način »uspešno« izdale podatke uporabnika brez njegove vednosti. Ob predstavitvi brskalnika Atlas sprva ni kazalo, da je dovzeten za tovrstne napade, vendar so kasnejši testi pokazali, da lahko zlonamerni ukazi tudi tam spremenijo nastavitve ali nadomestijo odgovore z lažnimi. Še huje, napadalci lahko v naslovno vrstico vnesejo posebej oblikovane URL, ki sprožijo nevarna dejanja, na primer brisanje datotek v Google Drivu.
Ker so UI-brskalniki lahko povezani z osebnimi storitvami, kot je Gmail, OneDrive ali Outlook, ima uspešen napad lahko resne posledice. Poleg tega obstaja nevarnost cross-site request forgery, kjer zlonamerno spletišče pošilja ukaze v imenu uporabnika. Takšne spremembe lahko celo »preživijo« ponovni zagon ali prijavo na drugem računalniku.
… in pravo
Prikriti napadi z zlonamernimi ukazi za UI niso edina nevšečnost novih brskalnikov. Perplexity se je z brskalnikom Comet že zapletel v tehnološki in pravni spor z Amazonom. Ta očita, da agentski način nakupovanja v spletni trgovini Amazon ob pomoči agentov v Cometu predstavlja nevarnost za uporabniško izkušnjo in varnost, saj takšni programi uporabniške poverilnice uporabljajo brez uradnega dovoljenja.
Po navedbah Amazona brskalnik Comet poskuša prikriti svojo identiteto pri dostopu do Amazona, kar odpira vprašanja o skrivanju UI-dostopov, podobno kot pri primerih spletnega strganja podatkov (web scraping). Amazon je podjetju Perplexity UI že poslal zahtevo za prenehanje delovanja (cease and desist) agentske podpore za nakupovanje, sicer bo sledila uradna tožba.
Spor se ne vrti le okoli tehničnih omejitev, temveč tudi okoli pravice do digitalnih posrednikov. Perplexity se brani, da so agentski sistemi zgolj podaljšek uporabnikove volje, podobno kot orodja v delavnici. Po njihovem mnenju Amazon s tem omejuje pravico posameznikov, da uporabljajo digitalne pomočnike po lastni izbiri.
Zaradi vsega naštetega ni odveč, da vsakdo dobro premisli, kje in kako bo brskalnikom in vgrajenim UI-orodjem omogočil dostop do občutljivih podatkov. Ponudniki brskalnikov pa morajo te ranljivosti odpraviti in poskrbeti za večjo odpornost na napade prek orodij umetne inteligence.
Nova izkušnja uporabe svetovnega spleta
Po razmeroma kratkem preizkusu brskalnika Comet in še krajšem preizkusu brskalnika Atlas so moji prvi vtisi večinoma pozitivni. Za kar nekaj opravil sem raje uporabljal UI-brskalnike kot Chrome. Priznam pa, da Chrome še naprej ostaja daleč prva izbira. Prvi razlog so izkušnje in zaupanje, drugi pa je morda bolj banalen, a realen. Po desetletjih uporabe spletnega brskalnika smo vajeni njegovega današnjega videza in načina delovanja, zato je težko preiti na opazno drugačen režim dela.
Zanimivo je prebirati mnenja drugih preizkuševalcev, ki prav tako le redko takoj preidejo na Comet ali Atlas. Kljub temu menim, da novi brskalniki dejansko pomenijo pogled v prihodnost brskanja. Menim tudi, da ostali ponudniki, predvsem Google, ne bodo stali križem rok, zato lahko podobne funkcije kmalu pričakujemo tudi v bolj uveljavljenih brskalnikih.
Takšna napoved pa ima lahko tudi slabost. Če bo Google šel po tej poti, bo to pomenilo, da bo znova nadzoroval trg brskalnikov, iskalnikov in nato še umetne inteligence. Če se to res zgodi, bo to zagotovo sprožilo nov rdeč alarm po svetu, najprej verjetno v EU. Ravno zdaj, ko je Google dobil oprostitev ameriške administracije, ki je snovala ukrepe, s katerimi bi ga prisilili v prodajo Chroma. Vprašanje je torej politično in taktično, ne tehnološko. Morda bo prav zato brskalnikom, kot sta Perplexity in Atlas, celo uspelo. Seveda če bodo ponujali več kot prihajajoče različice uveljavljenih brskalnikov.
Umetna inteligenca v drugih brskalnikih
Medtem ko nekateri ponudniki ponujajo povsem nove brskalnike z vgrajeno umetno inteligenco, obstoječi brskalniki pridobivajo sveže umetnointeligenčne funkcionalnosti in te pogosto zrcalijo tiste, ki jih uvajajo novinci na tem področju. To zagotovo velja za Google in Microsoft, ki obvladujeta področje spletnih brskalnikov in si bosta prizadevala to ohraniti tudi v času umetne inteligence.
Najbrž ni presenečenje, da je le nekaj dni po našem prvem testu brskalnika Perplexity Comet družba Google za brskalnik Chrome predstavila niz novih funkcij, ki temeljijo na umetni inteligenci in so namenjene hitrejšemu ter učinkovitejšemu opravljanju vsakodnevnih opravil. Med najodmevnejšimi novostmi je možnost samodejnega povzemanja spletnih strani, ki uporabnikom omogoča, da hitro razumejo bistvo vsebine, ne da bi morali prebrati celotno besedilo. Poleg tega bo Chrome znal pomagati pri pisanju, denimo pri izpolnjevanju spletnih obrazcev, oblikovanju elektronske pošte ali ustvarjanju kratkih sporočil, kjer bo UI predlagal ustrezne stavke in slog. Uporabniki bodo imeli na voljo tudi naprednejše iskanje po zgodovini brskanja, ki temelji na razumevanju vsebine, ne zgolj ključnih besed.

Googlovi UI dodatki za Chrome so zaenkrat še zakopani pod množico razvojnih nastavitev.
Vse nove zmožnosti poganja tehnologija Gemini Nano, Googlov model za generativno umetno inteligenco, ki deluje neposredno v brskalniku. To pomeni, da se večina obdelave izvaja lokalno v napravi, kar zmanjšuje odvisnost od zunanjih strežnikov, s tem pa povečujeta hitrost delovanja in varnost podatkov. Google poudarja, da bodo uporabniki imeli popoln nadzor nad uporabo teh orodij, saj jih bodo lahko kadarkoli vključili ali izključili.
Novosti bodo najprej na voljo v ZDA, nato pa jih bo Google postopoma uvedel tudi na drugih trgih. S tem nadaljuje strategijo širjenja umetne inteligence v vsakdanje storitve, ki smo ji bili priče že pri Gmailu in spletni pisarni. Chrome se tako razvija v vsestransko orodje, ki presega klasično brskanje po spletu in postaja pomočnik pri ustvarjanju, organizaciji in produktivnosti.
Microsoft
Microsoft je v najnovejši različici brskalnika Edge predstavil eksperimentalni Copilot Mode, ki prinaša radikalno drugačen način brskanja: namesto da brskalnik le čaka na ukaze uporabnika, deluje kot aktivni pomočnik, ki razume kontekst, predvideva uporabnikove potrebe in samodejno pomaga pri nalogah.
Copilot Mode je nova, poenostavljena stran z zavihkom, na kateri najdemo eno samo vnosno polje, združeno s funkcijami klepeta, iskanja in spletne navigacije. Copilot v tem primeru dobi dostop do drugih odprtih zavihkov (če mu to dovolimo) in lahko pregleda celotno stanje iskanja – s tem omogočimo, da primerja ponudbe, združi informacije ali izbere najboljšo možnost, ne da bi preklapljali med zavihki. Copilot bo lahko z dovoljenjem uporabnika dostopal tudi do zgodovine brskanja in gesel, da bo opravil dejanja, kot so rezervacije ali urejanje opravkov.
Poleg tega je uvedena možnost upravljanja z glasom – Copilot zdaj razume naravne glasovne ukaze, s katerimi lahko poiščemo informacije ali odpremo izbrane zavihke. Za zdaj je Copilot Mode na voljo kot izbira, ki jo mora uporabnik izrecno vklopiti v nastavitvah brskalnika, če želi preizkusiti novo izkušnjo brskanja.
Novi brskalniki
Poleg razširitev za obstoječe brskalnike nastajajo tudi povsem novi brskalniki, kot je Comet, kjer je umetna inteligenca v ospredju. Junija je družba The Browser Company, zdaj del korporacije Atlassian, predstavila svoj brskalnik Dia. Ena ključnih njegovih lastnosti je vgrajen klepetalnik, ki se pojavi na strani z novim zavihkom, hkrati pa ga je mogoče aktivirati tudi v kateremkoli drugem zavihku. Uporabniki lahko z njim na tekočem spletnem mestu zastavijo vprašanja, povzemajo vsebino ali celo povežejo več odprtih zavihkov pri analizi ali ustvarjanju besedil.
Kar zadeva zasebnost, avtorji zagotavljajo, da nobena vsebina, deljena z brskalnikom Dia (vključno z zgodovino brskanja in vprašanji), ni trajno povezana z uporabniškimi računi, ampak se izbriše po 30 dneh. Brskalnik, ki temelji na brskalniku Arc, je sicer v beta fazi, a se zelo hitro razvija. Nedavno so izboljšali »dolgotrajni pomnilnik« in zmožnost izvajanja preprostih nalog. Trenutno je na voljo samo za macOS, vendar je v pripravi tudi različica za okolje Windows.
Družba Opera v svoje brskalnike že dalj časa vgrajuje preprostejše UI-funkcionalnosti, a so ravnokar predstavili povsem nov brskalnik z imenom Opera Neon, ki bo po najavljenih lastnostih najresnejši konkurent Cometu. Avtorji ga imenujejo »agentski brskalnik« (agentic web browser), ki zna delati povzetke, primerjave med vsebinami več zavihkov, analizo preteklih sej in izvajanje nalog, na primer samodejno nakupovanje.

Opera Neon naj bi znala delovati avtonomno, kar pomeni, da zmore prebirati vsebine (na primer elektronsko pošto, spremembe na spletni strani) in na tej podlagi izvesti ustrezno aktivnost, na primer poslati obvestilo ali pripraviti povzetek. Opera izdelek namenja predvsem podjetjem, kar se kaže tudi v strategiji, da bo na voljo samo z naročnino približno 20 evrov na mesec.
Med funkcijami, ki izstopajo, sta Tasks in Cards. S Tasks je mogoče kombinirati vsebino več zavihkov in UI ukazati, naj deluje v širšem kontekstu; Cards pa so vnaprej pripravljene bližnjice, ki omogočajo pripravo učinkovitejših promptov za posamezno nalogo. Posebej ambiciozno se zdi orodje Make, s katerim Neon po navodilih uporabnika samodejno generira spletne strani, igre, videoposnetke ali orodja.
Vtičniki za obstoječe brskalnike
Vgrajena integracija med brskalnikom in orodji umetne inteligence, kot so Comet, Neon in podobni projekti, je le ena od poti do povezave med brskalnikom in orodji UI. Druga možnost so seveda različni vtičniki, ki so danes na voljo za večino brskalnikov, še posebej za Chrome.
Med najbolj razširjenimi so Merlin UI, ChatGPT for Google, Perplexity UI ter orodja, kot so Grammarly, Fireflies.UI in Glasp UI. Merlin UI velja za enega najbolj vsestranskih, saj omogoča hitro povzemanje vsebin, generiranje besedil in pomoč pri raziskovanju spletnih strani. Chrome vtičnik ChatGPT for Google poveže zmogljivosti ChatGPT neposredno s spletnim iskanjem ter omogoča odgovore in ustvarjanje besedil na podlagi kontekstualnih vsebin spletnih strani. Perplexity UI deluje kot UI-asistent v brskalniku, ki združuje rezultate iz več virov, pojasnjuje informacije in podaja povzetke.
Druge pogosto uporabljane razširitve z umetno inteligenco so Grammarly, ki v realnem času izboljšuje jezikovne napake in slog pisanja, podoben slovenskemu InstaText (ki se sicer pohvali, da NE temelji na umetni inteligenci!), Fireflies.UI, ki samodejno prepisuje sestanke z zaznavanjem govorcev in jezikov, ter Glasp UI, ki omogoča označevanje, organizacijo in sinhronizacijo poudarkov ter zapiskov na spletnih straneh.

Najpogostejši načini rabe so povzemanje dolgih člankov, pomoč pri pisanju poštnih sporočil in vsebin, samodejno ustvarjanje predlogov, prepisovanje besedil, pomoč pri kodiranju in iskanju podatkov. Pri uporabi tovrstnih vtičnikov je seveda potrebna previdnost: vsak vtičnik ima dostop do vsebin v brskalniku, kar odpira vprašanja o zasebnosti in porabi zmogljivosti.
Vse navedeno kaže, da se bodo brskalniki močno usmerili v integracijo z umetno inteligenco. Strokovnjaki za kibernetsko varnost opozarjajo, da to prinaša povsem nove, doslej še nevidene nevarnosti. Poseben problem predstavlja tehnika, znana kot prompt injection, s katero lahko napadalci vstavijo škodljive ukaze z nevidnim jezikom v »pogovoru« z UI, brez potrebe po »klasičnem« hekerskem vdoru.
Ključna slabost doslej videnih brskalnikov in dodatkov za avtomatizacijo (agentsko delovanje) je nezmožnost razlikovanja navodil, ki jih brskalnik prejme od uporabnika, od skritih navodil, ki so vstavljena v spletno vsebino. V brskalniku Comet so že demonstrirali tovrsten uspešen poskus zlorabe.

V širšem kontekstu gre za premik paradigme v kibernetski varnosti: namesto klasičnih napadov na infrastrukturo ali izkoriščanja ranljivosti programske opreme se grožnje selijo v jezikovno manipulacijo vmesnikov. Prompt injection napadi uporabljajo naravni jezik, kar pomeni, da napadalci ne potrebujejo znanja o kodni strukturi sistemov – zadostuje premetenost pri oblikovanju ukazov.
V luči teh ugotovitev strokovnjaki svetujejo uvedbo zaščitnih metod, kot sta strogo ločevanje uporabniških navodil od procesirane vsebine in validacija vsakega prevzetega koraka. Po poročilu raziskovalcev, ki so proučevali avtonomne UI-agente, se kot učinkoviti pristopi predlagajo večplastne varnostne strategije – na primer čiščenje vhodnih podatkov (input sanitization), namensko izoliranje načrtovalcev in izvedbenih modulov ter preverjanje sej.

