Objavljeno: 28.5.2019 | Avtor: Matej Huš | Monitor Junij 2019

Dogodki na dlani

Ko je moderni svet začel ustvarjati nepregledne količine podatkov, je kazalo, da nihče več ne bo nikoli obveščen o vsem dogajanju. Besedila je bilo enostavno preveč. Toda tehnološki razvoj je kmalu pripeljal do umetne inteligence in strojnega učenja, ki sta dala orodja za samodejno prečesavanje spleta in združevanje novic. Zdaj računalniki berejo namesto nas in pripravljajo povzetke ter analize. Event Registry je slovensko orodje, ki to obvlada.

Evropska unija vsako leto financira veliko raziskovalnih projektov, pri čemer so v zadnjem času še zlasti zaželeni multidisciplinarni, medinstitucionalni (konzorcijski), kjer poleg znanstvenoraziskovalnih institucij sodelujejo tudi gospodarski partnerji. Epilogi projektov so zelo različni. Praktično vsi se zaključijo z nekaj znanstvenimi objavami, s celim kupom vmesnih poročil in z dolgim končnim poročilom, redkeje pa jim uspe preskočiti v lastno življenje. XLike je primer zadnjih, ki so ga za nameček razvili s slovensko pametjo.

Projekt XLike, ki ga je v letih 2012–2014 financiral EU v sklopu Sedmega okvirnega programa za raziskave in tehnološki razvoj (7FP), je koordiniral inštitut Jožef Stefan (IJS), sodelovali pa so še inštituti in univerze iz Nemčije, Španije, Hrvaške, Kitajske, Indije ter Bloomberg, The New York Times in Slovenska tiskovna agencija. Skoraj pet milijonov evrov težak projekt, ki se je ukvarjal z razvojem tehnologije in orodij za spremljanje, analizo in zbiranje informacij, ki so razpršeno objavljene v različnih internetnih virih v različnih jezikih, se je uspešno zaključil, dve leti pozneje pa je vzniknil startup Event Registry, ki ponuja istoimensko storitev. Še tri leta pozneje ima Event Registry med svojimi strankami IBM, Bloomberg in univerzo Oxford.

Event Registry omogoča prikaz člankov ali dogodkov, njihovo filtriranje in analizo.

V današnjem svetu besedila in podatke ustvarjamo hitreje, kot jih ljudje lahko berejo. To predstavlja problem zlasti v dejavnostih, kjer so potrebne hitre odločitve na podlagi vseh dostopnih informacij. Kot najbolj klišejski primer se vedno spomnimo na borzo, a nekoliko manj hipne, toda še vedno urne odzive potrebujejo tudi medijske hiše, multinacionalke, politika itd. Na pomoč zato priskoči umetna inteligenca.

Orodje Event Registry (eventregistry.org) so razvili v Laboratoriju za umetno inteligenco na inštitutu Jožef Stefan (E3 IJS), danes pa je iz tega nastalo odcepljeno podjetje, ki ga vodi Gregor Leban. Spletno stran lahko Event Registry lahko uporabljamo tudi brez registracije ali z brezplačno registracijo (potrebujemo neki institucionalni elektronski naslov, Gmail ne bo zadosti), smo pa v tem primeru omejeni na 2000 običajnih iskanj, saj nam dodelijo le toliko žetonov.

Event Registry zbira članke več kot 30.000 založnikov z vsega sveta v več kot 30 jezikih. Z uporabo umetne inteligence in strojnega učenja analizira vsebino in samodejno izlušči bistvo, torej predvsem kaj, kje in kdaj se je zgodilo ter kdo je bil udeležen. Ne glede na jezik članka (če je podprt), informacije predstavi v angleškemu govorcu razumljivi obliki. Izid je celovit pregled svetovnega dogajanja.

Od podobnih zbirk člankov se Event Registry razlikuje po dveh pomembnih lastnostih. Prva je napredni sistem filtrov, saj iščemo po ključnih besedah, potem pa lahko članke še dodatno preberemo glede na lokacijo, vir (točno določen vir, razvrstitev po verodostojnosti virov, po specifičnih avtorjih), kategorijo, časovni okvir, jezik, vrsti vira (novica, PR sporočilo, blog), duplikate, število delitev na družbenih omrežjih itd.

Druga, še pomembnejša lastnost, pa je možnost iskanja po dogodkih. Večino pomembnih dogodkov pokriva več medijev, kar pomeni kopico člankov, ki opisujejo isto stvar. Event Registry omogoča iskanje po članku ali dogodkih, kjer so združeni vsi članki, ki govorijo o istem pripetljaju. To znajo tudi nekateri ponudniki, denimo Google News, a Event Registry to počne na precej višji ravni. Uporablja orodje Wikifier, ki so ga sami razvili prav v ta namen in s strojnim učenjem ugotovi, ali skupek člankov opisuje isti dogodek. Potem lahko zadetke razvrstimo in analiziramo po celi kopici metrik, ki jih pripišejo posameznemu dogodku ali članku.

Semantične analize lahko vizualiziramo na različne načine.

Oglejmo si torej, kaj nam omogoča spletni vmesnik. V iskalno polje smo vpisali ime aktualnega premierja (Marjan Šarec) in nastavili prikaz po člankih. V zadnjih 30 dneh, kolikor v preteklost lahko kot zastonjkarski uporabnik segamo, je bilo napisanih 1323 člankov. Event Registry sicer združuje članke vse od leta 2014 dalje. Če se omejimo na slovenščino, je člankov le še 865. Razvrstimo jih lahko po relevantnosti, datumu, dolžini ali viralnosti. Prav zanimiva je zadnja izbira, saj so najbolj viralni povsem drugi članki kakor najbolj relevantni, običajno precej hujskaški in z malo preverljivimi informacijami. Hitro vidimo, da opisujejo iste afere, in res, prikaz po dogodkih odkrije le 65 unikatnih (nekateri članki niso povezanim z nobenim dogodkom).

Zanimiv je pogled v statistiko člankov. Vidimo lahko, katere koncepte omenjajo (premier, Slovenija, Ljubljana, vlada itd.), v katerih jezikih so napisani (večinoma slovenščina, precej tudi angleških, nekaj hrvaških), ključne besede, časovno porazdelitev, vire (večinoma STA, veliko tudi Nova24TV in Demokracija), avtorje, sentiment (večinoma nevtralen, četrtina pozitivnih, deset odstotkov negativnih), grafične ponazoritve konceptov in trendov itd. Če pogledamo razporeditev po dogodkih, so možnosti zelo podobne.

Kar vidimo prek spletnega vmesnika in lahko brezplačno preverimo, je le vrh ledene gore. Pod gladino so celoten model, obsežna zbirka podatkov in infrastruktura. Event Registry za plačljive stranke omogoča tri vrste storitev: Media Intelligence, Media Monioring in News API. Media Intelligence nudi analizo preteklih in aktualnih novic, Media Monitoring je namenjen selektivnemu spremljanju medijev po izbiri uporabnika, News API pa omogoča samodejen dostop do novic in blogov v zbirki prek API-klicev.

Event Registry

orodje za napredno analizo člankov in novic

Kdo: Event Registry, d. o. o (odcepljeno podjetje IJS)

Kje: eventregistry.org

Cena: Osnovna spletna različica brezplačna, po dogovoru.

Za: Agregiranje virov po dogodkih, večjezičnost virov, bogat sistem filtrov.

Proti: Omogoča prijavo z geslom brez HTTPS, spletna stran se zatika.

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji