9 mitov o strojnem učenju

Objavljeno: 24.4.2018 | Avtor: Miran Varga | Kategorija: Monitor Pro | Revija: Maj 2018

Poslovna analitika in poslovno obveščanje pa tudi vse več drugih poslovnih aplikacij se zadnje čase opira na tehnologijo strojnega učenja. Razkrivamo, kaj strojno učenje dejansko zmore in česa ne.

Tehnologije strojnega učenja so se izkazale za nadvse uporabne, zato se zdi, da jih želijo izdelovalci poslovne programske opreme uporabiti na vsakem koraku in ob vsaki priložnosti. Podobno kot druga orodja je tudi strojno učenje uporabno v določenih situacijah, posebej ob reševanju izzivov, s katerimi se stalno soočajo podjetja, a jih ne osvojijo zato, ker si pač ne morejo privoščiti armade zaposlenih, ali pa za doseganje sicer jasnih ciljev, a brez pravega oziroma očitnega načina, kako jih doseči. Seveda bi rada vsaka organizacija izkoristila prednosti strojnega učenja, raziskava podjetja Accenture je ugotovila, da 42 odstotkov podjetij načrtuje, da bo do leta 2021 njihove inovacije podpirala umetna inteligenca. A najprej je treba razumeti, kaj strojno učenje in umetna inteligenca dejansko lahko postorita in čemu nista kos.

Strojno učenje tudi ljudem daje večjo širino in možnost povezovanja prej nepovezanih informacij.

1. mit: strojno učenje je umetna inteligenca

Strojno učenje in umetna inteligenca se pogosto uporabljata kot sopomenki, čeprav to nista. Strojno učenje namreč predstavlja tehniko, ki je uspešno zapustila raziskovalne laboratorije in se uveljavila v stvarnem svetu, kjer podjetjem pomaga povezovati in obdelovati velike količine podatkov in se ob tem kaj novega naučiti. Umetna inteligenca pa je bistveno širše področje, saj zajema področja računalniškega vida, robotike in obdelave naravnega jezika, pa tudi druge pristope, ki ne vključujejo tehnologij strojnega učenja. Umetna inteligenca je oznaka za rešitve, ki naredijo stroje pametne, a trenutno tehnologija še niti približno ni na taki stopnji zrelosti, da bi lahko tekmovala z nami ali celo napadla človeštvo, česar se mnogi bojijo.

V praksi se uporablja veliko krilatic, zato velja biti natančen. Strojno učenje je tehnologija oziroma veda o vzorcih učenja in predvidevanju rezultatov iz velikih nizov podatkov; rezultati se lahko zdijo »inteligentni«, a gre v samem bistvu predvsem za rabo statističnih metod – ker to dela zmogljiva strojna in programska oprema, pa sta hitrost in obseg obdelave podatkov seveda na bistveno višji ravni, kot smo je sposobni ljudje.

2. mit: vsi podatki so uporabni

Za strojno učenje potrebujemo podatke, a vsi podatki niso uporabni za ta namen. Če želimo sistem pravilno (na)učiti, potrebujemo reprezentativne podatke, takšne, ki vsebujejo vzorce in rezultate, s katerimi bo sistem za obdelavo podatkov delal tudi v prihodnje. Potrebujemo torej podatke, ki nimajo nepomembnih informacij, ki bi lahko (z)motile proces učenja. Vsi podatki, ki jih uporabljamo za učenje algoritma, morajo biti ustrezno označeni in opremljeni s funkcijami, ki se ujemajo z vprašanji, ki jih bomo postavili sistemu strojnega učenja. Vse našteto zahteva veliko dela s podatki, preden so ti pripravljeni za obdelavo. Prvo pravilo, povezano s podatki, se glasi takole: ne predpostavljajte, da so podatki, ki jih že imate, čisti, jasni, reprezentativni ali enostavni za označevanje in uporabo.

3. mit: vedno potrebujemo kar največ podatkov

Znaten napredek, ki ga je tehnologija dosegla pri prepoznavanju fotografij, razumevanju strojnega branja, prevajanju jezikov in na drugih področjih, lahko pripišemo predvsem boljšim programskim orodjem in računalniški strojni opremi – predvsem grafičnim procesorjem, ki so kos vzporedni obdelavi velikanskih količin podatkov oziroma označenih nizov podatkov.

Zahvaljujoč zvijači, imenovani prenos učenja, ne potrebujemo vedno velikega nabora podatkov, da bi dosegli dobre rezultate na določenem področju. Namesto tega lahko sistem strojnega učenja naučimo, kako se (na)učiti z uporabo enega velikega nabora podatkov, nato pa mu ponudimo lastno, a veliko manjše podatkovno breme (beri: testne podatke). Prav tako delujejo tudi komercialni vtičniki API, razviti po meri, ki jih ponujata Salesforce in Microsoft Azure: potrebujemo le 30 do 50 slik, ki nazorno prikazujejo, kaj želimo razvrščati, in algoritem se bo temu ustrezno prilagodil in dosegal dobre rezultate. Prenos učenja nam omogoča, da vnaprej naučeni sistem soočimo z lastnim izzivom in ga nato lahko rešimo tudi z razmeroma majhno količino podatkov.

4. mit: vsakdo lahko izdela sistem za strojno učenje

Veliko odprtokodnih orodij in ogrodij za strojno učenje je, pa tudi nešteto vodičev zanje. Toda strojno učenje še vedno velja za specializirano tehniko – znati moramo pripraviti podatke, jih razdeliti na nabor za učenje in testiranje, znati moramo izbrati najboljši (ali pa vsaj primeren) algoritem in še marsikaj drugega, preden algoritem strojnega učenja lahko tako razvijemo, da ga bomo lahko zanesljivo uporabljali v produkcijskem okolju. Pa tudi takrat ga je treba skrbno spremljati in zagotavljati, da ostanejo rezultati natančni (ali relevantni) v daljšem časovnem obdobju, in spremljati, kako se odziva na spremembe v podatkih – do slednjih lahko privedejo spremembe na trgu ipd. Po potrebi je seveda treba algoritem prilagoditi novim razmeram (in podatkom). Izdelava dobrih rešitev s področja strojnega učenja zahteva izkušnje. Če se na to področje šele podajamo, si velja ogledati različne vtičnike API in »prednaučene« sisteme oziroma se »oborožiti« z analitiki in podatkovnimi znanstveniki, ki nam bodo pomagali zgraditi lasten sistem strojnega učenja.

5. mit: vsi vzorci v podatkih so koristni

Bolniki z astmo, bolniki z bolečinami v prsnem košu ali tisti z boleznimi srca in vsi, ki so stari 100 let, imajo, statistično gledano, veliko večjo stopnjo preživetja ob pljučnici, kot bi pričakovali. Preprost algoritem strojnega učenja, ki bi na podlagi enostavnih pravil in osnovnih podatkov o simptomih avtomatiziral sprejem v bolnišnico, bi jih najverjetneje poslal domov. Pravi razlogi za visoko stopnjo preživetja se skrivajo drugje – v bolnišnico so danes sprejeti tako, saj je pljučnica zanje izredno nevarna. Sistem v podatkih vidi veljaven vzorec; ta ne vpliva le na izbiro bolnikov, čeprav bi zavarovalnicam pomagal predvideti stroške zdravljenja, precej bolj nevarno je to, da so v zbirki podatkov tudi »antivzorci«, ki lahko povsem skazijo pravilnost rezultata. V praksi so modeli »črne skrinjice« lahko učinkoviti, a bi bilo za vse bistveno bolje, če bi imeli vpogled v to, na podlagi katerih vzorcev so se kaj naučili, in možnost odločanja, ali rezultatu verjamemo ali ne in na njegovi podlagi (ustrezno) ukrepamo.

6. mit: pomožno učenje je dozorelo

Danes praktično vsi sistemi strojnega učenja znanje osvajajo pod nadzorom človeka. Večino časa se učijo na zbirkah podatkov, ki so jih skrbno pripravili ljudje in za to porabili silno veliko časa (in drugih virov). Prav zato v industriji vlada veliko zanimanje za nenadzorovano učenje oziroma pomožno učenje – kjer se sistem uči s poskusi in napakami ob interakciji z okoljem, nagrajen pa je za pravilno obnašanje. Sistem DeepMind je prav tako premagal svetovne velikane v igri go, sistem Libratus pa je podobno (sicer podprt še z dvema tehnologijama umetne inteligence) obračunal z najboljšimi igralci pokra. Inženirji danes pomožno učenje že preizkušajo na različnih področjih – od robotike do preverjanja varnostne programske opreme. V praksi pa je njihova raba še precej redka – Google sicer rešitev DeepMind uporablja za analizo obremenitev strežnikov v podatkovnih centrih in tako dosega znatne prihranke na področju hlajenja in napajanja.

7. mit: strojno učenje je nepristransko

Bodimo jasni: strojno učenje se uči iz podatkov, zato bo posnemalo morebitne pristranskosti v naboru podatkov. Iskanje slik izvršnih direktorjev bo verjetno prikazalo fotografije belih izvršnih direktorjev moškega spola, saj je več generalnih direktorjev belcev in moškega spola. Neredko se je v praksi izkazalo, da strojno učenje poveča pristranskost. Medtem ko je strežba podobnih priporočil vedenjsko podobnim nakupovalcem v spletnih trgovinah posrečena raba strojnega učenja, slednje kaj hitro postane problematično, ko se sooči z občutljivimi temami. Facebook je to sprevidel med prvimi – njihov pogon priporočanja vsebin je članom skupine, ki nasprotuje cepljenju, mimogrede predlagal še udeležbo v skupinah, kjer uporabniki razpravljajo o različnih teorijah zarote, in skupino, ki meni, da je Zemlja ploska. Za odstranitev pristranskosti bomo torej največ naredili s tem, da bomo ustrezno očistili ali prilagodili učne podatke.

8. mit: strojno učenje se uporablja samo v dobre namene

Tehnologija strojnega učenja je danes sestavni del protivirusnih rešitev, saj preučuje obnašanje škodljivih kod in marsikatero novo odkrije takoj, ko se ta loti neavtoriziranih posegov. Na drugi strani pa hekerji uporabljajo strojno učenje za preverjanje sposobnosti obrambe protivirusnih orodij in za usmerjanje množičnih ciljanih lažnih napadov, pa tudi za analizo velikih količin javnih podatkov in iskanje potencialnih žrtev.

9. mit: strojno učenje bo nadomestilo ljudi

Navadili smo se že na opazke, da umetna inteligenca krade službe in da bo v prihodnosti zagotovo spremenila delovna mesta. Sistemi strojnega učenja vsekakor izboljšujejo učinkovitost in skladnost opravljanja delovnih nalog ter zmanjšajo stroške poslovanja. Dolgoročno bo ta tehnologija tudi ustvarjala nove vloge v podjetju in odpravila tiste zastarele.

Je pa zato strojno učenje že začelo ustvarjati nove poslovne priložnosti, predvsem na področjih izboljšanja uporabniških izkušenj, vzdrževanja strojev in sprejemanja poslovnih odločitev. Drži pa tudi primerjava s prejšnjimi generacijami orodij za avtomatizacijo – za utvarjalnost in ideje bodo tudi v prihodnje (najverjetneje) še vedno skrbeli samo ljudje.

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!
Prijava

ph

Komentirajo lahko le prijavljeni uporabniki