Objavljeno: 19.11.2014 01:00

Googlov kvantni skok pri razpoznavi slik

Googlovi znanstveniki, ki se ukvarjajo s področjem računalniškega vida, so uspeli naredi veliki preskok na področju računalniškega učenja za razpoznavo in opisovanje fotografij. Novi algoritmi obljubljajo, da bodo računalniki znali pravilno razpoznati predmete na fotografijah in jih obenem samodejno opisati v naravnem jeziku.

Nov algoritem je sliko opisal kot "Dve pizzi na vrhu štedilnika"

Programska rešitev uporablja dva algoritma s področja nevronskih mrež - konvolucijske nevronske mreže (Convolutional Neural Network (CNN)) za razpoznavo predmetov v sliki in Recurrent Neural Network (RNN) za generacijo primernih besedil. Prvi testi, opravljeni na velikih bazah javno dostopnega slikovnega gradiva, kot so Flickr8k, Flickr30k in SBU, so pokazali presenetljivo dobre rezultate.

Nov način razpoznave in opisovanja slikovnega gradiva ima lahko globoke posledice na številnih področjih rabe. Med drugim prinaša nov up za samodejno prevajanje slikovnega gradiva za slabovidne, nevronske mreže pa omogočajo tudi samodejno generiranje opisov v različnih jezikih.

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji