Objavljeno: 19.3.2017 01:00

Prepis zvočnih zapisov s pomočjo umetne inteligence

Kdorkoli je moral kdaj narediti prepis zvočnega zapisa, najbrž ve, da je to zamudno in monotono delo. Toda razvoj tehnologij na temelju razpoznave govora in umetne inteligence obljublja, da se bo to najbrž že kmalu izrazito spremenilo. Kitajski velikan Baidu je tako razkril prototip novega orodja, ki omogoča zmanjšati čas prepisov za kar okoli 40%.

Spletna storitev Swiftscribe temelji na lastniškem razpoznavalniku govora Deep Speech 2, ki je zgrajen na nevronski mreži z zmožnostjo strojnega učenja. Drugi del inovativne storitve pa je popolna sinhronizacija med zvočnim zapisom in razpoznanim besedilom. Ko se prepisovalec premika po časovni osi zvočnega zapisa, se sproti premika tudi označba pozicije v besedilu.

Na ta način je nato zelo preprosto opraviti zamenjavo besede, če jo je algoritem napačno razpoznal. Obenem pa se razpoznavalnik na ta način sproti uči novih kombinacij besed in različic izgovorjave s čimer gradi zanesljivost celotnega sistema. Orodje je za zdaj še v zaprti preizkusni fazi, končna različica pa bo namenjena vsem, ki pogosto ali redno prepisujejo zvočne zapise v besedila. Sistem za zdaj deluje v angleščini in kitajščini, v načrtu pa je podpora tudi za druge jezike.

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Google zapira zadnja vrata za blokiranje oglasov

    Google bo s prihajajočimi posodobitvami spletnega brskalnika Chrome dokončno onemogočil delovanje priljubljenih razširitev za blokiranje oglasov, kot je uBlock Origin.

    Objavljeno: 16.6.2026 10:00
  • Google nam bo zaklenil ekosistem Android

    Dolgo vrsto let je bila ena izmed glavnih prednosti ekosistema Android njegova odprtost, saj za razliko od konkurenčnega Applovega iOS-a ni imel omejitev za nameščanje aplikacij. Resda je Google preverjal aplikacije, ki jih je uvrstil na svojo tržnico Play Store, a vsakdo je lahko mimo te tržnice namestil karkoli, če je z interneta prenesel namestitveno datoteko. Postopek se imenuje sideloading in je na primer na iOS onemogočen. To se bo zdaj zgodilo tudi na Androidu.

    Objavljeno: 19.6.2026 05:00
  • Getty Images bo sodeloval z OpenAI, delnica se je čez noč podvojila!

    Podjetje Getty Images je v nedeljo sporočilo, da bodo sodelovali z OpenAI. Priljubljeno orodje umetne inteligence ChatGPT bo lahko brskalo po Gettyjevi knjižnici podob, se iz njih učilo in jih uporabnikom tudi streglo, kar seveda ne bo zastonj. Koliko bo Getty Images z dogovorom zaslužil, podjetji nista razkrili. Vlagatelji pa menijo, da ogromno.

    Objavljeno: 23.6.2026 05:00
  • Steam Machine razprodan, na eBayu tudi za 3200 USD!

    Žrebanje, ki naj bi preprečilo predprodajo nove konzole podjetja Valve, je končano.

    Objavljeno: 27.6.2026 13:00
  • Microsoft odkril črva, ki krade kriptovalute

    Microsoft je opozoril na odkritje novega in naprednega črva, poimenovanega Crypto Clipper, ki se širi prek okuženih USB ključkov in je namenjen kraji kriptovalut.

    Objavljeno: 23.6.2026 10:00
  • Prihodnji teden bodo potekli certifikati za zagon računalnikov

    Bliža se datum, ki se je pred 15 leti zdel nedosegljivo daleč v prihodnosti. Potekli bodo certifikati iz leta 2011, s katerimi se varuje zagon osebnih računalnikov (Secure Boot), da se nanje ne ugnezdi škodljiva programska oprema že v UEFI/BIOS. Ne glede na operacijski sistem morajo posodobljene certifikate dobiti vsi starejši računalniki, najsi na njih teče Windows ali Linux. Prvi se večinoma posodobi sam.

    Objavljeno: 18.6.2026 05:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji