Objavljeno: 17.11.2020 05:00 | Teme: Amazon, oblak, baze podatkov, upravljanje podatkov

Amazonovo lepilo za čiščenje podatkov

Amazon je predstavil novo orodje DataBrew v okviru storitev AWS Glue, ki je namenjeno specifično področju priprave in čiščenja podatkov za zagotovitev kvalitetne nadaljnje analize v drugih oblačnih storitvah. Naprave IoT, večpredstavne vsebine in številne spletne storitve so danes vir čedalje večjega števila najrazličnejših podatkov, ki pa lahko s primerno interpretacijo postrežejo s povsem novimi in potencialno koristnimi spoznanji. Toda podatke je pred uporabo treba ustrezno pripraviti, normalizirati, prečistiti in prilagoditi ciljni storitvi, kar je zamudno oziroma potrebuje specializirana znanja.

Tovrstni postopki pogosto potekajo s specializiranim orodji ali celo programskimi jeziki, kot je jezik R. Toda DataBrew to počne z vizualnim orodjem, ki omogoča pripravo podatkov praktično brez pisanja kode. Programska rešitev omogoča raziskovanje, eksperimentiranje neposredno nad podatki v podatkovnih skladiščih in bazah podatkov.

Uporabniki imajo na voljo čez 250 vgrajenih funkcij, s katerimi lahko delajo transformacije na podatkih, dobršen del teh pa uporablja tehnike strojnega učenja za različne naloge, na primer procesiranje naravnih jezikov, torej besedil. Amazon z novim orodjem cilja predvsem na podatkovne znanstvenike (data scientists), do neke mere pa tudi napredne poslovne uporabnike, ki iščejo nove koristne informacije v svojih podatkovnih zbirkah.

Amazon pa ostaja nekoliko skrivnosten glede cene uporabe orodja DataBrew. V sporočilu za javnost trdijo, da uporabnikom ne bo treba vnaprej plačevati uporabo, zlasti ne za čas eksperimentiranja in iskanja pravilnih postopkov za obdelavo podatkov. Amazon pa pričakuje plačilo za rezultate tovrstnega raziskovanja, ko bodo metode aplicirane na produkcijskih podatkovnih zbirkah.

G8o5ekfbBO4

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Kaj se zgodi, če Samsungov Galaxy Z Fold prepognete 200.000-krat?

    Ustvarjalec vsebin tech-it je s prenosom v živo na YouTubu izvedel maratonski test, v katerem je ročno odprl in zaprl Samsung Galaxy Z Fold 7 kar 200.000-krat

    Objavljeno: 8.8.2025 10:00
  • Programerska naloga, ki je ni rešil nihče

    Vsako leto se najboljši dijaki v programiranju na svetu merijo na olimpijadi iz informatike, kjer nastopa tudi slovenska ekipa. Tekmovalci v dveh tekmovalnih dneh rešujejo šest nalog, kodo pa pišejo v jeziku C++. Ene izmed nalog letos ni rešil nihče izmed 330 tekmovalci.

    Objavljeno: 6.8.2025 07:00
  • Linus Torvalds spet ponorel

    Linus Torvalds, izumitelj in še vedno glavni skrbnik Linuxa, je vedno slovel kot vzkipljiv človek, zato tudi njegov zadnji izbruh ni zelo presenetljiv. Ob pripravi nove verzije jedra 6.17 jih je pošteno napel Palmerju Dabbeltu, ki je predložil kopico popravkov za RISC-V. Torvalds je, milo rečeno, ponorel.

    Objavljeno: 14.8.2025 05:00
  • Xiaomi predstavil pametni ventilator

    Xiaomi je v poletni vročini za evropske trge predstavil Smart Desktop Air Circulation Fan, kompakten pametni ventilator, zasnovan za močan pretok zraka v manjših prostorih. 

    Objavljeno: 6.8.2025 11:00
  • Microsoft bo ukinil enoto GitHub

    Ko je Microsoft leta 2018 prevzel GitHub, se ni nič bistvenega spremenilo, saj je ostal samostojna enota z istim direktorjem. A Thomas Dohmke, ki je od leta 2021čas vodil GitHub, je napovedal odhod iz podjetja, saj ima druge podjetniške cilje. Microsoft zamenjave ne bo iskal.

    Objavljeno: 13.8.2025 05:00
  • Izobraževanje zaposlenih za prepoznavanje ribarjenja je neučinkovito

    Ker so zaposleni eden najučinkovitejših vektorjev za vdore v poslovne sisteme, so različne delavnice, tečaji in urjenja, kako prepoznati ribarjenje (phishing) zlasti v večjih podjetjih postala del rednega izobraževanja. A raziskovalci z Univerze v San Diegu so pokazali, da je uspeh tovrstnih izobraževanj sila pičel.

    Objavljeno: 18.8.2025 07:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji