Objavljeno: 25.9.2012 | Avtor: Jure Forstnerič | Monitor September 2012

Podatkovne škatle

Čeprav smo strežnike NAS preizkusili pred manj kot letom dni, se je že nabralo kar nekaj novosti. Tako smo se odločili za nov veliki preizkus in se prepričali, da so te naprave že zelo izpopolnjene in nadvse uporabne.

Za te naprave poznamo v grobem dve vrsti rabe. V osnovi lahko nanje le varnostno kopiramo in jih imamo po možnosti kje daleč stran od računalnika. Uporabljamo pa jih lahko tudi kot velik prostor za shranjevanje vsega po vrsti - prav za to so zadnje čase pri domačih uporabnikih vedno bolj priljubljene. Podatkov je namreč veliko in hitro se množijo.

Vse več uporabnikov ima doma digitalni fotoaparat, ti modeli pa iz leta v leto izdelujejo večje fotografije (gledano v smislu pomnilniškega prostora). Že telefoni so sposobni zajeti fotografijo, ki tehta več megabajtov, fotoaparati pa brez težav sežejo čez deset MB - da o fotografijah RAW, ki tudi pri cenejših DSLRjih obsegajo več kot 20 MB, niti ne govorimo. Vedno več posnamemo tudi video gradiv. Ta res hitro odromajo na YouTube, a praviloma obdržimo tudi originalni zapis.

Kljub zemu, da gre za dve napšravi, namenjeni domačim uporabnikom, ima Synologyjev DS-212j vistveno večji ventilator kot Qnapov TS-212, kar se pozna pri glasnosti delovanja

Za shranjevanje teh pomembnih datotek oziroma podatkov se večina uporabnikov, vsaj doma, še premalo potrudi. Pregovor pravi, da sta dve vrsti uporabnikov - tisti, ki redno izdelujejo varnostne kopije, in tisti, ki se jim še ni pokvaril disk. Preveč ljudi je namreč prepričanih, da so podatki, ki jih imajo shranjene na zunanjem disku, varni. Žal ni tako.

Tudi če gre za kopije podatkov, ki jih imamo v računalniku, je še vedno preveliko tveganje, sploh če je disk v bližini računalnika (ali pa kar priključen nanj). Ob ropu bo storilec pograbil oboje, tako računalnik kot disk. Podobno poguben je lahko za oboje udar strele.

Naprave NAS resda povečajo varnost podatkov, a tudi še ne predstavljajo zadovoljive stopnje varnosti. RAID polja namreč niso celovita rešitev za izdelavo varnostnih kopij. Z njimi iz enačbe pravzaprav izločimo le eno ranljivost - možnost, da nam crkne eden izmed diskov. Še vedno pa se lahko pokvari krmilnik naprave RAID ali pa nam, skupaj z računalnikom, ukradejo tudi napravo RAID.

Podatke moramo torej imeti shranjene na več različnih napravah oziroma krajih. To, da so v nekem NAS strežniku, pa četudi je na varnem pred krajo, požarom in podobnim, nam v nekaterih primerih prav nič ne pomaga. Še vedno se lahko okužimo z virusom in nam ta uniči tudi podatke v napravi NAS (če je seveda dosegljiva iz računalnika). Enako velja tudi za datoteke, ki jih sami nenamerno zbrišemo - RAID nam prav nič ne pomaga, če datoteko izbrišemo tudi tam. Pri datotekah lahko pride tudi do programskih težav (korupcije).

V vseh teh primerih bi potrebovali kopijo podatkov na kakem oddaljenem oziroma odklopljenem kraju. NAS strežnik je torej nadvse učinkovita prva stopnja, še vedno pa moramo tu in tam poskrbeti tudi za varnostno kopijo podatkov, ki so shranjeni v NASu. Vse preizkušene naprave imajo zato kak dodaten vmesnik za prenos podatkov, cenejše imajo USB 2.0, dražje pa tudi USB 3.0 ali celo eSata. Tako lahko podatke na hitro prekopiramo še na zunanji disk in ga po možnosti shranimo na kakem drugem kraju.

Vse bolj priljubljena je tudi raba spletnih storitev, saj nam zagotovijo še dodatno stopnjo varnosti podatkov. Slabost teh storitev pa je cena (gledano na prostor). Najpomembnejše podatke resda lahko shranimo na brezplačne storitve (Dropbox, Wuala, Skydrive, Gdrive ...), za fotografije in video pa bodo te kmalu premajhne oziroma predrage. Tu je seveda še vprašanje zasebnosti (marsikdo raje ne bi delil slik in dokumentov z neznanimi podjetji, četudi se pridušajo, da do datotek pravzaprav nimajo dostopa). To lahko rešimo s predhodnim kriptiranjem datotek, a zahteva kar nekaj znanja in časa.

Strežniki NAS so vedno bolj priljubljeni tudi kot zbirališče vseh možnih večpredstavnih datotek, ki jih lahko dosežemo z različnih domačih naprav. V njih imamo, recimo, shranjene vse filme, vso glasbo in vse fotografije, kar jih premore gospodinjstvo. Vzporedno lahko s pomočjo vgrajenega večpredstavnega strežnika predvajamo film na televizorju, vrtimo glasbo na računalniku in si ogledujemo fotografije na tablici. Tako si prihranimo nadležno kopiranje po različnih ključih USB in diskih - vse je zbrano na enem mestu, ki ga dosežemo z vsemi v omrežje povezanimi napravami.

Večina naprav ima neke vrste nosilce, na katere privijačimo diske, kar olajša njihovo vstavljanje oziroma menjavo.

Polja RAID

RAID (redundant array of independent disks) je standard povezovanja več diskov v eno t. i. polje. Različni načini povezovanja so označeni s številkami v imenu (recimo RAID 1, RAID 5). Najpreprostejša kratica pravzaprav niti ni pravi RAID - govorimo o JBOD, kar je kratica za Just a Bunch Of Drives, ne ponuja pa redundance ali hitrostnih prednosti. Slednje ponuja RAID0, ki izmenično piše na dva diska. S tem resda povečamo hitrost pisanja in branja z diskov, a se podvoji možnost izgube podatkov, saj bomo ob prenehanju delovanja enega diska izgubili vse podatke.

Najbolj enostavno redundanco predstavlja RAID 1. Tu gre za hkratno pisanje podatkov na sodo število diskov (največkrat dva). Oba imata torej popolnoma enako vsebino, ob odpovedi enega so vsi podatki dosegljivi na drugem. To se lahko uporablja tudi v računalnikih, kjer lahko operacijski sistem deluje nemoteno tudi ob odpovedi enega izmed diskov (o tem smo sicer pisali v prejšnji, julijski številki). Tak sistem podpirajo vsi tokrat preizkušeni modeli. Tako kot pri vseh tradicionalnih RAID poljih pa morajo biti vsi diski enako veliki; če niso, se vsi obnašajo, kot da bi bili tako veliki, kot je velik najmanjši disk v polju.

Za večja polja se največ uporablja RAID 5. Zanj potrebujemo vsaj tri diske, v polju pa se za namene redundance porabi en disk. Če imamo torej štiri diske po 1 TB, bomo imeli 3 TB uporabnega prostora, s tem da smo zaščiteni pri odpovedi enega diska (lahko pa vse razširimo tudi tako, da smo zaščiteni pred odpovedjo dveh diskov, a seveda s tem izgubimo še več prostora).

Delovanje RAID 5 je razmeroma preprosto, a ni najbolj znano (že sama logika, da lahko z 1 TB prostora poskrbimo za varnostno kopijo podatkov, ki sicer zasedajo 3 TB, ni najbolj samoumevna). Predstavljajmo si, da imamo na voljo tri diske. Če želimo zdaj zapisati dva enako velika podatka (torej sestavljena iz enakega števila ničel in enic), bomo prvega zapisali na prvi disk, drugega na drugi, na tretji disk pa se zapiše logična operacija XOR med prvima dvema podatkoma. Z dvema od treh podatkov (torej prva dva unikatna podatka in podatek, ki ga dobimo s operacijo XOR) lahko enostavno izračunamo tretjega. Povedano drugače, če odpove prvi disk, lahko s kombinacijo drugega in tretjega nazaj izračunamo podatek, ki je bil sicer izgubljen. RAID 5 pa v tem primeru vse podatke porazdeljuje med diski tako, da se zadnji podatek (ki ga imenujemo tudi paritetni podatek oziroma parity data) izmenično zapisuje na različne diske. Če bi bili vsi paritetni podatki zapisani izključno na en disk, bi šlo za RAID 3, med diski pa se ti podatki v RAID 5 raztresajo zaradi hitrosti, saj bi računanje in pisanje podatkov zgolj na en disk pomenilo ozko grlo pri delovanju polja.

Slabost vseh teh klasičnih RAID polj pa je ta, da morajo biti vsi diski popolnoma enako veliki. Sicer lahko v polja vključujemo diske različnih velikosti, a se bodo obnašali, kot bi imeli toliko prostora, kot ga ima najmanjši disk v polju. To omejitev je premagalo že kar nekaj podjetij, ki so razvila svoje izboljšave za polja RAID - predvsem RAID 5.

Pri cenejših napravah je menjava diskov nekoliko počasnejša, saj moramo odpreti celo napravo.

Prvo je nekoliko bolj odmevno predstavilo svoj sistem ameriško podjetje Data Robotics, ki izdeluje naprave pod znamko Drobo. Imajo različne naprave, ki se razlikujejo po številu diskov in po vmesnikih (prvotni Drobo ni imel omrežnega vmesnika), predvsem pa velja, da jih je nadvse enostavno uporabljati. Žal nam ni uspelo dobiti na preizkus nobene izmed njihovih naprav, ki so na splošno razmeroma drage, vsaj v primerjavi s klasičnimi strežniki NAS.

Pri Drobu ni točno znano, kako deluje sistem, bistvo pa je, da lahko v polje dodamo različno velike diske, naprava pa uporabi skoraj ves prostor, kar ga je na voljo (glede na velikost posameznih diskov lahko še vedno pride do neuporabe nekaj prostora). So pa druga podjetja, konkretno Netgear in Synology, razvila podobne rešitve. Netgear svojo imenuje X-Raid (oziroma X-Raid 2), Synology pa SHR (Synology Hibrid RAID). Pri obeh gre za implementacijo klasičnega RAID 5 v kombinaciji z LVM (Logical Volume Manager, namenjen Linuxovemu kernelu). Diski se navidezno razdelijo na več manjših segmentov in ti se uporabijo v več poljih RAID 5. Če imamo torej dva diska, velika 1 TB, in dva, velika 2 TB, se ustvari eno polje štirih (navideznih) diskov po 1 TB vsako in eno polje dveh (spet navideznih) diskov po 1 TB. Glede na izračune pri uporabi različnih diskov lahko ocenimo, da se tudi pri napravah Drobo dogaja nekaj podobnega.

Prednost teh sistemov je seveda v tem, da lahko polje enostavno povečamo, ne da bi nam ga bilo treba vmes na novo postaviti. To sicer zahteva kar nekaj časa, pri Synologyjevem DS-412+ smo, recimo, pri prvotnem polju z dvema diskoma potrebovali približno 14 ur, da smo ga razširili na 4 diske. Lahko pa seveda tudi menjavamo le posamezne diske za večje modele. Pri štirih diskih, velikih 1 TB, lahko, recimo, dva diska zamenjamo za 2 TB modela, novi prostor se preprosto vključi v polje.

Pri tem je treba upoštevati tudi to, da je vsa ta čarovnija strojno malenkost zahtevnejša od navadnega polja RAID 5. Seveda smo opravili tudi hitrostne meritve, konkretno pri modelu DS-412+, kjer smo poleg meritev pri klasičnem RAID 5 izmerili tudi hitrost pri uporabi SHR. Razlike so seveda bile, a razmeroma majhne - SHR vse meritve upočasni za približno pet odstotkov.

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji