Objavljeno: 15.4.2005 12:59 | Avtor: Matjaž Klančar | Monitor December 2004

Novo bojišče - lokalno iskanje

Google že od svojih začetkov velja za zelo dinamično in inovativno podjetje. Legenda o tem se začne z menda tisoči osebnih računalnikov, ki z lastno različico Linuxa poganjajo www.google.com (oz. z golobi, ki v resnici opravljajo to opravilo, kot šaljivo zatrjujejo avtorji), prek Googlove orodjarne (ki je znala prikazna/popup okna blokirati veliko pred Internet Explorerjem) do hitrega in do uporabnika radodarnega poštnega sistema gmail. Uspeh na borzi je podjetju očitno dal še dodaten zagon, tako da lahko izpod tipkovnic Googlovih programerjev v kratkem pričakujemo (baje) celo lasten spletni brskalnik in odjemalec za trenutno sporočanje. Pred kratkim pa smo z navdušenjem dočakali morda najzanimivejši projekt - "googlovsko" iskanje po dokumentih na lokalnih diskih oz. Google Desktop Search.

Pomislili bi, da je iskanje dokumentov v osebnem računalniku nekaj, kar so programerji že neštetokrat dali skozi, saj ima prav vsak upravljalnik datotek, pa tudi poštni odjemalec, vgrajen nekakšen iskalnik. Tudi Microsoftov Raziskovalec in Outlook oz. Outlook Express. Raziskovalec zna iskati tudi po vsebini datotek (če so pisane v Microsoftovi pisarni), iskanje po elektronski pošti pa išče po vseh besedilnih poljih. Microsoftov poštni strežnik Exchange ima v ta namen lepo urejeno sprotno indeksiranje poštne baze, pa tudi Office vsebuje nekakšnega "pajka", ki naj bi sproti pregledoval vsebino diskovja in si beležil (beri: indeks).

V čem je torej možna izboljšava? V preglednosti in predvsem - v hitrosti. Iskanje datoteke (še posebej po njeni vsebini) lahko v Oknih traja in traaaaja (tudi nekaj 10 minut), še posebej dandanes, ko so diski velikanski. Tudi iskanje poštnih sporočil v Outlooku/Outlook Expressu ni ravno hitro, celo v (dragem, celo zasoljenem) strežniku Exchange ne. Samo kot primer - za iskanje po neki ključni besedi (ki da 80 rezultatov) je naš Outlook (vezan na Exchange Server 2000, na strežniku z dvema procesorjema Xeon 2400 in 2 GB RAM) potreboval 10 sekund (poštna baza vsebuje 68.000 sporočil in je velika čez 2 GB). Novinec Google Desktop je za to potreboval bolj ali manj 0 (nič) sekund - rezultate je izpisal takoj.

(Za Google običajna) preglednost

Osnova Google Desktop je program, ki se sprehodi po vseh datotekah na lokalnih diskih (nekatera poročila v internetu pravijo, da diska D ne zajame, vendar ga nam je), po vsej elektronski pošti (Outlook in Outlook Express), po vseh zapiskih programov za trenutno sporočanje in zgodovini obiskani spletnih strani ter iz prebranih podatkov naredi indeks (za naših 68.000 sporočil in 10.000 datotek je indeks narasel na 300 MB, kar v primerjavi z Microsoftovimi indeksi na strežniku Exchange sploh ni veliko). Začetno pregledovanje lahko traja od nekaj ur do nekaj dni, saj se program trudi delati le takrat, ko je računalnik neuporabljan, tako da uporabnika med delom ne upočasnjuje (mi upočasnitve dejansko nismo opazili). Ko je indeks narejen, se sproti dopolnjuje, kajti program ždi v ozadju in beleži spremembe (pri čemer ga uporabnik vidi le kot ikono v desnem delu osnovne okenske orodjarne, medtem ko dela računalnika prav nič ne upočasnjuje. Opozoriti velja, da je iskanje zares omejeno le na lokalne diske, toda če kakšen dokument odpremo na omrežnem disku, se bo lepo vpisal v indeks.

Ko odpremo najdeno poštno sporočilo, lahko nanj tudi odgovorimo ali ga posredujemo. Vendar se nam bo v ta namen odprl Outlook (oz. Outlook Express).

Www.google.com se je z leti izkazal kot zelo pregleden iskalnik in prav tak je tudi Google Desktop - "uporabniški vmesnik" je kar spletni brskalnik in ustvarjene datoteke HTML, ki so na las podobne tistim, ki jih prikazuje spletni Google. Google Desktop ima namreč svoj "spletni strežnik", ki se oglaša na vratih 4664 (http://127.0.0.1:4664/) in skrbi za posredovanje podatkov o iskanih pojmih. Kot rečeno, iskanje oz. izpisovanje podatkov je trenutno, program pa hkrati išče po vseh tipih podatkov, ki smo jih prej omenili. Po želji lahko prikažemo tudi le omejene oz. delne rezultate, tako da lahko npr. pregledujemo samo elektronsko pošto. Če želimo, lahko omejitev vključimo že v samo iskanje - tako da v iskalnik vpišemo npr. janez filetype:email.

Iskanje po elektronski pošti je še posebej enostavno, saj lahko najdena sporočila sestavimo v t. i. rdečo nit, kako so se vrstila (tega še sam Outlook nikoli ni dobro znal). Razvrstimo jih lahko po datumu ali po pomembnosti, pri čemer ključno vlogo očitno igra to, kolikokrat se iskana beseda pojavi v sporočilu. Vsako sporočilo lahko po želji odpremo tudi v Outlooku, od koder imamo dostop tudi do morebitnih pripetih datotek (iz samega brskalnika to ni mogoče).

Med zadetki so odlično prikazane tudi že obiskane spletne strani. Poleg njih se prikaže pomanjšana slika strani, po kliku povezave pa se odpre lokalna kopija le-te. Med drugim smo na ta način hitro odprli nekaj elektronskih računov, ki smo jih plačali pred časom.

Spletne strani, ki smo jih obiskali, so prikazane tudi s pomanjšano zaslonsko sliko.

Lokalne kopije so koristne tudi pri iskanju dokumentov, saj Google vedno shrani tudi okleščeno (samo besedilno) različico le-teh. Tako imamo lahko dostop do starejših različic nekega dokumenta, ki ga pravkar urejamo.

Koristna je tudi povezanost z Googlovo orodjarno (Google toolbar), saj vsako iskanje prek nje kot prvi rezultat izpiše povezavo do rezultatov, ki jih je Google Desktop našel na lokalnem računalniku. Druge povezave pa so običajne, z interneta, kot smo pri Google Toolbar že vajeni.

Pomanjkljivosti

Trenutna različica Google Desktop je označena kot "beta" oz. razvojna različica, tako da ji je moč najti tudi kar nekaj pomanjkljivosti. Med preizkušanjem se nam je včasih zgodilo, da določenih sporočil ni našel, pa tudi da je sporočilo opremil z napačnimi podatki (napačen pošiljatelj, včasih tudi datum). Občasno smo zasledili tudi težave s predpomnjenjem - določeno datoteko je po prepisovanju na drug disk našel, ko pa smo jo premestili na drug imenik, je iskalnik še vedno vztrajal, da je na prvotnem mestu (tako napako lahko v indeksu ročno zbrišemo). Nekaj težav je tudi s prikazovanjem šumnikov, še posebej, če so ti v imenu pošiljatelja elektronske pošte. Moteči so tudi nekateri protivirusni programi in požarni zidovi, kar na svojih straneh opozarja že Google.

Ena večjih napak oz. že kar odmikov v logiki pa se kaže v nekaterih primerih sestavljanja najdenih sporočil v t. i. rdečo nit. V njej namreč prikaže tudi sporočila, ki iskanega niza sploh ne vsebujejo, in to le zato, ker imajo enak naslov (subject) kakor sporočilo, ki ta niz res vsebuje. Očitno so programerji pri sestavljanju pozabili vnovič preveriti iskani niz...

Bolj kot te napake (ki bodo v končni različici skoraj gotovo odpravljene) motijo omejitve. Tako bodo nesrečni vsi, ki ne uporabljajo Microsoftovih programov za elektronsko pošto. Ker Mozilla sporočila hrani v obliki navadnega besedila, je prav nenavadno, kako da Google Desktop še nima podpore zanje. Prav tako je omejeno iskanje po datotekah PDF (deluje, a slabo), kar precej pa je moteče, da ne deluje po arhivih. Kar nekaj nas je namreč, ki smo pretekla leta zaradi majhnih diskov vse svoje (elektronsko) delo arhivirali po datotekah ZIP. Želeli bi si tudi iskanje slikovnega gradiva (tako kot to zelo dobro obvlada spletni Google). Da bi se tu pozneje znalo kaj premakniti, kaže to, da je Google odkupil podjetje, ki je izdelalo grafični album Picasa (www.picasa.com). Picasa slovi prav po tem, da ima izredno dobro urejeno indeksiranje fotografij. In ne nazadnje - zelo smiselno bi bilo, če bi Google svoje indeksne datoteke nekako zaščitil, zašifriral. Lokalno shranjene kopije poslovanja z elektronsko banko (glej zgoraj) gotovo niso ravno zgled varnostne politike.

Od lepotnih popravkov bi si želeli še več možnosti prilagajanja izpisa. Resda lahko zadetke zdaj razvrščamo po datumu, vendar bi bilo vsaj pri elektronskih sporočilih nujno imeti tudi možnost razvrščanja po pošiljatelju in/ali naslovniku.

Kaj pravi konkurenca?

Specializiranih iskalnikov, predvsem za elektronsko pošto, je na trgu kar nekaj (posvetili se jim bomo v eni prihodnjih številk), toda šele zdaj so se tega posla lotili "veliki".

Nekateri pravijo, da se je Google še prav posebej posvetil iskanju po datotekah Microsoftovih formatov (skoraj vse druge pa zaenkrat zanemaril) le zato, da bi Microsoft tehnologijo nekoč morda odkupil in jo vgradil v Okna. Vendar iz te moke najverjetneje ne bo kruha, saj je Microsoft takoj po Googlovi splovitvi povedal, da "pravkar preizkušajo podobno tehnologijo in da bo ta na voljo kar najhitreje, najverjetneje še letos". Zlobneži so seveda takoj pripomnili, da si je to o "preizkušanju" Microsoft gladko izmislil in da je bil v resnici v razvoj zmogljivega iskalnika prisiljen takoj, ko je Google svetu pokazal, kaj se zares da narediti. Pa vendar - nekakšen prototip izdelka je Microsoft res prikazal že julija, za spodobno iskanje po elektronski pošti pa je celo odkupil specializirano podjetje Lookout Software. Vprašati se je, zakaj toliko let prej tega ni naredil. Odgovor je na dlani - ker ni imel spodobne konkurence.

Sistem hrani več začasnih kopij dokumentov, ki smo jih obdelovali. Le v besedilni različici, a vendar.

In še bolj zabavno - kar naenkrat je tudi Yahoo napovedal, da bo izdelal podoben izdelek, slišati je govorice o različici, ki naj bi jo razvijal AOL, nedavno pa sta enake namene napovedala tudi Apple in Mozilla. Skratka, ko se google.com izkaže za najboljši iskalnik, se v posel (z novimi iskalniki) takoj zaženeta tudi Yahoo in Microsoft; ko se Google Toolbar izkaže kot odlična zamisel, jo takoj posnemata še AOL in Yahoo, Microsoft pa vsaj pobijanje samodejnih oken "popup" vgradi v sama Okna (za trenutek pozabimo, da ima Firefox tako pobijanje vgrajeno že od vsega začetka); ko Google napove, da bo njihov poštni Gmail imel gigabajtno omejitveno kvoto, svoje kvote takoj povišata tudi Yahoo in MS Hotmail. Kot kaže, bo z lokalnimi iskalniki enako - odprta je nova fronta, od katere bomo zagotovo imeli korist predvsem uporabniki. Nenazadnje lahko že danes izbiramo tudi med plačljivimi različicami podobnih programov, ki jih izdelujejo podjetja kot so X1 Technologies, Copernic Technologies in Blinkx.

In še mimogrede - namestitvena datoteka za Google Desktop je velika le 400 KB. V mega in gigabajtih, s katerimi nas zasipajo današnji programerji (na čelu z Microsoftom), smo skoraj pozabili da so programi lahko tudi majhni, hitri in enostavni, pa vendarle še vedno silno učinkoviti.

Google Desktop Search (beta)

Kaj: Iskalnik datotek in elektronskih sporočil na osebnem računalniku.

Izdeluje: Google, desktop.google.com.

Cena: Brezplačen.

Za: Izredno hitro iskanje, pregleden izpis, podobnost izpisa s spletnim Googlom.

Proti: Nekaj napak, ne podpira nekaterih priljubljenih formatov datotek, ne išče po arhivih.

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji