Kdo, kdaj, zakaj?

Objavljeno: 4.2.2007 13:28 | Avtor: Jure Forstnerič | Kategorija: Preizkusi | Revija: Januar 2007

Že od nekdaj nas zanima, kaj si drugi mislijo o nas. Tudi v dobi interneta ni nič drugače, tako da ne čudi, da so že z nastankom prvih internetnih strani začeli nastajati tudi prvi načini štetja obiskov. Pozneje, ko so velike korporacije začele uporabljati internet v komercialne namene, so postali taki podatki še pomembnejši. Toda kako zbrati te podatke in kako jih urediti v berljivo obliko?

Na splošno poznamo dva načina merjenja obiska na svojih spletnih strani. Prvi je z analizatorji strežniških dnevniških datotek, torej strežnikovih "logov" (log analyzer). Skoraj vsi spletni strežniki si zapišejo vse zahtevke, ki jih prejmejo, v neki dnevnik. To ni nič drugega kot besedilna datoteka, v katero se zapisujejo podatki o vsakem zahtevku. Seveda lahko nastavimo podrobnost zapisovanja in tako zapisujemo le osnovne podatke ali tudi naprednejše, kot je npr. posredna stran, prek katere je uporabnik prišel do naše (tracking referer). Drugi način spremljanja dostopa je uporaba zunanjih števcev, ki danes pretežno uporabljajo javascript. To je sicer lažje (predvsem zahteva veliko manj znanja), a nam posreduje manj podatkov, hkrati pa ti niso tako točni kot pri analizatorjih.

Slovarček

Dnevniško datoteko (log file) izdelujejo spletni strežniki. Pravzaprav je to le preprosta besedilna datoteka, v katero se zapisujejo vsi zahtevki po datotekah.

Zahtevek (web hit) pomeni vsak element, ki ga je strežnik dostavil odjemalcu oziroma spletnemu brskalniku uporabnika. To pomeni tako stran HTML kot pripadajoče slike in druge datoteke. "Hit" pri merjenju obiska torej ne pomeni prav nič, saj je odvisen tudi od tega, koliko slik ima posamezna stran ...

Prikazana stran (page view) je bolj relevanten podatek, saj se vsaka stran šteje le enkrat. Posamezne slike in druge datoteke se ne prištevajo.

Obiskovalci so še bolj natančen podatek, vendar ga je v resnici težko pravilno pridobiti. To je možno le s piškotki, ki jih strežnik "servira" brskalniku (če ta nima te možnosti izključene), sicer pa analizatorski programi tipično za drugega uporabnika štejejo tudi v resnici istega uporabnika, ki npr. 20 minut ni naredil ničesar, in se je potem spet pojavil na naši strani. Skratka, dokaj nezanesljiv podatek.

Pri edinstvenih uporabnikih (unique visitors) štejemo vsakega uporabnika le enkrat na dan (oziroma po želji lahko tudi enkrat na teden, mesec, leto ...). To nam pove, koliko ljudi se vrača na našo stran, oziroma koliko jih to stran redno obiskuje.

Posredniška stran (referer) je stran, s katere je uporabnik prišel do naše. Ponavadi gre za iskalnike. Tako vidimo, v katerih iskalnikih smo močno zastopani in v katerih ne (in lahko to popravimo).

Programi za analizo dnevnikov torej pregledajo omenjene datoteke in nam pokažejo neke smiselne podatke, torej nam naredijo poročila. Ta so lahko bolj ali manj preprosta, od tega, da nam narišejo lep grafikon obiska, do informacij o uporabnikovi poti po naših straneh. Standardni podatki so število obiskov na stran (ter število edinstvenih obiskov, kar pomeni, da bo en uporabnik štet le enkrat na dan), čas trajanja obiskov, dnevi in ure največjega prometa, domene in države obiskovalcev.

Včasih pa imamo lahko tudi težave. Če ne drugega, jih je tu in tam težko namestiti in pravilno nastaviti. Program mora preverjati dnevniško datoteko po nekem rednem urniku, tako da imamo vedno sveže podatke. A te datoteke se po nekem določenem ciklu spraznijo, tako da nimamo neskončno dolgega dnevnika obiskov. Po enem tednu se, recimo, datoteka "obiski_log" preimenuje v "obiski_log.old", prvotna se pa prepiše. Programi, ki analizirajo te datoteke, morajo znati rezultate pametno interpretirati, tako da ne štejejo obiskov večkrat, oziroma jih tudi ne izpuščajo. Seveda je tudi možnost, da nimamo dostopa do teh datotek. Če je naša stran v nekem skupnem strežniku, je možnost, da sploh ne moremo dobiti vpogleda v strežniške dnevnike. Je pa res, da veliko gostiteljskih strežnikov omogoča uporabnikom dostop do datotek, ki se tičejo obiska naših strani.

Analizatorji

Analog

Analog se reklamira kot najbolj priljubljen analizator na svetu. Resda je odprtokoden in povsem brezplačen, a tudi njegov razvoj je vedno počasnejši (najnovejša različica, 6.0, je izšla pred dvema letoma). Program je majhen (napisan v Cju), za Okna ga dobimo v obliki datoteke ZIP, le razširiti ga moramo. Deluje tako z Apachejem kot z IIS, ne zna pa delati z dnevniškimi datotekami poštnih in FTP strežnikov. Programu spreminjamo nastavitve prek besedilne datoteke analog.cfg. Tu določimo na primer, kje je naš dnevnik obiskov in kam naj shrani poročilo, ki nam ga vrne kot datoteko HTML. Poročilo nam pove standardne podatke, torej mesečni in dnevni obisk, pove nam gesla, uporabljena v iskalnikih, ki uporabnike vodijo do naše strani, operacijske sisteme uporabnikov, pokaže nam, katere podstrani in katere mape dobijo največ zahtevkov ipd.

Težavna zna biti nastavitev za menjavanje poročil, tako da nam program ne prepiše starih poročil. V besedilni datoteki določimo čas, o katerem naj poroča (recimo en mesec), in ime poročila (lahko uporabimo format "c:\stats\%Y.%M.html"), ne moremo pa avtomatično menjati časovnega obdobja; to pomeni ročno popravljanje datotek vsak mesec. Res je to mogoče rešiti, denimo, s skripti, škoda pa, da ne zna že Analog sam tega početi.

Del preprostega poročila programa Analog

Analog

Izdeluje: Stephen Turner, www.analog.cx.

Operacijski sistem: Windows, Mac OS (8, 9, X), Linux, Solaris ...

Cena: Brezplačno.

Za: Cena.

Proti: Ni rednega razvoja, ne podpira dnevnikov FTP ter poštnih strežnikov.

AWStats

Tako kot Analog je tudi Awstats odprtokoden (napisan je v perlu), s to razliko, da so avtorji tu bolj agilni in razvoj programa lepo poteka. Deluje v skoraj vseh operacijskih sistemih, namestitev ni najlažja, je pa spletna dokumentacija odlična. Program razširimo in če uporabljamo Apache, le še zaženemo perl skript, ki nas vodi po vseh nastavitvah. Ali pa se z namestitvijo pozabavamo ročno ali pa za uporabo z IIS sledimo navodilom na domači strani programa. Program sporoči veliko različnih podatkov, med drugim tudi ločljivost uporabniških zaslonov, vsekakor več kot Analog (denimo tudi vstopno in izstopno stran), pa tudi poročilo je bolj grafično dodelano. Omogoča tudi uporabo zbirke podatkov Maxmind (www.maxmind.com), v kateri lahko preveri imena internetnih ponudnikov, ki jih uporabljajo naši obiskovalci, in imena organizacij, iz katerih prihajajo. Navodila priporočajo uporabo Awstats prek konzole, čeprav je to mogoče tudi prek brskalnika. Na voljo so številni dodatki (plug-ins), s katerimi iz dnevniških datotek iztisnemo še nekaj več podatkov (denimo podatke whois).

Lepo poročilo, ustvarjeno z AWStats

AWStats

Izdeluje: Laurent Destailleur, awstats.sourceforge.net.

Operacijski sistem: Windows, Mac OS (8, 9, X), Linux, Solaris ...

Cena: Brezplačno.

Za: Cena.

Proti: Ne najlažja namestitev.

Visitors

Visitors je še en odprtokodni program, ki pa ima manjši kavelj: namreč za Okna stane kot "binary" (torej že prevedena izvirna koda, tako da ga lahko takoj uporabimo) osem evrov. To je sicer enkratni strošek, nove različice dobimo brezplačno. Seveda pa je na voljo izvirna koda, tako da ga lahko sami prevedemo tudi za Okna. Je pa Visitors vsekakor bolj namenjen operacijskim sistemom Linux. Dokumentacije skorajda ni, oziroma je v obliki strani man (man page, kar pomeni "manual", znana oblika za priročniške informacije programov v Linuxu).

Microsoftovega IIS ne podpira, lahko pa uporabimo program iis2apache.pl za pretvorbo dnevnikov IIS v Apachejeve. Visitors nam poda standardne podatke, zna pa poročilo prirediti tudi prikazu v besedilni obliki (tako kot drugi sicer uporablja html); to je zelo uporabno za tiste, ki uporabljajo terminalski dostop (denimo SSH) do svojega strežnika. Z uporabo programa Graphviz (www.graphviz.org) pa zna narisati tudi grafikone, ki kažejo poti uporabnikov po naši strani, torej katere povezave med stranmi so najbolj izkoriščene.

Visitors, eden izmed bolj priljubljenih odprtokodnih analizatorjev, oziroma njegovo preprosto poročilo.

Primer grafa, ki ga nariše Visitors z uporabo Graphviz.

Visitors

Izdeluje: Salvatore Sanfilippo, www.hping.org/visitors.

Operacijski sistem: Windows, Mac OS (8, 9, X), Linux, Solaris ...

Cena: Brezplačno. Različica za Windows stane 8 evrov, preizkusna različica je brezplačna, a nam poda le zelo osnovno poročilo (izvirna koda je na voljo zastonj, tako da jo lahko sami prevedemo tudi za Windows).

Za: Cena, izvoz poročil v besedilni obliki.

Proti: Ne podpira strežnikov IIS, za Okna brezplačno na voljo le izvirna koda.

WebLog Expert

WebLog Expert je verjetno eden izmed programov, ki jih je najlaže uporabljati. Namestitev poteka grafično, kakor smo navajeni v Oknih, program ima grafični vmesnik, kjer so vse nastavitve na voljo prek menujev, med njimi je tudi urnik za samodejno zaganjanje. Poročila zna prikazati tudi v drugih jezikih, čeprav je podprtih le peščica, slovenščine pa ni med njimi. Je pa dobrodošla možnost izvoz poročila v obliki .pdf. Poročila zna prikazati z lepimi tridimenzionalnimi grafi. Cena programa sicer ni majhna, je pa na voljo brezplačna "lite" različica, a močno okrnjena. Nima urnika, za poročila ne moremo določiti, kaj naj vsebujejo in česa ne, izvoz v pdf ni omogočen, celo mesečne in dnevne statistike nima (le dnevno). Obe različici pa podpirata tako IIS kot tudi Apache. Na strani je omenjena razvojna različica (4.0 beta 5), ki ima "izboljšano" podporo novi Visti.

WebLog Expert se pripravlja tudi na novo Windows Visto.

WebLog Expert

Izdeluje: Alentum Software, www.weblogexpert.com.

Operacijski sistem: Windows (95/98/NT/2000/XP/2003), neuradno tudi Vista.

Cena: 75 dolarjev, različica lite je brezplačna.

Za: Preprosta raba.

Proti: Cena, samo za Okna.

Deep Log Analyzer

Za Deep Log Analyzer bi lahko rekli, da je najdražji, a najbolj dodelan. Deluje samo v Oknih, podpira pa tako IIS kot Apache. Po videzu močno spominja na MS Office in to je prej dobro kot slabo, čeprav je videti, da ima celo preveč možnosti in nastavitev. Vključenih podatkov je zelo veliko, tudi različnih poročil je veliko (ta po privzetem niso združena v eno samo, daljše poročilo, temveč so razvrščena po področjih). Omogoča tudi pregled več poročil hkrati v zavihkih. Program ima tudi nekaj odličnih diagnostičnih funkcij, zna, denimo, pokazati delno končane prenose in prekinjene prenose, kar lahko kaže na težave s strežnikom. Poročila zna filtrirati po datumih, izvozi jih v obliki html, grafikone in tabele pa lahko tudi izvozimo v Excel. Škoda, da ne podpira formata .pdf.

Največja pomanjkljivost programa je seveda njegova cena, sploh ker dobimo popravke in nadgradnje samo za eno leto (je pa to mogoče tudi podaljšati). Osnovna različica je sicer bistveno cenejša, manjka pa nekaj naprednejših funkcij. Tako poročil ne moremo izvozit v Excel, ne omogoča nam izdelave lastnih poročil po meri (torej nimamo na izbiro, katere podatke prikazati in katerih ne), tiskanja poročil, združevanja več poročil v eno datoteko html (kar večina drugih programov privzeto omogoča) ... Za program lahko napišemo tudi skripte v VBScript, JavaScript, ali katerem drugem skriptnem jeziku, ki podpira avtomatizacijo OLE, npr. PHP in Ruby.

Prek zavihkov si lahko ogledujemo različna poročila v odličnem, vendar dragem Deep Log Analizerju.

Deep Log Analyzer

Izdeluje: Deep Software, www.deep-software.com.

Operacijski sistem: Windows (95/98/NT/2000/XP/2003).

Cena: Osnovna različica 150 dolarjev, profesionalna 300 dolarjev, poskusna je na voljo brezplačno za 25 dni.

Za: Preprosta raba.

Proti: Cena, samo za Okna.

Wusage

Wusage je razmeroma star program, že več kot petnajst let šteje, trenutna različica pa je 8.0. A zdi se, da je razvoj zaostal, saj je vmesnik silno okoren in počasen. Program namreč nastavimo in uporabljamo prek spletnega brskalnika, raba pa je daleč od intuitivne. Še dobro, da lahko tudi ročno urejamo besedilne nastavitvene datoteke in da lahko statistiko naredimo tudi prek ukazne lupine. Prikazanih podatkov je dosti, nekako gre za standardne podatke o obiskih, žal so poročila ločena na podstrani, torej niso združena v eno večje html poročilo. Škoda tudi, da program naredi poročilo le v obliki html, torej ne zna izvozit tudi le besedilnega poročila (seveda lahko html beremo tudi kot navadno besedilo, a Visitors ga, denimo, priredi prav v navadno besedilno obliko). Pokaže tudi, kako uporabniki uporabljajo stran, torej njihove poti po naši strani. Podpira tako IIS kot Apache in še nekaj drugih strežnikov (na primer Webstar). Podpira številne operacijske sisteme, na voljo so tudi starejše različice, ki jih lahko uporabljamo v starejših operacijskih sistemih, od MsDOS, NeXTStep do OS/2. Licenca niti ni draga, a je cena kljub temu previsoka, saj Wusage počasi zaostaja za drugimi povsem odprtokodnimi rešitvami.

Neintuitivni vmesnik programa Wusage; laže in hitreje je urejati besedilne datoteke.

Wusage

Izdeluje: Boutell.Com, www.boutell.com/wusage.

Operacijski sistem: Windows, Mac OS 10.2 in novejši, Linux, Solaris 2.8 in novejši (za Intelove procesorje, za sisteme Sparc pa 2.7 in novejši) ...

Cena: Licenca za en spletni strežnik 25 dolarjev, za pet domen 75 dolarjev, brezplačno je na voljo 30-dnevna preizkusna različica.

Za: Veliko podprtih operacijskih sistemov.

Proti: Okoren vmesnik, malo prikazanih podatkov.

Advanced Log Analizer

Advanced Log Analizer (ALA) se izkaže za odličen in preprost program. Podprta sta IIS in Apache, vse nastavitve urejamo prek grafičnega vmesnika. Namestitev je lahka in hitra, program je treba le razširiti. Prikazanih podatkov je silno veliko, pri večini je na voljo spremni grafikon. Pokaže tako zadnjih sto poti po strani, pa tudi najpogostejše poti. Seveda so tu še vstopne in izstopne strani, posredniške strani, s katerih prihajajo uporabniki, informacije o iskalnikih, prek katerih dobimo največ obiska, in podobno. Vsak del poročila lahko priredimo prek vmesnika, določimo lahko na primer, v kakšnih enotah bodo podatki prikazani (MB, GB ...) in kakšne vrste grafikon naj se izriše. Manjka pa, denimo, izvoz v besedilno obliko ali celo v .pdf, uporabljen je le html.

Orodje za tiskanje je učinkovito, omogoča nam natisniti celotno poročilo ali le posamezne strani. Uporabljamo pa lahko tudi različico, namenjeno delu v konzoli, čeprav je ravno preprosta raba grafičnega vmesnika velika odlika tega programa. Cena ni pretirana, v dokumentaciji celo piše, da lahko za majhna domača podjetja uporabljamo prvo, cenejšo različico, če pa ima naše podjetje več kot tri zaposlene, naj bi kupili licenco za poslovno rabo.

Z zelo preprosto rabo in lepimi poročili se lahko pohvali Advanced Log Analizer.

Advanced Log Analizer

Izdeluje: Abacre, www.abacre.com/ala.

Operacijski sistem: Windows (95/98/NT/2000/XP).

Cena: Licenca za rabo doma 50 dolarjev, za poslovno rabo 130 dolarjev, poskusna različica je na voljo 30 dni.

Za: Preprosta raba, dobra poročila.

Proti: Cena, samo za Okna, manjka nekaj naprednih možnosti.

Zunanji števci obiska

Zunanji števci (hosted counters) so preprostejši od analizatorjev, za navadne uporabnike pa so najlažja izbira. Postopek je preprost - prijavimo se prek strani ponudnika storitve, ta pa nam pošlje kodo html ali javascript, ki jo dodamo na našo stran. Ko obiskovalec naloži stran, se bo slika števca naložila s strani ponudnika, ki tako dobi podatke o obiskanosti naše strani in nam po želji sestavi poročilo (oziroma ga lahko vidimo prek interneta). Nekateri števci so celo nevidni, torej so na strani v obliki prozorne slike, velike natanko eno piko. Skratka, ni se nam treba poglabljati v analizatorje, ni nam treba razumeti strukture dnevniških datotek, ni nam treba skrbeti za njihovo shranjevanje, nič podobnega. Enostavno se prepustimo drugim.

Za domače strani so zunanji števci, narejeni ob pomoči javascripta, povsem dovolj. Zgled brezplačnega je, denimo, StatCounter.

Kljub temu imajo lastni analizatorji nekaj bistvenih prednosti. Najprej so podatki naši, in to v odprtem formatu. To pomeni, da lahko uporabljamo po želji več analizatorjev, oziroma jih laže zamenjamo. Nekaterih uporabnikov zunanji števci sploh ne morejo prešteti, denimo takih, ki ne nalagajo slik s strani (ali pa uporabljajo brskalnik, kot je Lynx, ki deluje v besedilni konzoli). Taki števci tudi ne zaznajo programov, ki samodejno pregledujejo strani, se pravi raznih robotkov/pajkov, kot je Google. In, ne nazadnje, če se gremo svojo analizo, nam ni treba popravljati kode HTML in vstavljati kode ponudnika števca.

Brezplačnih števcev je v internetu veliko, bistvenih razlik med njimi večinoma ni. Podatki, ki jih prikazujejo, so klasični: torej število obiskov, od kod prihajajo obiskovalci, katere brskalnike in operacijske sisteme uporabljajo ipd. ShinyStat (www.shinystat.com) ima, recimo, brezplačno različico, pri kateri smo omejeni na deset poročil in zelo osnovne informacije (ni, recimo, podatka o edinstvenih obiskih, vstopnih in izstopnih straneh itd.), vrti pa reklamna sporočila. Reklam ne vrti StatCounter (www.statcounter.com), ogledujemo si jih le, ko nas zanimajo informacije o obisku. Omejeni smo na 9000 obiskov na dan (to je za koga veliko, za drugega pa spet malo). Zanimiva je tudi storitev Googla Google Analytics (preizkusili smo jo v poletni številki). Ta je brezplačna, omejeni smo na 5 milijonov obiskov na mesec, če uporabljamo Googlov AdWords, pa ni omejitev. Prav integracija z AdWords je njegova najmočnejša plat (no, vsekakor tudi ime nekaj velja).

Med slovenskimi ponudniki števcev je tudi Iprom. Skupno poročilo je podano z lepimi grafikoni podatkov.

Seveda pa je tudi veliko plačljivih storitev, ki imajo prav tako svoje prednosti. Nimamo težav z reklamami, odločimo se lahko tudi za nevidni števec. Načelno imamo tudi več možnosti glede poročil, torej več podatkov oziroma več različnih poročil. Ne nazadnje imamo s plačljivimi storitvami tudi tehnično pomoč. Zgled take storitve je, denimo, slovenski Iprom (www.mediaiprom.si), ki poleg standardnih podatkov (kot je na primer število edinstvenih obiskov, kar imenujejo doseg strani) omogoča tudi integracijo med števcem in (morebitnim) oglaševanjem.

Na voljo imamo torej kar nekaj možnosti. Sprva moramo pretehtati, kako natančne podatke hočemo oziroma potrebujemo. Za domače strani so brezplačni zunanji števci povečini povsem dovolj. Za spletne dveri korporacij pa potrebujemo bistveno natančnejše podatke, torej so primernejši programi za analizo strežniških dnevnikov. Hitro tudi pridemo do vprašanja cene. Če uporabljamo odprtokodne rešitve (torej Linux in Apache), najlaže posežemo prav po odprtokodnih rešitvah.

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!
Prijava

ph

Komentirajo lahko le prijavljeni uporabniki