Citat:
Conica: Ne razumem recenicu "Ne moze takav nacin merenja nikada da da nista pouzdano" broker. Kao sto je receno sistem koristi javascript i cookie. Sta tu ima da bude nepouzdano, pogotovo ako se uzme u obzir cinjenica da vlasnik sajta nema pristupa obradi podataka, a pogotovo ne samim neobradjenim podacima kao sto bi imao pri generisanju log fajlova.
Ne znam sta tu ima da se ne razume. Cim se koristi JavaScript i kolacici, ne moze se pricati o pouzdanosti a pogotovo ne o tome da administrator sajta ne moze da utice na podatke. Stavise, verujem da je vrlo lako igrati se sa podacima koij se prikupljaju na taj nacin. Sam prinicip na kome rade JavaScript i kolacici ne obezbedjuje nikakvu pouzdanost. Npouzdanost uopste nema nikakve veze sa HitBox-om ili bilo kojim drugim servisom koji ih korsiti nego upravo sa JavaScriptom i kolacicima.
Ne sporim da HitBox ne pravi opseznu i detaljnu statistiku. To uopste nije problem i samo je stvar kreativnosti da se smisle raznorazni statisticki izvestaji. Ako cemoo tome, sigurno mi ne moze hitBox dati sve izvestaje koje zamislim a ja sam prilicno kreativan kada analiziram logove i za to koristim cak i rutine koje sam razvijam.
Problem je u pouzdanosti prikupljenih podataka. Pocni samo od toga da ce neko manje upucen da stavi HitBox samo na naslovnu stranu sajta a neko drugi ce da stavi na koju hiljadu dokumenata na svom sajtu. Sami tim, podaci su neuporedivi, jer se na jednom sajtu mere samo pristupi jednoj strani a na drugom na mnogo strana.
Kada se u sve to umesaju drugi cinioci od kojih je dobar deo Gojko naveo, koji ometaju da se podaci na pouzdan nacin beleze, pa do toga da neko moze sa njima da se igra, eto gomile razloga da se ne veruje takvom sistemu.
Ja naravno ne pricam o HitBox-u nego uopsteno o svakom takvom sistemu koji se zasniva na ubacivanju koda koji ce nekom eksternom sajtu prosledjivati podatke.
Jedini takav pristup koji bih mogao da prihvatim kao pouzdan je da sami web serveri budu podeseni tako da istovremeno kada beleze log sajta iste podatke posalju na jos neko mesto gde se vrsi njihova dalja obrada. Ali i tada moze da se lazira posecenost simuliranjem stvarne posecenosti.
Citat:
Da li pricamo konkretno o nekom ko ima vremena i interesa da menja podatke?
Ima ih i to koliko god hoces. Mnogi prave pare na osnovu posecenosti i itekako im je u interesu da se prikazuje sto veca posecenost. Moze se cak reci da su oni posveceni ideju da povecaju svoju posecenost sto realno sto laziranjem. Svi sistemi za merenje posecenosti upravo imaju problema kako da sprece zloupotrebe i lazno predstavljanje vece posecenosti nego sto je to realno. Ubedjen sad da, ako bi ste vi sada ovde objasnjavali metode koje se koriste da se sprece zloupotrebe, za svaki vas metod ce se naci bar jedan nacin da bude zaobidjen, i to bez mnogo muke, ili se, s druge strane, moze pokazati da u nekim slucajevima potpuno ispravna poseta nece biti zabelezena kao takva jer ce biti protumacena kao lazna.
Citat:
Pitanje: koliko bi prostora na hardu bilo potrebno za log fajlove koji bi merili toliki broj hitova i koliko bi trajala obrada tih podataka? Da li bi to opteretilo server a samim tim ga i usporio? Koliko dugo moze da se cuva istorija posecenosti jednog web sajta, a da se logovi posle punjenja harda ne rezu na disk recimo?
Iz vase price sam razumeo da JavaScript prikuplja podatke i cuva ih u kolacicima sve dok nije u situaciji da zabelezeno posalje na server merac. To znaci da mora da vrsi nekakvu agregaciju tih podataka da se ne bi suocio sa problemom prevelike kolicine podataka. Svaka agregacija smanjuje mogucnosti statisticke analize. Jedini nacin da se sacuvaju maksimalne mogucnosti analize jeste upravo to da se ona vrsi nad podacima iz loga koji nije agregiran ni na koji nacin. Slazem se da je to kontraproduktivno jer logovi zaista trose mnogo prostora, medjutim ako vec treba da redukujem podatke radije cu to da radim sam, onako kako meni odgovara nego da prepustam nekom stranom sistemu da to radi umesto mene i servira mi samo one podatke koje smatra da su mi bitni.
Ali opet da ponovim, mene statistika interesuje radi internih analiza a ne radi poredjenja sa drugim sajtovima te je zbog toga moj pogled na celu stvar u nekoj meri drugaciji.
Kada je poredjenje sa drugima u pitanju, ja ne mogu da znam sta drugi administratori rade i na koji nacin obezbedjuju podatke o posecenosti te da li uopste ima smisla da se poredim sa njima, sto zato sto ne umeju da obezbede dobre podatke, sto zato sto se trude da ih laziraju.
Medjutim, ono sto po meni ima najmanje smisla u poredjenju, to je poredjenje baba i zaba. Ne znaci mnogo informacija koji je sajt najposeceniji. Znacila bi informacija koji je sajt najposeceniji u odredjenoj ciljnoj grupi korisnika a tek za to ne postoji nacin da bilo ko uradi ikakvu pouzdanu analizu.
To na primer, moj sajt i ES su potpuno raznorodni u svakom pogledu. Razlicita tematika, razlicita forma, razliciti posetioci. Sta znaci informacija da ES ima mnogo vecu posecenost od mog sajta? Nista. Za moj sajt posecenost od 300-tinak ljudi dnevno znaci isto kao posecenost ES-a od nekoliko hiljada ljudi. Kriterijumi su potpuno razliciti a izmereni podaci potpuno neuporedivi.