vineri, 28 noiembrie 2008

Top20.md cu o nouă "inimă"

De mult ţineam să modific sistemul top20 - ştiu eu de ce...

În continuare voi scrie un text ceva mai tehnic - cine crede că poate avea răbdare citiţi înainte.

Realitatea este că e(a fost) un proiect dintre acelea create în anii de studenţie, de aceea erau foarte multe lucruri de modifcat la el.

Prin această modificare am ţinut să rezolv problemele de bază ale sistemului:
  • viteza de colectare a datelor;
  • corectitudinea rezultatelor (statisticilor);
  • stocarea datelor pe termen nelimitat;
  • accesarea datelor de orice rang şi în termeni rezonabili;
  • reducerea incomodităţilor;
  • securitate, şi altele;

Viteza de colectare a datelor

Viteza a fost redusă la minimum, şi asta din cauza că la fiecare afişare a unei pagini nu se analizează datele ci doar se cocectează - analiza este lăsată pentru o altă parte a sitemului care la o anumită perioadă de timp(acum e de 30 minute) analizează datele colectate şi formează statisticile...

Corectitudinea rezultatelor

La acest capitol primul pas a fost făcut prin rezolvarea problemei de colectare a datelor - deci, dacă avem certitidinea că sunt colectate toate datele, deja... e bine!
În continuare mai lucrez la acest capitol - partea bună e că orice eroare depistată poate fi uşor rezolvată prin regenerarea statisticilor de la data la care a apărut eroare. În sistemul vechi datele calculate deja nu mai puteau fi modificate, aceasta era o problemă foarte importantă.
Sistemul nou are astfel un avantaj foarte important - oricând se poate modifica forma/formatul/structura statisticilor în orice alt tip şi asta pentru orice perioadă.

Stocarea datelor

Azi statistica sistemului trece puţin peste 100 MB pe lună pentru toate site-urile. Ceea ce ste destul de puţin. Formatul datelor şi structura ne permit să multe date cu resurse minime şi pentru orice perioadă - deci sistemul va stoca şi accesa datele rapid şi eficient indiferent de perioada de colectare a lor.

Accesarea datelor

Acum mai lucrez la acest capitol. Probleme sunt la accesarea listei de site-uri referrer şi cuvinte cheie.
După cum se poate de observat în imaginea de mai sus perioada mazimă pentru care se poate de văzut sersele de trafic este de 30 zile - 12 luni şi toată perioada au fost dezactivate până la rezolvarea problemei de eficienţă.
Oricum parametrul period din Query String poate fi setat dupa bunul plac şi va funcţiona oricum.

Reducerea incomodităţilor

Acum administratorii site-urilor pot alege să plaseze un script care nu generează bannerul top20. Deci pe paginile site-ului nu se va vedea nici o urmă a TOP20.md

Probabil aţi observat cu toţii că în noua versiune sun mai puţine elemente de statistică ca în precedenta - stata doar din cauza că în prezent lucrez la adăugarea a câte un element de statistică. În timp, va apărea câte ceva nou.

Planuri de viitor

Am observat în unele bloguri că lumea îşi face griji referitor la publicitatea care nu apare pe top20 - poate se gândesc că degrabă va "muri" TOP20 din cauze financiare...
Este o greşeală - proiectul Top20 îşi scoate toate cheltuielile pe deplin în fiecare lună. De exemplu, numai din căutări Adsense top20 face peste 150$ pe pună (cei care au un cont Adsense cred că vor înţelege mai bine).

Acum câteva zile am procurat un nou server:
  • Procesor: Intel(R) Core(TM)2 Quad CPU Q6600 @ 2.40GHz 2.39 GHz
  • Memorie: 8 GB
  • Tip system: 64-bit
  • Hard Disc: 700GB
Serverul e foarte bun şi sper că mă va servi o bună perioadă.

Mi-ar plăcea mult dacă ar participa cât mai multe site-uri în sistemul Top20 - şi asta fiindcă aş putea arăta nişte statistici de sistem pentru o parte mare a site-urile din Moldova. Astfel s-ar obţine nişte date foarte interesante şi utile.

Aştept întrebări, sugestii.

P.S: Ţin să-i mulţumesc lui Valeriu Tihai pentru ajutor şi tututror cate folosesc sistemul Top20.