vineri, 28 noiembrie 2008

Top20.md cu o nouă "inimă"

De mult ţineam să modific sistemul top20 - ştiu eu de ce...

În continuare voi scrie un text ceva mai tehnic - cine crede că poate avea răbdare citiţi înainte.

Realitatea este că e(a fost) un proiect dintre acelea create în anii de studenţie, de aceea erau foarte multe lucruri de modifcat la el.

Prin această modificare am ţinut să rezolv problemele de bază ale sistemului:
  • viteza de colectare a datelor;
  • corectitudinea rezultatelor (statisticilor);
  • stocarea datelor pe termen nelimitat;
  • accesarea datelor de orice rang şi în termeni rezonabili;
  • reducerea incomodităţilor;
  • securitate, şi altele;

Viteza de colectare a datelor

Viteza a fost redusă la minimum, şi asta din cauza că la fiecare afişare a unei pagini nu se analizează datele ci doar se cocectează - analiza este lăsată pentru o altă parte a sitemului care la o anumită perioadă de timp(acum e de 30 minute) analizează datele colectate şi formează statisticile...

Corectitudinea rezultatelor

La acest capitol primul pas a fost făcut prin rezolvarea problemei de colectare a datelor - deci, dacă avem certitidinea că sunt colectate toate datele, deja... e bine!
În continuare mai lucrez la acest capitol - partea bună e că orice eroare depistată poate fi uşor rezolvată prin regenerarea statisticilor de la data la care a apărut eroare. În sistemul vechi datele calculate deja nu mai puteau fi modificate, aceasta era o problemă foarte importantă.
Sistemul nou are astfel un avantaj foarte important - oricând se poate modifica forma/formatul/structura statisticilor în orice alt tip şi asta pentru orice perioadă.

Stocarea datelor

Azi statistica sistemului trece puţin peste 100 MB pe lună pentru toate site-urile. Ceea ce ste destul de puţin. Formatul datelor şi structura ne permit să multe date cu resurse minime şi pentru orice perioadă - deci sistemul va stoca şi accesa datele rapid şi eficient indiferent de perioada de colectare a lor.

Accesarea datelor

Acum mai lucrez la acest capitol. Probleme sunt la accesarea listei de site-uri referrer şi cuvinte cheie.
După cum se poate de observat în imaginea de mai sus perioada mazimă pentru care se poate de văzut sersele de trafic este de 30 zile - 12 luni şi toată perioada au fost dezactivate până la rezolvarea problemei de eficienţă.
Oricum parametrul period din Query String poate fi setat dupa bunul plac şi va funcţiona oricum.

Reducerea incomodităţilor

Acum administratorii site-urilor pot alege să plaseze un script care nu generează bannerul top20. Deci pe paginile site-ului nu se va vedea nici o urmă a TOP20.md

Probabil aţi observat cu toţii că în noua versiune sun mai puţine elemente de statistică ca în precedenta - stata doar din cauza că în prezent lucrez la adăugarea a câte un element de statistică. În timp, va apărea câte ceva nou.

Planuri de viitor

Am observat în unele bloguri că lumea îşi face griji referitor la publicitatea care nu apare pe top20 - poate se gândesc că degrabă va "muri" TOP20 din cauze financiare...
Este o greşeală - proiectul Top20 îşi scoate toate cheltuielile pe deplin în fiecare lună. De exemplu, numai din căutări Adsense top20 face peste 150$ pe pună (cei care au un cont Adsense cred că vor înţelege mai bine).

Acum câteva zile am procurat un nou server:
  • Procesor: Intel(R) Core(TM)2 Quad CPU Q6600 @ 2.40GHz 2.39 GHz
  • Memorie: 8 GB
  • Tip system: 64-bit
  • Hard Disc: 700GB
Serverul e foarte bun şi sper că mă va servi o bună perioadă.

Mi-ar plăcea mult dacă ar participa cât mai multe site-uri în sistemul Top20 - şi asta fiindcă aş putea arăta nişte statistici de sistem pentru o parte mare a site-urile din Moldova. Astfel s-ar obţine nişte date foarte interesante şi utile.

Aştept întrebări, sugestii.

P.S: Ţin să-i mulţumesc lui Valeriu Tihai pentru ajutor şi tututror cate folosesc sistemul Top20.

22 de comentarii:

  1. Am renuntat la top20 pentru ca nu imi oferea nimic nou fata de google analytics sau trafic.ro

    Acum ma gindesc poate totusi sa-mi pun butnoul la loc. De ce crezi ca ar fi nevoie de inca un contor moldvenesc?

    RăspundețiȘtergere
  2. Ştii... mi-am dat seama că e destul de complicat să faci ceva mai mult decât goolge.

    Totuşi, eu cred că GA are unele probleme:
    1. Este destul de complex;
    2. Alegerea intervalului... sunt niste probleme(luna, ora, ...);

    Ok, este prea bun... cred.

    Primul scop este ca top20.md să ofere mai mult ca trafic.ro - şi asta este posibil(cu noua "inimă").
    În curând vor apărea noi elemente de statistică.

    Apropo, deja se poate pune script top20 fără banner(ca GA).

    RăspundețiȘtergere
  3. Dumitru, schimbarile sunt spre bine. Plac.

    Mai departe. Ca sa continui iddea si intrebarea lui Artur. Dumitru, punctul principal, pe care ar trebuie sa te axezi (in opinia mea) este crearea unui top/rating credibil al site-urilor. Fiindca pentru multe persoane, la efectuarea analizelor si cercetarilor internetului moldovenesc, le lipseste anume un top credibil. La momentul actual am detectat mai multe cazuri de diferenta de ordinul 10x, cand un site din top20 in comparatie cu alte surse arata cifre de zeci(!) de ori mai mare.

    Iar gradul de detaliere a statisticii e liber sa si-l aleaga fiecare in functie de preferinte din multele existente azi. Ce spui?

    P.S. As fi bucuros daca am putea avea o discutie la nivel privat referitor la oarecare detalii tehnice.

    RăspundețiȘtergere
  4. Salut, Vitalie

    Prefer sa vorbim public despre orice problema a Top20.md...

    Spunea-i că pe top20 sunt site-uri pentru care statistica este mărită. Mă interesează care sunt acele site-uri.

    Interesant este că până nu demult mulţi spuneau că top20 contorizează mai puţini vizitatori - şi era corect, în unele situaţii.

    Dacă puţi să-mi spui ceva propuneri referitoare la clasamentul top20 - aştept cu plăcere.

    Referitor la statistică, este deja o provocare profesională şi doresc să rezolv această problemă bine.

    RăspundețiȘtergere
  5. Cand vorbeam de privat ma refeream la niste intrebari tehnice, personale, din domeniu pe care n-are rost sa le expun aici.

    Despre top20.md - apreciez evolutia, evident pozitiva, din ultimul timp. De asta am si reinstalat contorul acum 1-2 luni pe blogul meu si am sa-l (re)instalez pe alte cateva aflate in administrare.

    Vezi posta cu un exemplu. cu toate ca-s in industria asta de prin 2000, prefer sa nu fâlfâi cu nume in public :-). Cunosc toate metodele deoarece am fost si eu mu-u-lti ani in urma printre cei care experimentau asa ceva...

    RăspundețiȘtergere
  6. tsin minte proiectul inca de la bun inceput, atunci mi-am inregistrat shi eu acolo site-ul(daca putea fi numit asha) shi eram printre primii 20 sau 30 care s-au inregistrat.
    Kit mai lucram cu aceasta statistica intradevar se vedea ca se lucreaza cu "engine"-ul site-ului
    Update-ul saitului care a adus cea mai mare dezamagire a fost kind nu mai puteai privi statisticile site-urilor inchise pentru statistica detaliata publika(un timp se putea de uitat shi acele inchise).
    Dar ce nu se face, se face in progres.
    Bafta.

    RăspundețiȘtergere
  7. ... dar cum ramine cu "inima" veche? Unele siteuri au instala codul T20 NOU iar altele pe cel vechi... adica se primeste un top cu 2 statistici diferite?

    RăspundețiȘtergere
  8. Codul Top20 nu e diferit... s-a modificat versiunea veche spre una noua - la toate site-urile.
    S-a facut ceea ce se numeste Upgrade.

    RăspundețiȘtergere
  9. Urasc faptul ca nu pot baga codul in wordpress.com. De ce nu faci o varianta HTML. Sunt multe alte site-uri ce le ofera.

    RăspundețiȘtergere
  10. defapt multi au plecat de pe top20 , si dumitru credca a observat asta ! cel mai rau este ca statistica nu e adevarata . Daca eu am 200 vizite unice , top20 daca vede 80 ... sincer imi pare rau , as vrea sa folosesc un raking site din Moldova , dar nu pot :( din cauza asta.... :)

    sper ca se va mai lucra la acest capitol ...

    RăspundețiȘtergere
  11. rezolution, probabil nu ai incercat noua versiune.

    de fapt, acum nu merge contorul pentru wordpress...

    RăspundețiȘtergere
  12. Nu este vorba de wordpress, nu e vorba de blogul meu , ci de site-ul "jobsmd.net" pe care il administrez .
    Chiar astazi (25 ianuarie) , am avut la ora 17.58 - 128 Ip-uri unice. Pe top20 arata : 24 . Nu crezi ca e o diferenta prea mare? ???

    RăspundețiȘtergere
  13. rezolution, salut

    M-am uitat pe siteul tau jobsmd.net
    S-ar parea ca totu-i normal - totusi, de ce folosesti scriptul Top20 al siteului jobspro.md pentru jobsmd.net?!

    Cred ca anume aceasta este problema. Top20 trebuie sa functioneze corect in anumite conditii. Printre acestea intra si plasarea codului potrivit pe siteul potrivit.

    Nu poti plasa codul generat de exemplu, pentru ProTV.md la tine in pagini si dupa aceasta sa te intrebi de ce nu e corecta statistica.

    Succese!

    RăspundețiȘtergere
  14. Dar daca folosesti codult tau pe site-ul ProTV? :D
    Lasa scuzele astea. Ar trebui sa mearga in orice conditii, la fel cum o face si Analytics.

    RăspundețiȘtergere
  15. @ Dumitru : Aici vine deja alta intrebare , de ce eu de 1 an nu pot inregistra jobsmd.net ? l-am inregistrat de vre-o doua ori si nu se activa....

    Dar sunt site-uri care folosesc corespunzator codul si oricum nu este obiectiv.

    RăspundețiȘtergere
  16. bah.....si aster si adevar sunt tot eu Rezolution .

    RăspundețiȘtergere
  17. Rezolution, tin minte din ce cauza nu activam site-ul tau. este din cauza ca era pur si simplu o copie a siteului jobs.pro.md

    Nu aveam cum accepta un site care este un fel de SPAM/COPIE. Dar acum vad ca nu mai exista jobs.pro.md, de aceea am acceptat siteul tau curent.

    Mai am o intrebare: Statistica de pe siteul tau oferita de top20 cu care alte date ai comparat-o. Nu am gasit un contor la tine pe site la care sa vad si eu statistici.

    Succese!

    RăspundețiȘtergere
  18. Deci jobs.pro.md este primul domen , si nici decum copia site-ului jobsmd.net ; ambele erau acelasi site.

    in fine : am vazut ca ati activat si acus schimb codul ; sa vedem ce-o sa iasa.

    Contorul statisticii cu care va copar este butonul oranj din stinga-centru site-ului , sub inscriptia "STATISTICA" ;

    RăspundețiȘtergere
  19. Am introdus codul top20.md de la contul "jobsmd.net" ; Am asteptat 3 zile si azi am vazut rezultatelor :
    05.02.09 - 85 vizitatori (top20) ; 215 vizitator (statistica reala)

    Cred ca totusi am avut dreptate.

    RăspundețiȘtergere
  20. rezolution, mai incearca te rog si alte contoare, de exemplu trafic.ro, doar pe 2-3 zile, vreau să mă conving, pentru că pentru majoritatea siteurilor statistica top20.md este putin mai mare (eu compar cu Google Analytics)

    Dacă chiar e o problemă să știu precis, ca să pot căuta unde.

    RăspundețiȘtergere
  21. am inregistrat gtop.ro , dar astept si acolo confirmare. Cand am rezultate , voi scri aici .

    RăspundețiȘtergere