duminică, 1 martie 2009

Presslook se uită peste tot...

Un element important al sistemului presslook este capacitatea sa de a analiza știrea în întregime. Deci, sistemul nu va analiza doar titlul și descrierea scurtă a știrii publicată prin RSS, ci întreg corpul știrii. Un modul al sistemlui merge la fiecare știre pe situl celui care a publicat-o și o citește după care o stochează pregătind-o astfel pentru analiză (efectuată de alt modul).

Această proprietatea a sistemului este esențială în situația în care dorim să depistăm cu adevărat toate și cele mai importante cuvinte cheie dintr-o știre. La moment analiza știrilor în întregime se realizează la aproximativ 90% din totalul de știri colectate zilnic. Un exemplu bun se vede în imaginea de mai jos:


Tot odată, se observă că unele știri sunt practic lipsite de cuvinte cheie - asta datorită volumului mic de cuvinte cheie existente la moment în sistem. Însă creșterea sistemului se va produce concomitent cu creșterea numărului de cuvinte cheie.

Poate cineva se întreabă de ce am pus site-ul pe adresa news.presslook.com și nu pe www.presslook.com ? Cred că unii au gâcit deja... :)

Niciun comentariu:

Trimiteți un comentariu