E' l'inizio della fine per Google?
Ogni tanto viene annunciato l’arrivo del nuovo Google-killer. Ma poi – puntualmente - ci pensano le statistiche ha smentire tutto.
Questa volta tocca a Hitwise farci sapere che Google - malgrado il continuo fermento nel settore “motori” con veloci apparizioni di nuovi “search clustering” o di accattivanti aggregatori di ricerche in stile web 2.0 - non solo conferma il suo incontrastato dominio nel settore, ma addirittura cresce.
Infatti, secondo gli ultimi dati disponibili (aprile 2008), il 67,90% del mercato "search" statunitense è ormai di "Big G", con un aumento secco di quasi il 3% rispetto allo stesso periodo dell'anno passato.
Ed escluso Yahoo!, unico rimasto a resistergli con un più o meno stabile 20%, gli altri competitor – tra cui nomi del calibro di MSN Search e Ask.com –non superano tutti insieme il 12%.
Sembra quasi una pietra tombale sulla competizione per le ricerche internet. Ma è proprio così? Google, nonostante l'attuale debordante supremazia, ha un problema: un sistema di information retrieval di tipo testuale ormai invecchiato.
E malgrado roboanti annunci - di circa un anno fa - di un prossimo futuristico “Google Universal Search”, la tecnologia tuttora utilizzata rimane quella quantitativa ed incrementale basata sulla popolarità e visibilità delle pagine web, vale a dire sull’ordinamento per rilevanza mediante il famoso algoritmo PageRank anch'esso vecchio di circa dieci anni.
Per i tanti piccoli avversari di Google si tratta – a questo punto - di trovare la giusta strategia d'attacco. Non certo di sfidare il gigante sul suo terreno. Ma, piuttosto battere altre strade. Ad esempio provando a rivoluzionare il concetto stesso di “search engine”.
Come? Magari abbandonando la quantità per una ricerca personalizzata e di qualità. Ci sono già tecnologie che vanno in questa direzione, a cominciare dalla “multimedia search” che opera direttamente sui contenuti visivi, sonori e audiovisivi degli oggetti digitali rintracciabili in rete.
Un team tutto europeo ha fatto sua questa scommessa presentando nei giorni scorsi Pharos, un nuovo motore di ricerca multimediale che dovrebbe diventare l’erede di Quaero, definito troppo in fretta “l’Airbus del digitale” o addirittura la “risposta europea a Google” ma poi altrettanto velocemente scomparso.
Questa volta la pattuglia e ben più numerosa del duo franco-tedesco che stava dietro al progetto Quaero. I partner sono 13 - tra cui la France Telecom, la norvegese Fast e il Politecnico di Milano – e 9 i paesi europei coinvolti: Germania, Francia, Finlandia, Spagna, Austria, Italia, Norvegia, Svizzera e Regno Unito.
Undici sono i milioni di euro che la comunità europea ha già messo a disposizione. Pharos quando sarà rilasciato nella sua versione definitiva – si parla intorno alla metà del prossimo anno – promette molto.
Non solo di mettersi subito ad inseguire, attraverso la rete, i ripetuti “boom” della musica on line e le frotte di contenuti video provenienti da piattaforme tipo YouTube e DailyMotion, ma anche di ampliare la propria “search” con input extra-internet.
Gli utenti dopo averle registrate con il proprio cellulare, potranno, ad esempio, inviare a Pharos spezzoni di brani musicali oppure immagini di una località turistica ecc.,
ottenendo come risposta magari i titoli esatti delle canzoni ascoltate per caso o delle immagini di località simili a quella inviata utilizzabili quali supporto all’ampliamento di una ricerca turistica.
Ma applicazioni commerciali a parte, l’appellativo “motore del futuro” adoperato subito per Pharos trova le sue specifiche ragioni in alcune caratteristiche tecnologiche.
Anzitutto quella di essere un sistema aperto, vale a dire predisposto ad accogliere nel suo cuore funzionante qualsiasi tipo di algoritmo per analisi di dati multimediali;
e poi quella di integrare nei strumenti anche la cosiddetta ricerca sociale, cioè un sistema di filtraggio “social networking” nella personalizzazione delle risposte sulla base sia del profilo dell’utente che dei requisiti della community di cui lo stesso fa parte.
Capovolgimento ancora più radicale rispetto alla tradizionale “search engine”, viene poi da un’altra tecnologia: la ricerca semantica. Campo assai difficile e complesso.
Non più semplice ricerca delle parole all’interno dei testi, ma tentativo di determinare i contesti in cui vengono utilizzate. Obiettivo: simulare il linguaggio naturale e i meccanismi dell’apprendimento umano.
Insomma, uno spingersi alle soglie dell’intelligenza artificiale. Per gli esperti non è ancora pensabile un motore semantico per tutto il Web, ci vorranno – dicono - almeno altri 10 anni per rendere orizzontale e pervasiva un ricerca del genere .
Ma forse è in vista una brusca accelerazione, e potrebbe chiamarsi Powerset. Si tratta di una tecnologia nata nella Silicon Valley, nei famosi laboratori Xerox PARC.
Un team di 50 persone tra scienziati e linguisti ha messo a punto un motore di ricerca che utilizza frasi colloquiali al posto delle solite parole chiave, e per farlo codifica il significato di parole e/o frasi attribuendo ad esse dei concetti.
Il motore semantico Powerset - appena presentato - permette d’interrogare la grande enciclopedia on line Wikipedia. Il sistema, al momento, lavora su una copia di Wikipedia in inglese con più di 2 milioni di voci.
Anche se, il modello di business di Powerset è per ora orientato verso la ricerca di qualità circoscritta a particolari siti (documenti finanziari, brevetti ecc.), l’esperimento in corso lascia intendere grandi potenzialità.
La grande enciclopedia on line sta, infatti, sempre di più diventando un sottoinsieme delle parti più utili del Web. Questo significa che Wikipedia può rappresentare il miglior banco di prova per una futura applicazione dei motori semantici all’intera rete.
Pubblicato su Tuttoscienze (La Stampa) il 2 luglio 2008
- Cultura Digitale 2003 -
|
|
||||||
|
|
|
|
|||||
|
|
|||||||