Feb 9, 2010

Google: l'ombelico del Web e la ricerca Euristica - ebook di Nicola Mancini - Ottavo capitolo

La segretezza delle metodologie di Google, e gli algoritmi utilizzati hanno fatto in modo che la divulgazione di questo annuncio non venisse in una data a caso. Molti infatti si sono trovati spinti a pensare che fosse un pesce d’aprile… Con questo si vuol dire che l’aver scelto una data in cui sul web si divulgano notizie a volte solo a carattere giocoso e di scherzo, è verosimilmente uno dei motivi che spinge Google a non fornire in maniera esatta le proprie scelte. Conoscere gli algoritmi, i metodi e i progetti di Google in maniera approfondita non è un dato di pubblica utilità, né di pubblico dominio. Una notizia “bomba” come questa, ha trovato la fila dei credenti e quella degli scettici. Io, a rigor di logica, e per posizione presa con il presente saggio, mi posiziono nella fila dei credenti. Questo perché quando mi riferivo alla Stele di Rosetta di Goolge, intendevo proprio questo. Ma nel dettaglio, l’argomento verrà trattato in seguito. Ora preferisco soffermarmi su una battuta di spirito: se tra le molteplici forme di associazione a delinquere al giorno d’oggi, ci chiedessimo quale sarebbe la più fruttuosa, la mia risposta sarebbe la seguente: “rapire” un project manager di Google, e fargli confessare i segreti degli algoritmi del motore di ricerca. Stiamo parlando di informazioni da miliardi di dollari. Stiamo parlando che nessuna “rapina” al mondo, darebbe tanti frutti. Lungi da me, la volontà di dare l’idea a qualche delinquente di attuare questo piano. Legalmente è auspicabile che Google si sia premunita nei confronti dei propri dipendenti, sul fronte della segretezza professionale. Certo è che, la debolezza umana non ha limiti, e su questo aspetto, devo ritenere che un contratto con Google, preveda delle clausole molto severe nei confronti degli argomenti trattati, tali da scongiurare una eventuale fuga di notizie non ufficiale. Certo è, che una qualsivoglia compagnia che eserciti sul web, e voglia il primato assoluto, ha la necessità unica di conoscere il modo di essere il primo risultato possibile su Google sulle diverse keywords associate all’argomento associato ai propri prodotti. Con l’ipotetico rapimento, questo sarebbe possibile… ma sto scherzando, non voglio compromissioni! Allora, i segreti di Google, chi può mai conoscerli? Ebbene, dal momento che Google Inc. ora è un’azienda altamente strutturata, la frammentarietà dei progetti non permette anche agli addetti ai lavori di conoscere nella completezza il fine ultimo del progetto cui lavorano, questa è un’ipotesi al quanto realistica. Tuttavia, nell’ambito del coordinamento dei lavori, all’interno di Google c’è chi, senza dubbio, conosce gli aspetti finali di un progetto, gli obiettivi di un algoritmo e le novità top secret. Questo però resta affascinante così. Il resto del mondo sta ad aspettare. Analizza, stima, studia. Cerca di capire quel che c’è dietro, perché il resto del mondo segue Google. Magari dietro a mesi di ricerca su una parola chiave, sui mutamenti del ranking di un sito web, c’è la geniale idea di un ingegnere che a Mountain View se la spassa con il proprio team a cercare di fornire algoritmi sempre più dalla parte dell’utente finale, lo stesso utente però che diventa matto nella ricerca delle soluzioni migliori. Ma allora, qual è la Stele di Rosetta degli algoritmi di Google? È forse quel temuto “pesce d’aprile” del 2009? Io ritengo di essere tra i più accaniti sostenitori che il progetto CADIE non sia poi in fase concettuale o di test. Se un colosso divulga una disciplina in cui si sviluppa un proprio progetto, da una parte deve essere sicura di aver acquisito un margine tale, da battere la concorrenza, eventuale, che l’acquisizione di tali metodologie potrebbe comportare. Un tale margine potrebbe essere dato da due fattori: il fattore tempo, e in questo caso Google non è vero che ci lavora da poco e lo sta testando. Il fattore costi, e in questo caso il progetto costa e vale talmente tanti dollari, che sul mercato attuale, non vi siano comprovati concorrenti in grado da poterne acquisire le facoltà. La chiave di lettura dunque, del progetto CADIE, a mio avviso è in fase più che sviluppata e già in opera sul motore di ricerca. A questo titolo, vi invito a fare un test, per verificare la qualità dei risultati di Google, rispetto ad un motore di ricerca ormai in declino, ovvero quello di Lycos. Provate a cercare qualcosa come “cd special offers”. Ora, pur ricordando che effettuando nuovamente il test a distanza di qualche tempo (anche dal tempo in cui io stesso scrivo quanto leggete) i risultati potrebbero variare per la mutevolezza del web, andiamo ad analizzare i risultati: abbiamo su Google come risultato primario, il bel sito amazon.com il quale ha un’ampia gamma di offerta su quanto richiesto: sconti ed offerte speciali sulla vendita di CD, esattamente quanto ricercato dall’utente. Su Lycos invece, il primo sito che viene fornito come risultato, altro non è che un anonimo abcd-usa.com che vende custodie per CD. Questo dominio è stato registrato nel 2003, e almeno su Lycos, gode di questo privilegio di essere arrivato 6 anni fa. Ma per Google, questo non basta. Non lo posiziona nemmeno tra i primi 50 risultati, questo perché alla richiesta di offerte speciali per i CD, Google sa bene che la vendita di custodie non è esattamente la stessa cosa della vendita di CD a prezzi promozionali. E questo come è possibile? Grazie al CADIE, a mio avviso. Più che un avviso, è il grado di certezza nell’affermare un concetto, secondo ragionevoli prove date dai risultati. Ovvero, nell’ambito della fisica nucleare e nell’astronomia, si cerca di capire di più sui buchi neri, dove sono e perché. Nonostante i progressi della scienza, a causa della sua assoluta gravità, un buco nero non può essere visto, se non stimato studiando i “risultati” che provoca nel suo intorno. Mi spiego meglio. Non è possibile stabilire con la stessa certezza con cui si diano coordinate ad una stella, la posizione di un buco nero, ma è possibile affermare la sua presenza in base ai fenomeni che la stessa fa manifestare nelle sue vicinanze. Allo stesso modo su Google non è possibile stabilire, (stiamo parlando del famoso “resto del mondo”) il perché un risultato prevale su un altro, se non studiando le “cause” che lo stesso lo rendono visibile rispetto ad altri, il perché prevale sull’uno e non sull’altro. Dunque, ragionando su ipotesi avvalorate da risultati certi, posso concretamente affermare che nel risultato di Google, c’è lo zampino dell’intelligenza artificiale. L’intelligenza artificiale applicata a Google necessita quasi di un capitolo a sé, ma questo è un saggio e va letto tutto d’un fiato. Come è possibile che Google ragioni come un essere umano? Questa domanda è un po’ prematura, dal momento che gli sviluppi in questa branca della scienza non sono ancora tali da poter definire un “bot” di Google, una vera e propria macchina pensante. Tuttavia, l’impegno intuito dal sottoscritto della Google Inc. verso l’I.A. porta i risultati sperati, sempre migliorati, giorno dopo giorno. Oltre agli elevati costi che l’I.A. comporta in fase di ricerca e sviluppo alla Google Inc. i vantaggi nei confronti dei concorrenti sono tangibili e apprezzabili anche dal fatto che l’impiego della stessa, viene divulgata liberamente da Google nel 2009. Il soddisfacimento delle richieste, giorno dopo giorno, crea una fidelizzazione degli utenti tale, che per la quasi totalità della nuova generazione cui approda a internet in questi anni ( mi riferisco alla generazione degli attuali adolescenti) Google ormai è sinonimo di homepage per la ricerca, di motore di ricerca, di pagina iniziale del proprio browser di navigazione. Quelle che qui vengono definite richieste, altro non sono che le informazioni che un utente ricerca su Google sotto forma di pagine web. Sotto forma di documenti, tra miliardi di documenti. Ora, è proprio il caso di parlare di un “googol” di documenti... e trovare un documento tra un miliardo è un gran successo: se avviene poi in un risultato generato in pochi secondi, è un trionfo: un trionfo grazie a Google. E allora, com’è possibile che un sistema automatico, un server fatto di microchips, memoria ram e discofisso, sia in grado attraverso due o tre parole chiave (che esprimono la mia formula di ricerca per un documento) di mostrarmi una lista di risultati che potrebbero andarmi bene… e magari tra i primi, ci sono proprio le pagine web che contengono le informazioni che cercavo? Ebbene, allo stesso modo con cui un astrofisica dice che in quella zona del cielo c’è un buco nero, a me verrebbe da dirmi perché Google utilizza una forma di intelligenza artificiale sempre più raffinata e in evoluzione giorno per giorno.

No comments:

Post a Comment

Please, post a comment and be nice!