Google fa flop con i blog

Categorie: Informatica
Tag: Nessun Tag
Commenti: 3 Commenti
Pubblicato il: 19 Dicembre 2006

Avete mai notato che, con i blog, Google non è così accurato come con le pagine web normali?
Dovete sapere che, quando si amministra un sito (o anche solo un blog), è possibile vedere, fra le altre cose, con quale ricerca e grazie a quale motore di ricerca qualcuno capita sul tuo sito.
Ovviamente io guardo queste cose, anche per rendermi conto di che cosa porta uno a leggere le mie elucubrazioni e oltre a rendermi conto della quantità di ricerche assurde che la gente fa, noto che molto spesso qualcuno capita qui cercando cose che con il blog non c’entrano proprio niente.
Per esempio, oggi è arrivato uno che cercava in Google “ikea marocco”. Non so, forse doveva arredare una casa in marocco e voleva la sede locale dell’ikea, oppure era un lavoratore immigrato che pensava di chiedere un trasferimento, o chissà cosa.
Allora ho provato anch’io a fare la suddetta ricerca per vedere in quale pagina si è determinato questo insieme casuale di parole e ho scoperto che MG Blog arriva addirittura secondo! E la pagina in cui l’insieme si trova è quella del post “Ikea in mano agli atei” che, insieme con la parola “marocco” che si trova fra le bandierine della barra laterale, crea la combinazione cercata.
Ora, se ci pensate, tutto questo è una assurdità. Il testo dei post non c’entra niente con quello della barra laterale. Sono due insiemi completamente distinti che stanno sulla stessa schermata per ragioni puramente organizzative, perché i blog sono fatti così.
A rigor di logica, anche i post sono completamente separati fra loro e il fatto che in questo si parli di Berio e in quello seguente di Mozart, non significa affatto che qui ci sia l’opinione di Berio su Mozart o che si parli di citazioni mozartiane nella musica di Berio.
In questi casi, quindi, Google fallisce miseramente. Perché?


Semplicemente perché lui non ha nessuna cognizione del contesto organizzativo della pagina che esamina. Anzi, non ha nessuna cognizione di pagina. Per lui una pagina è solo uno stream che comincia con “html” e finisce con “/html”, quindi riporta il fatto che le due parole cercate risiedono nello stesso stream.
Il metodo di analisi dei motori di ricerca funziona con le pagine tradizionali, in cui si comincia parlando di qualcosa e si continua a parlare di quello, ma ormai, con i blog e i content manager, la tipica pagina web è divisa in colonne o riquadri contestualmente distinti, il che va oltre l’intelligenza limitata di tutti i motori, non solo di Google.
Un’altra cosa in cui i motori falliscono è la dinamicità. MG Blog pubblica 15 articoli per pagina, a cominciare dai più recenti. Gli ultimi 15 stanno nella prima pagina; per accedere agli altri si clicca sul link “Prossima Pagina” che si trova a fine pagina, in basso a sinistra e continuando, si arriva fino al primo post (l’ur-post :-)).
Naturalmente, quando io aggiungo un nuovo post, si verifica uno shift colossale per cui tutte le pagine cambiano: il primo entra, l’ultimo esce ed è così in tutti i blog, ma anche nelle news e nei contenuti non fissi dei content manager.
In MG Blog io riesco a mettere da 1 a 4 post al giorno, con una media di 2, ma i blog scritti da molte mani e magari famosi, come Boing Boing, possono avere una frequenza di aggiornamento di 15/20 post giornalieri.
I siti, quindi, stanno diventando fortemente dinamici, mentre le pagine tradizionali erano essenzialmente statiche.
Ma Google, sebbene passi tutti i giorni, non fa in tempo ad aggiornare i suoi indici e così spesso qualcuno viene diretto a una pagina in cui il post a cui Google puntava non c’è già più perché è scivolato nella pagina successiva.
Quello che possiamo prevedere è che, via via le organizzazioni di questo tipo aumenteranno e si moltiplicheranno a scapito delle pagine statiche, tutti i motori di ricerca andranno in crisi, dando un numero sempre più alto di risposte insensate.
In pratica, parafrasando Baricco e il suo scritto sui barbari pubblicato a puntate su Repubblica, Google non è abbastanza barbaro per capire il web. Non comprende i contesti e la sua velocità di reazione è troppo limitata.
Inoltre, la metafora di Google è quella della biblioteca di Alessandria: un solo luogo in cui è concentrato lo scibile (in questo caso, l’indice allo scibile). Ma il web è troppo vasto per una concentrazione di tal fatta e via via che se il numero di server di Google aumenta, il sistema diventa sempre più lento e difficile da aggiornare.
In realtà, Baricco non capisce veramente Google. Google non è barbaro, anzi, è l’ultimo argine contro i barbari: l’idea che un database centralizzato possa schedare internet, cioè il mondo e creare uno pseudo-ordine. Pseudo, perché basato sulla statistica, sul conteggio dei link. Ma quando il mondo si muove troppo in fretta e salta di palo in frasca sulla stessa schermata, anche la statistica diventa inutile.

Allora, cosa ci salverà dal disordine più completo?
Dunque, una possibilità è un enorme salto tecnologico, con velocità di navigazione di molti ordini di grandezza superiori a quelle attuali (fibre ottiche?) e memoria immense a basso costo (memorie olografiche?).
Ma non basta. I programmi e i dati si espandono adeguandosi alla memoria disponibile.
Il semantic web, cioè una organizzazione del documento che distingue i contesti separando, per esempio, i contenuto di un post dal successivo e tutti i post dalle barre laterali? Forse arginerà per un po’ il fenomeno, ma solo per un po’. Ricordate che circa 1.000.000.000 di cinesi stanno premendo alle porte del web.
La filosofia del sistema centralizzato, con l’indice nella mani di uno solo o di una ristretta oligarchia di difficile accesso (in teoria chiunque può fare un motore di ricerca, ma deve disporre di risorse computazionali adeguate), è alle corde.
A mio avviso, alla fine, neo-idioti permettendo, resterà una sola cosa: il peer-to-peer. Il passa-parola, l’informazione limitata, non centralizzata, di cui ciascuno di noi dispone. I bookmark di ciascuno, adeguatamente strutturati. “Io so che in quel sito si parlava di questa cosa”.
Come nelle reti veramente e essenzialmente P2P, senza server, tipo Kademlia o Gnutella, la richiesta di qualcuno passerà ai suoi casuali vicini e da questi ai loro e così via, allargandosi, fino a restituire dei risultati.

Ognuno sa poco, tutti insieme sappiamo tutto (o quasi).

3 Commenti
  1. max ha detto:

    Forse dovremmo cominciare a difenderci da questo bombardamento di informazioni! Se perfino google va in tilt, figuriamoci noi poveri umani!
    Questa sorta di “collasso di informazioni” che giustamente ipotizzi potrebbe essere salutare: bisognerebbe tornare a fruire delle informazioni anzichè passare il tempo a cercarle e immagazzinarle. Forse la via giusta può essere quella da te proposta, non il fantomatico “villaggio globale” ma la comunità ristretta dove non trovo tutto, ma quello che trovo lo comprendo e lo utilizzo realmente.
    …scagli la prima pietra chi ha realmente letto e studiato tutti gli articoli scaricati o chi ha realmente ascoltato tutta la musica reperita o scaricata…

  2. edi ha detto:

    ciao,anch’io sono arrivata al tuo sito cercando in rete IKEA MAROCCO e ho letto comunque con interesse il tuo post.
    Mi è già capitato di finire in siti completamente “fuori tema”, cosa che non mi disturba affatto ma trovo anzi estremamente interessante questa casualità che praticata e coltivata anche nella vita reale ci regala conoscenze e percorsi fuori dai nostri schemi prefissati, portandoci ad approcciare ed eventualmente approfondire persone, interessi ed argomenti che sembrano distantissimi da noi.
    Questa curiosità praticata attraverso la casualità e lo sfasamento di significato ci rivela molto di noi stessi e compensa decisamente il minimo fastidio e perdita di tempo che costa.

  3. Mauro ha detto:

    è bello che tu la prenda così e in fondo hai ragione

Lascia un Commento

Benvenuto , oggi è giovedì, 28 Marzo 2024