Archive for the ‘web20’ Tag

Google e gli url 2.0

Pare che qualcuno abbia scoperto una “particolarità”, per usare un gentile eufemismo, nell’algoritmo che Google utilizza per scegliere cosa vada indicizzato e cosa no.

Al cervellone di Mountain View, infatti, sembra vadano indigesti gli url terminanti in “.0”. Questo significa che una pagina web, per quanto ben progettata, ottimizzata, linkata, non verrà presa in considerazione dallo spider se il suo nome termina con la sequenza punto-zero, come potrebbe avvenire dopo l’intervento di un sistema di rewriting.

Facciamo un esempio: un appassionato di retrocomputing elenca sul suo sito pregi e difetti dei vecchi sistemi operativi, tra cui Microsoft Windows 1.0. Ora, se malauguratamente i risultati della sua ricerca e passione (!) vengono inseriti all’interno di una pagina raggiungibile all’indirizzo

http://www.sito.com/so/MSWindows1.0

il nostro amico nerd non potrà sperare di apparire in prima pagina in Google, e neppure in seconda o in quarantasettesima.

Perché? Si dice che possa essere una censura preventiva di tutti quei siti spam che hanno url del genere, ma è evidente che una decisione a priori così arbitraria taglia fuori una potenziale moltitudine di siti a contenuto valido, a danno dell’utente che compie la ricerca.

E come può Google ignorare i siti e i blog che oggi parlano di web 2.0, e domani faranno lo stesso con web 3.0, 4.0 e via dicendo?

PS: volete fare una prova? Provate a cercare la pagina di Wikipedia sul web 2.0: notate nulla di strano?

PPS: WordPress, intelligentemente, ha rinominato questa pagina “google-e-gli-url-20/”, evitando il problema :)

Annunci