Come farsi evitare dai motori di ricerca

Sono appena tornato da Roma dove, tra le altre cose, mi sono recato al Museo dell’Ara Pacis e alla Mostra di opere di Antonello da Messina.

Prima di partire mi ricordo di aver cercato informazioni sul museo e sulla mostra con Google, aspettandomi di trovare come prima cosa i siti ufficiali di riferimento.

Ma se cerco, anche oggi (23 Maggio 2006), termini quali ‘Museo ara pacis’, ‘Ara pacis’, oppure ‘Mostra Antonello da Messina’, i siti ufficiali del museo e della mostra non solo non compaiono al primo posto, ma neppure nella prima, seconda, terza… pagina dei risultati.

Per capire come questo sia possibile ho analizzato più da vicino pagina e codice sorgente. A vedere il sito del Museo dell’Ara Pacis non sembra che ci possano esserci problemi di indicizzazione: la pagina è semplice, ad alto contenuto di testo, nessuna animazione. Sembra quasi un sito search-engine-friendly. Ma se guardiamo con un po’ più di attenzione pagine e codice sorgente ci accorgiamo che:

  • La scritta “Museo dell’Ara Pacis” che fa da titolo non solo è un’immagine (quando avrebbe potuto benissimo essere del testo) ma, cosa ancora più grave, è priva dell’attributo per il testo alternativo
  • Gli autori del codice sorgente hanno cercato di usare il markup separando aspetto grafico da contenuto. Una ottima idea (la pagina è leggera), ma applicata molto male. Le intestazioni dell’Html (h1,h2…) che servono a distinguere titoli da normali sezioni di testo, per esempio, sono assolutamente prive di significato. Ad h1 è stato associato il testo “Musei in Comune”, mentre con h2 “Menu di accesso facilitato”.

Sembrano sciocchezze, ma partecipano a far sì che il motore di ricerca non riconosca il testo “Museo Ara Pacis” come qualcosa di veramente significativo nella pagina.

Per il sito della ho già detto, non comportano nessuno sforzo aggiuntivo per chi sviluppa la pagina.

Interfacce tolleranti

Se dovessi scegliere una funzionalità di Google Calendar che ho trovato particolarmente utile è quella chiamata Quick Add.

E’ cioè possibile aggiungere un evento al calendario senza doversi necessariamente posizionare sul giorno desiderato e inserire tutti i campi.

Google calendar

Google Calendar cerca infatti di analizzare il testo inserito in modalità Quick Add in modo da evincere se è presente un’indicazione di data e di luogo (o, come dice la pagina di aiuto di Google, “who, what, when and where”)

E’ stato portato all’estremo il concetto del pattern chiamato Forgiving Format, che suggerisce a chi progetta le interfacce di non realizzare form complicati con decine di campi, combo e check box con l’errata convinzione che imprigionare l’utente gli eviterà di commettere errori. Dei maestri (in negativo) in questo senso sono alcuni sviluppatori (tra cui, in passato, io stesso), che per evitare del lavoro in fase di validazione dell’input, giungono perfino a usare 3 combobox diverse per richedere una data.

Search Engine Strategies a Milano, qualche perplessità

C’ero anch’io al Search Engine Strategies del 26 e 27 Aprile scorsi a Milano. E ne sono rimasto un po’ scontento, tanto da parlarne approfonditamente in un articolo per Mytech. Ogni volta che vado a incontri di questo tipo sono sempre più preoccupato dello stato del web italiano. Passerò per esterofilo (se qualcuno ha ancora dubbi può leggere qualche mio vecchio commento e critica), ma almeno metà delle presentazioni altro non erano che ricalchi poco riusciti di documenti presenti in internet, e neppure tanto approfonditi. Perché non proporre qualche spunto originale? Perché dipendere così tanto dall’america?

Ma non è andato proprio tutto male. Come dico nell’articolo, almeno qualche italiano che non parla di aria fritta c’è. Sono i ragazzi di tsw.it, che tra le altre cose hanno inserito nel loro sito le slide di tutte le presentazioni che hanno proposto.