Archive for the ‘SEO’ Category

SEO – Introduzione ai motori di ricerca

Al giorno d’oggi è sempre più frequente ricercare qualsiasi informazione attraverso i motori di ricerca, si arriva persino a inserire l’URL di un sito sul motore invece che sulla barra degli indirizzi! Si può ben capire che avere il proprio sito nelle prime posizioni risultanti dalla ricerca è un fattore molto importante soprattutto in ambito commerciale; spesso le aziende pagano i motori per far si che il loro sito risulti bene in vista se vengono digitate alcune parole chiave (keyword) come nel caso di google con google adwords, che propone dei link “sponsorizzati” in cima alla lista dei risultati della ricerca o inseriti laterali alla stessa pagina. Tale servizio, però, si paga “a click” e in base alla mole di visitatori il costo salirebbe vertiginosamente: in questo contesto nasce la scienza che studia in che modo funziona l’algoritmo di ricerca dei motori e le relative applicazioni pratiche per poter far comparire un sito nelle prime posizioni delle ricerche in relazione all’utilizzo di determinate keyword. Tali procedure prendono il nome di ottimizzazione dei motori di ricerca o Search  Engine Optimization (SEO)

E’ stato precedentemente citato google non a caso. Il colosso di Mountain View, infatti, è il motore di ricerca più utilizzato al mondo e il suo algoritmo di ricerca è ancora poco chiaro in tutti i suoi punti, però si hanno molte infomazioni su come lavora. La nostra trattazione di SEO consterà maggiormente su come ottimizzare una pagina web e/o un intero sito internet per google.

L’attività di SEO è un’operazione che va effettuata sia sul codice HTML che sui contenuti, non basta infatti inserire dei tag <meta> al posto giusto per fare SEO, quello serve ma non è abbastanza: i contenuti di una pagina web svolgono un ruolo importante nel farla posizionare bene utilizzando vocaboli appropriati che possano consentire una migliore visibilità da parte dei motori. L’ottimizzazione sul codice verrà trattata in un altro articolo.

Come avviene la scansione di un sito da parte di un motore di ricerca? La ricerca delle pagine web avviene attraverso meccanismi automatizzati, da script che analizzano un sito web in maniera iterativa seguendo i link che vi sono al suo interno partendo dall’URL principale fino alle pagine più interne. Tali script prendono il nome di crawler o spider. Ogni motore ha uno spider apposito, quello di google di chiama googlebot, di Yahoo si chiama Yahoo! Slurp e così via…. Lo spider continua la scansione in tutte le pagine senza fare distinzione tra le cartelle, andando così a indicizzare (e quindi rendere potenzialmente pubblici) anche file e/o pagine che si vorrebbero tenere lontano dai motori di ricerca. Per limitare la scansione si può utilizzare un file che si deve chiamare robots.txt nella root del sito indicando le directory da non indicizzare e alcune regole da utilizzare.
Importante
: il crawler dovrebbe non andare a leggere il contenuto delle cartelle che sono state indicate nel robots.txt, ma alcuni crawler lo fanno comunque, è bene tenerlo presente. Googlebot segue bene le indicazioni inserite sul robots.txt.

Terminiamo questa breve introduzione teorica sul SEO introducendo dei parametri molto cari a google: link popularity e page rank. Ogniqualvolta si effettua una ricerca si ha un elenco ordinato di risultati che prendono il nome di search engine result page (SERP). A parità di tag e di contenuti, un sito può risultare molto più in alto nelle SERP di un altro proprio in base a questi due parametri.
La link popularity è il numero dei link che puntano a una determinata pagina Web e indica la “popolarità” di un sito. Infatti, un link verso una pagina Web di un sito da parte di un altro può essere visto come un “consiglio” hai visitatori e quindi l’indicazione che il sito vale la pena di essere visitato.
Il page rank può essere visto come una link popularity “pesata” dove ci sono link che “valgono” di più e link che “valgono” di meno. Esso è un valore che va da 0 a 10 e si calcola in base al seguente algoritmo

formula per il calcolo del page rank da parte di google

formula per il calcolo del page rank da parte di google

Dove:

  • PR[A] è il valore di PageRank della pagina A che vogliamo calcolare.
  • n è il numero di pagine che contengono almeno un link verso A. Pk rappresenta ognuna di tali pagine.
  • PR[Pk] sono i valori di PageRank di ogni pagina Pk.
  • C[Pk] sono il numero complessivo di link contenuti nella pagina che offre il link.
  • d (damping factor) è un fattore deciso da Google e che nella documentazione originale assume valore 0,85. Può essere aggiustato da Google per decidere la percentuale di PageRank che deve transitare da una pagina all’altra e il valore di PageRank minimo attribuito ad ogni pagina in archivio.

Dalla formula si nota quindi che all’aumentare del numero di link complessivi dei siti che puntano ad A il PageRank aumenta. (Fonte Wikipedia)

Ovviamente, la trattazione di oggi non esaurisce tutti gli argomenti teorici riguardanti il SEO, ma è la base per poter comprendere meglio la parte pratica che verrà sviluppata nel prossimo articolo.