venerdì 8 giugno 2012

Motore di ricerca algoritmo di Google



Ecco un breve riepilogo di alcune tecniche per sfruttare al meglio le potenzialità dei motori di ricerca e  affinare una query in maniera dettagliata. 

Nonostante la fase cambiamento  per i risultati delle ricerche  rimangono validi


Gli strumenti per  personalizzare una ricerca in modo da avvicinarsi con la massima approssimazione al risultato desiderato.
Ecco quali sono i più interessanti e facili da usare: 
  • Virgolette alte [“ “]: costringono il motore di ricerca a  interpretare  le parole che vengono racchiuse tra di esse come se fossero una sola. Se inserite la frase FOTOGRAFIA DIGITALE, otterrete come risultato della query (tranne che con Excite, che non supporta questa opzione) tutti i siti che conterranno la scritta fotografia digitale, senza altre parole o segni di interpunzione in mezzo.  
  • Asterisco [*]: non tutti i motori di ricerca lo supportano (Google, per esempio, non lo fa), ma quando può essere utilizzato si rivela  estremamente comodo. L’asterisco consente di inserire nella barra della query una porzione di parola e fare in modo che il motore rintracci tutti i siti che contengono quel termine con tutte le sue possibili variazioni.  Inserendo per esempio FOTOGR*, verranno considerati termini attendibili sia fotografia che fotografare, ma anche tutte le possibili varianti come fotografando, fotografico e via dicendo. 
  • Parentesi [( )]: si tratta di un altro strumento utile per impostare una ricerca raffinata. Inserendo FOTOGRAFIA AND (DIGITALE OR REFLEX), il motore di ricerca troverà tutti i siti che contengono il termine fotografia   abbinato al termine digitale o reflex, oppure entrambi. Senza parentesi, il motore avrebbe interpretato diversamente, cercando i siti con le parole fotografia e digitale, ma anche solo  reflex, oppure tutti e tre insieme.
Può essere utile capire più a fondo i meccanismi di funzionamento di alcuni tra i più utilizzati motori di ricerca. Primo fra tutti Google, che ingloba nel suo indice più di due miliardi di URL e che basa la qualità dei suoi processi di ricerca soprattutto sul sofisticato algoritmo utilizzato da Page Rank, il sistema sviluppato da Larry Page e Sergey Brin dell’università di Stanford capace di classificare le pagine Internet in base alla loro importanza e al numero di segnalazioni (link) che hanno in altre pagine web. Dalla somma di questi due fattori, Google determina quali siti proporre tra i primi risultati di una ricerca. Tra le nuove funzioni di Google spicca senz’altro il sistema di traduzione delle pagine web, al momento disponibile in versione beta, che garantisce la possibilità di navigare (seppure con una certa  approssimazione) nei siti stranieri.
Ma con Avento di Google Panda   algoritmo di ranking dei risultati della ricerca che è stato rilasciato nel febbraio 2011 Google Penguin  algoritmo di Google aggiornamento che è stato annunciato il 24 aprile 2012,  Google sembra distaccarsi nettamente dal funzionamento classico dei motori di ricerca, infatti ancora tutt'ora   non è chiaro il criterio di classificazione adottato.
Non sono molti i motori di ricerca italiani consultati regolarmente dagli utenti. Almeno, non con i numeri che possono far registrare motori come Google, Yahoo! o Altavista. Di Godado, basato su un sistema di ranking a pagamento, si è già detto. Anche Virgilio (www.virgilio.it), storicamente uno dei primi motori di ricerca italiani e il solo che riusciva a reggere il confronto con i colossi del settore. 

Per ottenere buoni risultati di ricerche  Anche per chi non conosce l’inglese, i termini AND, OR, NOT,

NEAR dovrebbero suonare familiari. Si tratta dei cosiddetti operatori booleani (dal matematico inglese George Boole, “inventore” del codice binario su cui si fonda la moderna informatica), piccole particelle in grado di restringere o ampliare il campo di ricerca di una query in un motore di ricerca. Il loro utilizzo non è né facile né intuitivo, e spesso provocano effetti ben  diversi da quelli sperati, ingenerando confusione e allontanandovi dal risultato voluto, anziché portarvi più vicino (è questo il motivo principale per cui molti motori di ricerca gestiscono in automatico le funzionalità degli operatori booleani, come Google, che inserisce di default il termine AND nelle stringe di  ricerca e non riconosce l’operatore OR, considerato troppo ambiguo). Il segreto per non sbagliare è comprenderne perfettamente il significato e imparare a utilizzare gli operatori booleani con criterio. Allora possono diventare fondamentali per raggiungere a colpo sicuro il risultato che vi prefiggete. Il modo migliore per comprendere le caratteristiche dei singoli operatori è fare qualche esempio di query.
  • L’operatore AND: se dovete cercare delle pagine web che si occupano di fotografia e di digitale, AND garantisce di poter restringere il campo della ricerca solo ai siti che trattano  entrambi gli argomenti, ovvero fotografia “e” digitale. Tutte le pagine web che parlano solo di digitale o solo di fotografia, ignorando l’altro argomento, verranno escluse dal risultato della query. Quando si utilizza l’operatore AND bisogna anche tenere conto di un altro fattore: il termine che viene indicato per primo (per esempio FOTOGRAFIA AND DIGITALE) è quello che avrà la precedenza nei risultati della ricerca. Se quindi interessano prevalentemente le pagine dedicate al digitale e poi quelle più generiche sulla fotografia, è meglio inserire nella barra delle ricerche la frase: DIGITALE AND FOTOGRAFIA. 
  • L’operatore OR: questa particella si comporta in maniera opposta rispetto a AND. Inserendo infatti DIGITALE OR FOTOGRAFIA, il motore di ricerca (se supporta questo operatore) offrirà come risultato tutti i siti che contengono sia il termine digitale che quello fotografia, oltre naturalmente a quelli che li contemplano entrambi. In questo modo, la ricerca si allarga. 
  • L’operatore NEAR: la traduzione migliore di questa particella è “vicino”. Si tratta di un operatore abbastanza simile, come concetto di ricerca, a AND, ma ha la particolarità di restringere ancora di più il campo della query, in quanto ordina al motore di trovare tutti i siti che contemplano i termini di ricerca ma a distanza ravvicinata, ovvero separati da non più di una decina di parole. Inserendo DIGITALE NEAR FOTOGRAFIA si otterrano i siti che contemplano entrambe le parole, ma solo se si trovano, all’interno del testo dei siti rintracciati, a non più di dieci termini di distanza l’una dall’altra. 
  • L’operatore NOT: si tratta forse del più intuitivo. Serve infatti per escludere una parola da una ricerca, soprattutto quando associato al termine AND. Mettendo, per esempio, la frase DIGITALE AND FOTOGRAFIA AND NOT REFLEX, si troveranno tutti i siti che trattano contemporaneamente di fotografia e di digitale ma ignorano le macchine reflex.
Il sito www.offertagratis.com  ci descrive la differenza tra Metamotori di ricerca, metacrawler o metasearch engine indicando una lista di altri motori di ricerca alternativi a Google

Nessun commento:

Posta un commento

Post più popolari