Pesquisa do Google

Opinião. 7 Mar 2013

Como funciona a pesquisa do Google?

Esta é a pergunta que quase todos os utilizadores do maior motor de pesquisa do mundo já fizeram. A Google decidiu criar um site "How Search Works" que através de um infográfico interativo explica o processo de pesquisa e ainda refere algumas curiosidades, como por exemplo a quantidade de pesquisas feitas no Google durante o período de tempo em que o utilizador esteve na página. .

Num site de uma só página (single-page application) a Google explica as três fases do processo de pesquisa:

1 - Crawling & Indexing (Rastreio e Indexação)

O Google através dos seus "spiders" (Googlebot) pesquisa mais de 30 triliões de páginas únicas e indexa-as no seu índice (com mais de 100 milhões de gigabytes). Ou seja, como refere Matt Cutts num vídeo que explica como a pesquisa funciona, quando pesquisamos não o fazemos em toda a web mas sim pelo índice do Google.

A pesquisa é feita de link em link, ou seja, sites com links levam a outros sites com links para outros sites e assim se forma uma "teia" de sites ligados entre si e que vão sendo rastreados pelo Google. Pode dar-se o caso de os administradores dos sites não quererem que este seja indexado e para isso utilizam por exemplo o robots.txt.

As páginas encontradas são colocadas no índice mas é preciso analisá-las e ordená-las.

2- Algorithms (Algoritmo)

A grande premissa do Google é apresentar ao utilizador o melhor resultado para aquilo que ele está a pesquisar. Assim sendo, através de algoritmos o Google tenta perceber o que o utilizador pretende e tendo em conta mais de 200 fatores, decide quais as páginas que para determinada pesquisa devem aparecer no topo, quais as que têm a informação mais relevante para aquele utilizador.

Muitos dos fatores tidos em conta pelos algoritmos são apenas conhecidos por um número muito restrito de pessoas e estão em constante mudança.

Outra curiosidade apresentada neste infográfico é o tempo de resposta a uma pesquisa, desde que o utilizador insere a expressão que quer pesquisar, até à apresentação dos resultados decorre geralmente um oitavo de um segundo.

Para que as páginas apresentadas ao utilizador sejam as mais relevantes é preciso combater o SPAM.

3 - Fighting SPAM (Combate ao SPAM)

O Google combate o SPAM 24 horas por dia, 7 dias por semana.

A maioria do SPAM é eliminado automaticamente no entanto existem algumas páginas que têm de ser analisadas "manualmente".

Os proprietários dos sites, sempre que estes são considerados fonte de SPAM, são geralmente notificados para poderem resolver o problema e posteriormente pedir uma nova avaliação ao Google.

O "How Search Works" pretende salientar que o ato de pesquisar, apesar de para o utilizador parecer simples, tem por detrás um processo bastante complexo e em constante atualização.

Curiosidade:
durante os 283 segundos que estive no site "How Search Works" foram feitas cerca de 10,918,140 pesquisas no Google.

Vera Libânio