Rastreador de pesquisa Ícone de marcador simples

Um rastreador de pesquisa é um programa automatizado que analisa o conteúdo da Internet seguindo as ligações de uma página para outra. Também designado por bot de pesquisa, spider ou web crawler, indexa metodicamente as páginas para que os motores de pesquisa as possam recuperar quando os utilizadores as procuram.

Última atualização 13 de novembro de 2023
Design de cabeçalho de rodapé com gradiente de roxo para branco

Já se interrogou como é que os motores de busca como o Google podem responder às suas perguntas, fornecendo-lhe conteúdos e páginas relevantes? Os motores de pesquisa são ajudados por rastreadores de pesquisa, também designados por bots de pesquisa, spiders ou web crawlers.

Saiba como funcionam os robôs de pesquisa para melhorar os seus esforços de otimização dos motores de busca (SEO)!

O que é um rastreador de pesquisa?

A rastreador de pesquisa é um programa que navega e indexa páginas na Internet. A sua missão é indexar páginas para que os motores de busca possam recuperar informações e páginas relevantes quando um utilizador as procura. Um rastreador de pesquisa também é designado por bot de pesquisa, spider, web crawler ou search crawler.

Porque é que os bots de pesquisa são importantes para a SEO

Os bots de pesquisa são fundamentais para os seus esforços de SEO. Estes spiders têm de ser capazes de descobrir e rastrear o seu sítio antes de as suas páginas poderem aparecer nas páginas de resultados dos motores de busca (SERPs).

Dito isto, certifique-se de que não está a bloquear os rastreadores da Web de navegarem nas páginas que pretende classificar.

Como é que um Web crawler funciona?

Pense nos motores de busca como viajantes da World Wide Web.

Começam com um mapa de URLs conhecidos para onde ir. Estes spiders rastreiam primeiro estas páginas. De seguida, vão a outras páginas para as quais a sua lista inicial de URLs está ligada.

Percepções de especialistas de Logótipo Google

"Utilizamos um enorme conjunto de computadores para pesquisar milhares de milhões de páginas na Web. O programa que faz a pesquisa chama-se Googlebot (também conhecido como crawler, robot, bot ou spider). O Googlebot utiliza um processo algorítmico para determinar quais os sites a rastrear, com que frequência e quantas páginas deve ir buscar a cada site."

Central de pesquisa do Google Fonte

Como a World Wide Web tem uma vasta coleção de páginas, os robôs de pesquisa são selectivos quanto ao conteúdo a que dão prioridade. Estes bots seguem políticas sobre as páginas a analisar e a frequência com que têm de voltar a procurar actualizações nas páginas.

Os robots de pesquisa recolhem informações sobre as páginas que rastreiam - como viajantes que tomam notas sobre novos locais que visitaram. Recolhem informações como o texto na página, as imagens e o respetivo texto alternativo e as meta-etiquetas. Os algoritmos dos motores de busca processam e armazenam estas informações para as poderem recuperar quando um utilizador as procura!

Se tiver um novo Web site e nenhuma outra página estiver atualmente ligada a ele, pode enviar o seu URL para a Consola de Pesquisa do Google.

FAQs sobre os rastreadores de pesquisa

Agora que já sabe porque é que os bots de pesquisa são importantes para a SEO e como é que os Web crawlers funcionam, vamos analisar algumas perguntas frequentes sobre os crawlers de pesquisa:

Quais são os exemplos de Web crawlers?

A maioria dos motores de busca tem os seus próprios motores de busca. Os gigantes dos motores de busca, como o Google, têm mesmo muitos crawlers que têm áreas de interesse específicas. Eis alguns exemplos de Web crawlers:

  • Ambiente de trabalho do Google: Um rastreador que simula um utilizador de ambiente de trabalho
  • Smartphone Google: Um Googlebot que simula um utilizador de telemóvel
  • Bingbot: O rastreador da Web do Bing que foi lançado em 2010
  • Baidu Spider: O rastreador da web do motor de busca Baidu
  • DuckDuckBot: O robot de pesquisa do DuckDuckGo
  • Yandex Bot: O rastreador de pesquisa do motor de busca Yandex

Deve permitir sempre o acesso dos motores de busca ao seu sítio Web?

Os proprietários de sítios Web como você querem que as suas páginas sejam indexadas e apareçam nos resultados de pesquisa, pelo que é bom que os bots de pesquisa rastreiem o seu sítio. No entanto, o facto de os robôs de pesquisa estarem sempre a aceder ao seu sítio pode consumir recursos do servidor e aumentar os seus custos de largura de banda.

Além disso, poderá ter páginas que não quer que os motores de busca descubram e forneçam aos utilizadores, como por exemplo

  • Página de destino de uma campanha: Poderá ter páginas de destino de pagamento por clique (PPC) para as quais pretende que apenas os utilizadores visados acedam à página.
  • Página deresultados de pesquisa interna: O seu sítio Web tem uma funcionalidade de pesquisa? Se tiver, pode ter uma página de resultados de pesquisa que não quer que apareça nas SERPs do Google, uma vez que pode não conter conteúdo útil para os pesquisadores do Google. É preferível que eles cheguem às suas outras páginas úteis.
  • Página de agradecimento ou de boas-vindas
  • Página de início de sessão do administrador
Dica profissional

Pode adicionar uma etiqueta "noindex" às páginas que não pretende que apareçam nos SERPs. Uma etiqueta "disallow" na sua página ou no seu ficheiro robots.txt também diz aos spiders para não a rastrearem.

O que é o orçamento de rastejamento?

O orçamento de rastreio é a quantidade de tempo e recursos que os robots de pesquisa atribuem ao rastreio de um sítio Web. Inclui:

  • O número de páginas a rastrear
  • Com que frequência os bots irão rastrear
  • Recursos de servidor aceitáveis

O orçamento de rastreio é importante porque não quer que os bots de pesquisa e os visitantes do site sobrecarreguem o seu site. Se o Google estiver a tornar o seu servidor mais lento, pode ajustar o limite da taxa de rastreio nas Definições da taxa de rastreio da Consola de Pesquisa do Google.

Optimize os rastreios de pesquisa para impulsionar a sua estratégia de SEO

Os bots de pesquisa rastreiam o seu sítio para que as suas páginas sejam indexadas e possam ser descobertas. Compreender o que são e como funcionam permite-lhe otimizar o seu sítio para se classificar nas SERPs e ajudar os seus potenciais clientes a encontrar a sua empresa!

Quer saber mais sobre outros termos e frases de SEO? Consulte o nosso glossário de SEO!

Não falhe o teste mais importante do seu sítio Web

Obtenha gratuitamente um quadro de resultados de SEO do seu sítio Web em menos de 30 segundos.