Ferramentas de Busca
As ferramentas de busca, também conhecidas como search engine, tem um conceito muito maior hoje em dia, envolvendo inclusive os diretórios e tudo relacionado a busca na internet. Mas originalmente, o conceito de ferramenta de busca é relacionado apenas as buscas que não são feitas por pessoas em contrapartida aos diretórios. Podemos dividir estas buscas em três partes:
Coleta, análise, resposta
A parte da coleta de páginas é feita pelos web crawlers. O web crawler é um programa que varre a web coletando os dados que encontra nos sites. Também conhecido como spider, o webcraler é um robô (bot), pois simula o comportamento de uma pessoa ao navegar pelos sites. Os bots mais conhecidos são o GoogleBot (Google), o Yahoo! Slurp (Yahoo!) e o MSNBot (Microsoft).
Os web crawlers começam sua navegação de uma lista de URLs como diretórios ou uma base já existente. A partir delas, o web crawlers checam o conteúdo destas páginas e vão armazenado os links contidas nelas para poder acessar novas páginas. Indo de link em link, eles conseguem alcançar, a partir de poucas páginas, milhões de outras, armazenando as informações coletadas em bancos de dados.
Na parte da análise das páginas, o conteúdo armazenado é tratado para identificar como ele deve ser indexado. Por exemplo, quais são as palavras-chave que tem na página do site, se a página trata de mais de um assunto, se o link para esta página tem algum termo relevante, se exite uma palavra-chave no tÃtulo da página e diversos outros. Tudo isto é feito para que ao ser feita uma busca, sejam retornados rapidamente resultados relevantes.
A última parte é a mais transparente para nós. Ela é a página de resposta. Quando o usuário faz uma pesquisa (query) um site de busca, a palavra que ele digitou é a palavra-chave que será buscada no banco de dados indexado e será retornada uma listagem de páginas relacionadas por ordem de relevância. Como a quantidade de informações sobre está palavra é muito grande, ele apenas consulta a quantidade de ocorências desta palavra-chave e faz a paginação dos resultados. Com isto, se você não encontrou o que precisava, ou quer mais fontes de informação, basta ir para a próxima página e ver os próximos resultados.
Regina
agosto 30, 2007 @ 11:20 am
Gostaria de mais informações a respeito.
Fausto Barral
outubro 17, 2007 @ 3:30 pm
Eu tbm queria mto saber disso.
SEO (Search Engine Optimization) « O Blog da Satellite
maio 21, 2009 @ 2:28 pm
[…] links em uma páginas de resultado era alfabética como nos diretórios web. Na nova geração de ferramentas de busca, o posicionamento passou a depender da relevância. Esta relevância é definida por algoritmos, […]
SEO « Informática 3D
março 26, 2010 @ 11:01 am
[…] links em uma páginas de resultado era alfabética como nos diretórios web. Na nova geração de ferramentas de busca, o posicionamento passou a depender da relevância. Esta relevância é definida por algoritmos, […]
O que é SEO? | :: ISSO Studio
agosto 20, 2010 @ 9:04 pm
[…] links em uma páginas de resultado era alfabética como nos diretórios web. Na nova geração de ferramentas de busca, o posicionamento passou a depender da relevância. Esta relevância é definida por algoritmos, […]
O que é SEO | SEO Wiki - Artigos e Ferramentas de SEO
agosto 23, 2013 @ 3:35 pm
[…] links em uma páginas de resultado era alfabética como nos diretórios web. Na nova geração de ferramentas de busca, o posicionamento passou a depender da relevância. Esta relevância é definida por algoritmos, […]