Google cache com strip
Mais uma dica exclusiva que descobri pessoal. Muita gente não entende que o Googlebot é cego. Ele não entende recursos especiais como CSS, imagens ou javascript. Ele só entende texto. Existem algumas ferramentas que simulam como o Googlebot enxerga as páginas, mas nada como checar direto com o Google para ver como ele entende o conteúdo da página. Para vermos como é uma página sem estes recursos especiais, vamos usar um macete.
O Google tem um recurso chamado cache. Ele é uma cópia da página que o Google armazena em um banco de dados. Você já deve ter notado na SERP que na última linha, após o tamanho da página, tem um link escrito “Em cache”.
Se você clicar neste link da SERP, será aberta uma página com a versão que o Google tem do seu site no cache dele. Esta pode não ser a versão atual da sua página já que o GoogleBot tem que visitar novamente a sua página após as alterações para poder extrair a nova versão para o cache. Entendido isto, siga estes passos para encontrar a versão clean da página.
Primeiro procure pela página desejada no Google. Tente digitar a URL da página na caixa de busca para facilitar. Após localizar na SERP o resultado, clique no link, “Em cache”. Você verá uma uma página que logo na primeira página diz a data que a página foi armazenada no cache. Informação útil. No quarto parágrafo, você verá um link “o texto em cache” que ao ser clicado, mostrará a versão texto da sua página. Se preferir, você pode pegar uma URL do Google cache e acrescentar o comanto strip. Inclua este texto sem as aspas para ver a versão de texto: “&strip=1”.
Isto é útil quando você quer explicar para alguém que não entende nada de SEO que aquele site maravilho todo feito em Flash ou AJAX não será visto com bons olhos pelo Google. Literalmente pode não ser visto.
apieve
fevereiro 13, 2008 @ 10:57 am
Realmente as melhores idéias são as mais simples!!
E pensar que já tentei explicar o que é Lynx e como os mecanismos de buscas lêem as páginas… Foi trabalhoso e pouco convincente! rsrsrs
Obrigado, Paulo, grande sacada!
Paulo Rodrigo Teixeira
fevereiro 13, 2008 @ 2:04 pm
Eu também já fiz isto Adalberto.
Depois passei a usar o Firefox com o plugin developer desabilitando as opções.
Um grande abraço
Cleber
fevereiro 14, 2008 @ 7:53 am
Nossa!!! Valeu pela dica, já implantei.
Mauricio Filho
fevereiro 15, 2008 @ 2:24 pm
Olá Paulo,
Muito interessante o seu post.
Porém eu tenho algumas indagações.
– Se o Googlebot é cego (nao le css), como o web-spam consegue identificar se voce esta fazendo cloaking?
Se eu não me engano o prato fundo do matt cutts andou dizendo que há um algoritimo la que compara as classes com o o body. Mais realmente nao lembro onde li isso.
Paulo Rodrigo Teixeira
fevereiro 15, 2008 @ 9:18 pm
Oi MaurÃcio,
O Googlebot é apenas um robô faminto que coleta informações de texto e armazena em bancos de dados. Na verdade depois disso é que começam a funcionar os algoritimos em cima destes conteúdos.
Por exemplo, tem programas que “retiram código fonte” do (X)HTML, tem programas que recolhem as palavras-chave e as armazenam em bancos de dados e tem também programas que analizam o código. As análises são diversas como entender o conteúdo do texto âncora, contar a quantidade de links e até checar se uma classe css tem background igual a cor de fonte de uma classe que está dentro dela.
Realmente o Matt falou que o algoritmo estava “segurando tudo”, mas também lembro na época de ter lido em um blog SEO alguém contestando isto e mostrando até um exemplo de black hat não pego.
Um grande abraço
Thomas
fevereiro 18, 2008 @ 1:58 pm
Bem interessante, eu também já cheguei até a instalar o Linx para windows só para demonstrar a “cegueira” do google bot.
Valeu pela dica
Anderson
maio 16, 2008 @ 10:54 pm
muito obrigado pela dica,
minhas visitas cairam muito depois que mudei o
layout do meu site.
vania
junho 8, 2008 @ 9:53 pm
Oi Paulo….
Estou desenvolvendo uma pesquisa, sobre preservação de informação no ciberespaço, e vou citar o cache do google como sendo uma ferramenta de memória, mas estou encontrando dificudades em explicar como funciona, afinal não há literatura cientifica a respeito. Será que vc poderia me ajudar, explicando como funciona esse recurso, e se quando a página está of line os links se quebram, se as imagens desaparecem, de quanto em quanto tempo os robos passam atualizando,
Se vc puder me ajudar agradeço mt mt mt…
Abs.
PS. pode enviar no meu e-mail a resposta
Renan Hagiwara
junho 19, 2008 @ 8:47 am
Pois é, já utilizei muito este recurso de como as páginas são vistas e estão armazenadas no google para “convencer” o cliente a fazer/re-fazer seu site com webstandards, é um recurso gratuito e muito útil para nós 😀
abraço!
José Carlos
julho 19, 2008 @ 1:55 pm
Google e seo a caminho do futuro
Cristiana
julho 24, 2008 @ 12:34 pm
Oi, e se eu quiser colocar meu site em cache? existe alguma maneira? pois nao sao todos os sites que ficam….
Fabio Luis Rodrigues
fevereiro 5, 2009 @ 8:46 am
Pessoal,
Este artigo é muito importante, muitas vezes queremos mostrar a um usuário a importância de se construir sites com usabilidade e visibilidade para mecanismos de buscas, mas é sempre desanimador ao usuário informar que o google não “enxerga” uma super animação extraordinária em flash.
Isso acaba com os sonhos do usuário e faz com que muitos optem a usar tácnicas para “esconder texto” com css e exibir somente ao google.
Porém esta técnica é passÃvel de banimento pelo mecanismo de busca.
Ó timo artigo.
Juliana
fevereiro 5, 2009 @ 5:33 pm
E para tirar uma página “Em cache”.
Quanto tempo demora para sumir esta referência do Google, uma vez que a página original já foi modificada e aquela informação apagada?
Obrigada!
andré homem
março 1, 2009 @ 1:17 pm
Removi o meu blogger. Vejo que alguma informação aparece no em cache do google
Como posso remover a informação no em cache.
Obrigado
Xica
agosto 25, 2009 @ 11:05 am
Removi o meu blogger. Vejo que alguma informação aparece no em cache do google
Como posso remover a informação no em cache.
Obrigado
Eliani
outubro 20, 2009 @ 8:25 am
Oi, Paulo, muito interessante essa matéria pois pude entender o que significa o “em cache” que sempre aparece nas pesquisas do google.
De quanto em quanto tempo o google atualiza as páginas em cache? E como eu faço pra remover a informação que consta apenas na página “em cache” quando a página não é minha? Hackers conseguem alterar as versões “em cache” do google?
Obrigada
Diego
dezembro 14, 2009 @ 8:15 am
Basta clicar em “Versão somente Texto” no Cache. É a mesma coisa.
sandro
fevereiro 24, 2010 @ 10:55 pm
Olá, Legal Paulo boa dica.
Mas veja só esse site http://74.125.113.132/search?q=cache:c6eLWX0J67IJ:www.buffetcolonial.com.br/+colonial&cd=2&hl=pt-BR&ct=clnk&gl=br&strip=1
Pelo olhar do google o site não tem nada, mas em contrapartida esse site qualquer palavra referente a buffet ele esta sempre bem posicionado. O site tem iframe nas páginas internas inclusive.
Qual sua opinião sobre esse tipo de site que se sobressai apesar de não ser amigável para o google.
carlos henrique
junho 20, 2010 @ 10:13 pm
Sandro credita-se que seja pelo fato da URL ter a palavra chave pesquisa (Buffet) e receber vários links “bem relacionadosâ€, pois pesquisei o segundo colocada e apesar das semelhanças de palavras chaves na URL e no conteúdo, e ter mais tempo de domÃnio ativo não é bem relacionada quando a primeira colocada.
Gilmar tiepo da silva
setembro 18, 2010 @ 3:24 pm
Peço por gentileza responder no meu I.Mail. O que é Cache- e Pagina semelhante
o qual esta nos saites- endereçamento
gtscarinha@yahoo.com.br
Tenho computador a pouco tempo
gilmar tiepo
J. Guimarães
dezembro 25, 2012 @ 11:54 am
É muito importante saber essas informações.
Valeu o conteúdo deste post.
Vou aprender mai sobre o Em Cache.