Arquivado em SEO

Todo mundo sabe SEO: questione

Assistindo uma apresentação do Páris Neto, ele fez uma analogia muito interessante entre web analytics e sexo. Em ambos, muita gente diz que já está fazendo, que faz bem e que entende muito do assunto, mas na verdade o povo só fala que faz. Fazer direito mesmo, poucos.

O Marcelo Sant’Iago twittou a mesma coisa, agora associando a SEO. Eu já vinha pensando nisto, principalmente com a explosão de empresas que prestam serviço SEO no Brasil. Claro que SEO não é ciência para foguetes (tá, algumas vezes é), mas não é por que você colocou o título da página entupido de palavras é que você sabe SEO.

Só para deixar mais claro, existe o que podemos chamar de SEO básico. Ele ficaria naquela parte de “crie títulos e meta tags descritivos” e “cadastre em diretórios”. Típico artigo reescrito e traduzido em diferentes formas. Vale lembrar que isto já garante resultado em mercados pouco competitivos, mas mesmo no SEO básico tem gente que faz as coisas sem nem entender o que está fazendo. A pessoa leu um artigo com algo que funcionava antes do Florida Update e continua fazendo até hoje. Simplesmente por que foi escrito e não por que foi testado.

A proposta que faço aos leitores é questionar a informação. Inclusive a que eu passo aqui no site. Se eu digo que sites em vermelho são melhores para SEO, questione o porquê. O pensamento crítico é importante para quebrar paradigmas e destruir mitos. Continuo pregando que SEO é associar as boas práticas ao seu site e facilitar a vida do seu público. Se você leu em uma revista ou livro que colocar uma imagem transparente de 1 pixel por um 1 pixel usando o atributo alt cheio de palavras-chave é o que há de melhor em SEO, pare um minuto e questione isto. Com esta atitude você pode evitar uma bela punição.

Pretendo desdobrar este assunto em outros posts. Para ter uma idéia o questionamento é apenas uma das facetas.

Comentários (20)

HTTP Headers Рo cabe̤alho oculto

Em uma simples visita a uma página, muita gente não tem noção de quantos processos acontecem até a sua página ser totalmente carregada. Cada página, imagem e CSS gera uma requisição por parte do navegador ao servidor de um site. Esta conversa é feita com o protocolo HTTP. Um robô de busca também usa o mesmo protocolo para se comunicar e varrer um site. Esta conversa fica oculta aos nossos olhos, mas ela é importante para SEO. A conversa acontece pelo cabeçalho HTTP. Ele tem a parte de requisição que é feita pelo user-agent ao host e tem a parte da resposta que é a mensagem retornada referente a requisição com um código de status. Vamos ver um pouco o processo.

Requisição HTTP

Quando você digita uma URL no seu navegador e aperta enter, sem você ter noção, o navegador faz um pedido ao servidor que responde a solicitação. Veja abaixo um exemplo de requisição ao servidor:

GET / HTTP/1.1
Host: www.marketingdebusca.com.br
Connection: close
User-Agent: Googlebot/2.1 (+http://www.googlebot.com/bot.html)
Accept-Encoding: gzip
Accept-Charset: ISO-8859-1,UTF-8;q=0.7,*;q=0.7
Cache-Control: no
Accept-Language: de,en;q=0.7,en-us;q=0.3
Referer:

Neste exemplo o pedido é feito pelo método GET para o host (URL) marketing de busca pelo user-agent Googlebot. No lugar do User-Agent Googlebot poderia ser o Internet Explorer, o Firefox ou qualquer programa que você inventar. É possível informar um User-Agent sem confirmar se ele é realmente é verdadeiro. Isto serve para identificar se um servidor está passando páginas para os Robô de busca diferentes das páginas para os usuários. O servidor pode inclusive apresentar conteúdo diferente baseado no User-Agent. Esta é uma técnica comum de Black Hat SEO onde o criador da página pode apresentar apenas para o Googlebot um página otimizada enquanto os outros visitantes recebem uma página diferente como Flash por exemplo.

Resposta HTTP

A requisição HTTP que fizemos acima, gera uma resposta do servidor. Veja um exemplo de resposta à requisição:

HTTP/1.1 200 OK
Date: Wed, 30 Jul 2008 19:41:57 GMT
Server: Apache/1.3.37 (Unix) mod_throttle/3.1.2 ...
X-Pingback: https://marketingdebusca.com.br/xmlrpc.php
X-Powered-By: PHP/5.2.6
Connection: close
Content-Type: text/html; charset=UTF-8
Content-Encoding: gzip
Content-Length: 9631

Está é a resposta HTTP. A primeira linha tem um código. Neste caso é o código 200. Este código responde ao User-Agent que a página foi encontrada com sucesso e será enviado a quem pediu. Também são informados dados do servidor que no caso é o Apache e seu módulos instalados como o PHP. Tem vários outros dados também como o tamanho do conteúdo e o tipo dele.

Existem vários códigos de retorno possíveis a cada requisição. Os códigos tem sempre três dígitos e o primeiro digito mostra a que grupo de código de Status ele pertence.

Vamos ver os grupos e os códigos mais importantes para SEO.

Códigos de Status

1XX Informacional
Não há necessidade de se preocupar com este, serve apenas para informar que a informação foi recebida e que o processo continua.

2XX Sucesso
Significa que o pedido foi recebido com sucesso. É o que sempre acontece quando suas páginas são carregadas

200 – OK. O pedido ao servidor foi atendido com sucesso. A página web existe e será enviada ao user-agent (navegador, robô de busca…).

3XX Redirecionamento
Serve para avisar direto no cabeçalho HTTP uma mudança de página. Diferente de um Meta Refresh ou usar javascript, ele permite um redirecionamento “suave” e importante para SEO.

301 – Movido Permanentemente. Muito útil para redirecionar páginas. Serve para redirecionar suas URLs que foram movidas permanentemente. Assim você evita páginas de código 404 ou pode tornar URLs dinâmicas com em URLs limpas.
302 – Movido Temporariamente. Serve também para mover, mas com função temporária. A vantagem é que você pode reverter isto. Funciona bem para manutenções ou alteração não definitiva. O robô de busca continua visitando o endereço original.

4XX Erro do Cliente
Deve ser tratado com atenção pois o conteúdo não estará acessível para o visitante nem para o site de busca. Problema para indexar.

401 – Não autorizado. O acesso a página não esta autorizado pois possivelmente a pessoa não está logada. Isto impede de uma página ser indexada por exemplo.
403 – Proibido. Neste caso o robô de busca também não terá como indexar o conteúdo.
404 – Não encontrado. É o código de retorno pode ser uma página ou arquivo que não existe no servidor, como um arquivo apagado. Pode ser usado para apresentar uma página com conteúdos relacionados à URL procurada.

5XX Erro do Servidor
O servidor não consegui atender o pedido por algum erro. Também não permitirá a indexação da página.

500 – Erro interno do servidor.
503 – Serviço indisponível. Pode ser um erro temporário. Uma manutenção ou uma grande quantidade de acessos pode derrubar o servidor.

Testando cabeçalho HTTP e User-Agent

Agora que você já tem uma idéia do processo de “conversa” no HTTP, aproveite para simular como ele funciona. Um serviço online interessante é o web sniffer. Ele permite que você veja o cabeçalho HTTP e troque o user-agent. Também é possível utilizar plugins para Firefox. Um deles é o Live HTTP Header que permite monitorar o cabeçalho HTTP. Outro plugin interessante é o User Agent Switcher que permite que você altere o User-Agent do Firefox para outros como o Googlebot ou o até o Safari no Iphone. Agora você vai poder aproveitar melhor esta conversa oculta.

Comentários (8)

Black Hat SEO pode ser de culpa externa

Cristina Dissat é uma excelente jornalista e foi minha aluna. Ela está desesperada com seu blog. O Fim de Jogo teve uma queda muito grande de acessos vindo do Google. Ela me questionou o que poderia ser e claramente notei que era o caso de uma punição. Sugeri a ela varrer o site procurando técnicas de Black Hat SEO que provavelmente eram a causa do problema. Ela procurou o site inteiro e nada. Sugeri que verificasse as mensagens dentro do Google Webmaster Tools. Nada também.

SERP do Fim de JogoComo consegui um tempo, resolvi olhar a fundo o que estava acontecendo. O primeiro passo era procurar o site no Google. Nem pelo nome do site ele estava aparecendo. Tentei então usando o comando “site:” e notei algo estranho. Veja a imagem e repare no tamanho das páginas. Algo suspeito em uma página de 250kb. Olhando o código da página reparei que o peso era muito diferente. O Google possivelmente estava vendo algo que nós não conseguíamos ver.

Como visualmente não havia nenhum indício dentro do site de Black Hat SEO, resolvi ver o site com os olhos do Google. Não sei se vocês sabem, mas é possível exibir conteúdo diferente para os visitantes do site e para o Googlebot. Já falei aqui da dica de usar o Cache do Google para ver como “os olhos do Google”. Na versão em cache do site, o rodapé da página apresentava um conteúdo bem diferente do restante do site.

Cache do Fim de Jogo com spam no rodapéAli está o problema. Quem conseguiu invadir o Fim de Jogo, colocou código oculto com vários links para venda de medicamentos dentro do site que só são apresentados quando o visitante se identifica com o user-agent como o Googlebot. A solução é olhar a programação da página e retirar o código.

A cada dia este tipo de ataque será mais comum. Mesmo sendo White Hat SEO é importante conhecer as técnicas Black Hat para se proteger. Por coincidência, escrevi no post anterior sobre o SQL Injection e SEO e você viram que o que o Matt Cutts escreveu também sobre o assunto? Só que eu fui mais rápido Matt. 🙂

Comentários (21)

Caiu de posição? Pode ser uma flutuação no resultados

Estas duas últimas semanas, várias pessoas reportaram que seus sites despencaram nos resultados. Muitos imaginaram terem sido punidos, quando é punição, é só checar no Google Webmaster Tools se tem uma mensagem, corrigir o problema e pedir a reinclusão do site. Porém o que aconteceu é que houve uma flutuação nos resultados. Essa flutuação não é rara, mas acontece. Um motivo pode ser uma mudança no algoritmo, ou seja, o Google mudou a regra do jogo, tirando valor de algum fator ou aumentando outro. Também pode acontecer do resultado de um datacenter ou máquina diferente. Então na mesma consulta, cada hora aparece um resultado diferente.

A dica que eu dou neste caso, é tenha paciência e espere. Muitas das pessoas que entraram em contato já tiveram suas páginas retornando as posições originais. Se você está fazendo White Hat SEO, não há por que se preocupe pois a chance de uma perda de posição é pequena. Se você faz Gray Hat SEO, você pode ter perdido a força daquele “macete”. Pode não ser bom para você, mas é bom para todo mundo, pois os resultados ficam mais naturais. Agora se você está fazendo Black Hat SEO, volte ao primeiro parágrafo e revise sua estratégia.

Comentários (11)

PageRank atualizado ou atualizando?

Tenho recebido muitos e-mails me felicitando por alcançar o PageRank 6. Obrigado a todos que lembraram de mim, mas eu é que tenho que agradecer a todos os leitores. Fico feliz com a notícia, claro, mas tem duas coisas importantes para falar sobre as atualizações do PageRank.

A primeira é que é preciso sempre aguardar um pouco para ter certeza do valor do seu PageRank. Os motivos são vários. Um deles é que o cálculo do PageRank acontece em vários datacenters diferentes. Não sabia? Pois é, o Google não tem uma máquina única que responde a todas as solicitações. Na verdade são centenas de datacenters diferentes. Durante a atualização, o valor do PageRank destas máquinas varia bastante. Normalmente o PageRank aparece como zero ou não atribuido, mas às vezes o valor aparece muito variado, podendo ser menor ou maior que o valor real, já que o cálculo está em andamento.

Um outro detalhe é que mesmo que você confira seu PageRank em diferentes datacenters e perceba que ele está igual em todos, pode ser que a atualização ainda não esteja finalizada, por isto é importante aguardar um pouco para ter a certeza do novo número. Pode até acontecer de um atualização ocorrer quase que seguida de outra.

A segunda coisa é algo que já falei: não se preocupe tanto com o PageRank. Ele é apenas um dos mais de 200 fatores de SEO. Se você produz um bom conteúdo e páginas descritivas e que auxiliem o seu visitante, você já estará fazendo um bom trabalho.

Comentários (24)

Nova turma, novo curso

Esta é a última semana antes da nova turma do curso SEO de São Paulo e do Rio de Janeiro. Ainda dá para se inscrever, só que não deixe para última hora. O hotsite do curso ganhou novidades como área de depoimentos e o conteúdo do curso. Se tiver uma sugestão, aproveite o formulário de contato. O outro motivo do aviso é que será mais um mês corrido, mas a boa notícia é que ele entra com novidades.

Selo Google Advertising ProfessionalEm primeira mão, aviso o lançamento do curso de links patrocinados. Os alunos que fizeram o curso SEO estavam me cobrando há tempo e ele é o complemento natural do curso SEO. Achei bom fazer a certificação do Google antes do curso para ver as novidades na prova. É que desta maneira posso incluir no curso dicas de como se certificar. Em breve o hotsite do curso estará no ar e as inscrições liberadas.

Além disto, para o pessoal que já fez o curso SEO e pediu continuação, parece que teremos uma dupla do barulho aprontando grandes confusões. Aguardem.

Comentários (12)

página anterior · próxima página