O Google tem uma grande preocupação em oferecer para seus usuários conteúdos únicos nos resultados de buscas. Ele entende que o usuário não quer ver vários sites com o mesmo conteúdo. Para evitar esse problema, sites com conteúdo duplicados são penalizados e conteúdos únicos são priorizados nos resultados de buscas.
A empresa entende que a diversificação de conteúdo é muito importante para o usuário, porque assim ele pode obter uma mesma informação de várias fontes e cada uma com sua própria versão. E também não faz sentido algum exibir ao usuário mais do mesmo.
Sabendo que o SEO é a principal fonte de tráfego de um site, é imprescindível que você tenha preocupação em evitar conteúdos duplicados. Desse modo, evita que seu site seja prejudicado e consegue obter um melhor posicionamento nos resultados de buscas.
Não é preciso copiar o artigo de outro site para ter conteúdo duplicado, o problema também acontece quando você copia parte dos seus próprios artigos ou exibe o mesmo texto em diversas páginas. Além disto, problemas de configuração também podem gerar conteúdo duplicado, principalmente quando se utiliza um gerenciador de conteúdo próprio.
Causas do conteúdo duplicado
Existem diversos motivos para serem exibidos conteúdos duplicados em seu site. Abaixo você confere os principais motivos que levam um site a ter conteúdo duplicado:
- Conteúdo copiado – Isso ocorre quando o conteúdo é copiado parcialmente ou em sua totalidade de um site da internet. O plágio é algo muito comum, mas em alguns casos a pessoa pode ter autorização do autor para copiar o conteúdo, porém para o Google não importa se o mesmo foi copiado com ou sem autorização do autor.
- Páginas de impressão – Para garantir uma impressão mais eficiente e econômica muitos sites oferecem uma “versão para impressão”, onde parte dos elementos do site são excluídos para evitar a impressão de objetos desnecessários. O problema é quando o mesmo conteúdo é acessado por uma url diferente, tornando assim o conteúdo duplicado. Saiba que é possível utilizar Media Queries do CSS para exibir e ocultar elementos específicos de uma página no modo impressão, mantendo assim a url original da página.
- Widgets – Esse é um problema comum entre os usuários do WordPress, são inseridos textos longos, como uma descrição do autor ou apresentação do site, em um Widget. Como o mesmo conteúdo é exibido em várias páginas o mesmo é duplicado. Por isso, evite textos longos nos Widget que são exibidos em todas as páginas do site.
- Web scraping – Essa técnica permite “gerar” um conteúdo a partir de um artigo retirado da internet. Através de scripts que automatizam o processo de substituição de palavras por termos equivalentes, é possível gerar conteúdos com muita rapidez. Essa não é uma técnica legal no ponto de vista dos buscadores. Mas além disto, muitas vezes esses scripts geram conteúdos com poucas diferenças em relação ao original, tornando assim o conteúdo duplicado.
- Problemas de configuração no servidor – Se você utiliza a tecnologia HTTPS em seu site, precisa configurar o servidor para forçar o uso dela. Desta maneira, quando o usuário acessar o site através do protocolo inseguro (HTTP) deve ser feito um redirecionamento 301 para a versão segura da página (HTTPS).
- Problemas de configuração no site – Esse problema é semelhante ao problema de configuração do servidor. O site precisa funcionar em apenas uma versão, com “www” ou sem “www”, nunca em ambas. Se você optou por ter o site com a url “http://meusite.com.br” então precisa garantir que todos os acessos com a url “http://www.meusite.com.br” serão redirecionados para a versão correta (neste caso, sem “www”).
Como identificar conteúdo duplicado
Busca Google – É possível encontrar conteúdos duplicados fazendo uma busca no Google por um pequeno trecho do conteúdo entre aspas (“). Você pode copiar 6…7 palavras de um artigo e fazer uma busca no Google. Todas as páginas que possuam esse trecho do artigo serão exibidas nos resultados de buscas.
Copyscape – O Copyscape é muito eficiente para encontrar conteúdos duplicados. O trabalho de pegar trechos do conteúdo e fazer buscas na internet é realizado automaticamente por esta excelente ferramenta. Desse modo, você pode fazer uma busca mais completa e encontrar todas as páginas que possuem conteúdos duplicados.
Gravidade do problema
Segundo o Google, quando a empresa detectar que o conteúdo duplicado é exibido com a intenção de manipular a classificação e enganar os usuários o mesmo será penalizado. Além disto, a empresa fala que algumas vezes páginas com conteúdo duplicados serão ignoradas.
No manual do Google sobre conteúdo duplicado são abordados vários casos em que o conteúdo duplicado pode ocorrer sem a intenção deliberada de prejudicar o usuário. Mas ele também fala que pode chegar ao extremo do site ser removido nos casos em que for detectado conteúdo duplicado com a intenção de receber mais tráfego.
Resolvendo o problema do conteúdo duplicado
Apesar de não ser um problema grave quando não ocorre de maneira intencional, é importante tomar algumas medidas para anular as chances de ser prejudicado. Essas medidas simples podem evitar que o site seja prejudicado, mesmo que você não tenha feito com a intenção de manipular a classificação de seu site.
Canonical Tag
Essa tag é inserida no header do site que permite os buscadores identificar que o conteúdo da página pertence a outra url. Esse é o método mais eficiente para evitar conteúdos duplicados, basta adicionar o seguinte código antes do fechamento do header (</head>):
<link rel="canonical" href="www.meusite.com.br/url-original-da-pagina/" />
Se a o site possuir uma segunda versão de uma página, versão de impressão por exemplo, vai ter a mesma url na tag Canonical. Isso fará com que o Google identifique que se trata da mesma página sendo exibida através de uma url diferente.
Caso você utilize um plugin como o SEO By Yoast para WordPress não precisa se preocupar, pois essa tag é inserida automaticamente em todas as páginas pelo plugin, podendo ser configurada individualmente em cada post ou página através da caixa de configurações avançadas do plugin.