Canonical URL – nova tag para conteúdos duplicados

Na passada quinta-feira, Google, Yahoo e Microsoft anunciaram conjuntamente a tag Canonical. Esta nova tag destina-se a prevenir a indexação de conteúdos duplicados pelos motores de busca, normalmente criadas automaticamente pelos CMSs.

Imaginemos um site com um gestor de conteúdos que cria automaticamente, para cada artigo, as seguintes paginas:

- uma página para o artigo com um layout normal do site;
- uma página para impressão essencialmente com os conteúdos do artigo;
- uma página para divulgação, como a que cria o plugin partilhar.

Estas páginas podem ser geradas por um blog wordpress, mas normalmente os problemas de conteúdos duplicados ocorrem noutros sistemas mais complexos, como em lojas de e-commerce. Atente-se no exemplo do anúncio no Google Webmaster blog:

product.php?item=swedish-fish
product.php?item=swedish-fish&category=gummy-candy
product.php?item=swedish-fish&trackingid=1234&sessionid=5678

Estas três páginas reproduzem essencialmente o mesmo conteúdo, pelo menos no que aos motores de busca diz respeito. A nova tag canonical indica aos motores e busca a) qual delas devem indexar e b) a qual devem creditar os links externos.

O uso da tag dará uma pista aos motores de busca sobre qual a página que vem indexar e creditar. Todavia, para que tal aconteça os conteúdos devem ser iguais ou muito similares, a versão canónica tem a url mais curta e os parâmetros da url são de uso generalizado (como &, ? e %).
Isto exclui, por exemplo, as páginas de comentários geradas opcionalmente pelas novas versões do wordpress.

Uso da Tag Canonical

A Tag deve ser indicada no cabeçalho do artigo, apontando para a página canónica do artigo. A forma será a seguinte:

< link rel="canonical" href="http://www.marketingdebusca.com/artigo/canonical-url-tag/" >

Os motores de busca indicam que usarão a tag como uma sugestão forte. Havendo outros sinais apontando em sentido diferente poderão optar por indexar outra ou mais do que uma versão do mesmo conteúdo. Poderão encontrar mais informação sobre esta nova tag no SEL.

Ps: Para os que se sobressaltaram com a referência ao plugin partilhar: o link criado no site é nofollow e a página de divulgação noindex.
A tag Canonical permite somente creditar o artigo original por algum eventual (e extremamente raro) link externo para a página com url &akst_action=share-this.

Um monopólio, o Google?

Esteve por um triz. Três horas, para ser preciso. As autoridades americanas deram, há um mês, uma data limite para o Google abandonar o acordo que lhe permitiria vender publicidade no Yahoo.

Se o Google pretendesse levar o acordo avante o departamento de justiça avançaria com uma acção antitrust ao Google, segundo declarações recentes de um dos advogados envolvidos no processo.

Três horas antes da hora limite o Google decidiu abandonar o acordo numa atitude sensata para evitar danos para a sua imagem. O acordo dar-lhe-ia controlo sobre a publicidade em quase 80% das buscas realizadas nos EUA, que ainda assim é inferior à quota do Google em Portugal.

Como Procurar na internet

Há dias, John Battelle falava da necessidade da “literacia de busca”. Muitos dos que utilizam a internet não fazem a mínima ideia de como procurar na internet e nem por sombras ouviram falar nos operadores colocados à disposição pelos motores de busca.

Este vídeo que um leitor me enviou, vem mesmo a calhar: explica, de uma forma simples e concisa como procurar nos motores de busca.
Um excelente recurso para enviar aos membros da família com mais dificuldades em apreender as novas tecnologias.

You need to a flashplayer enabled browser to view this YouTube video

Para o leitor, que já sabe como utilizar os motores de busca fica a promessa de uma entrada, para breve, sobre operadores avançados de busca. (Uma das primeiras entradas que aqui publiquei, “como procurar pelo seu nome” desapareceu, estranhamente, blog. Se estiver impaciente,a entrada faz parte do Ebook.)

Nota: Mullet (citado no vídeo) tanto pode ser um salmonete como um penteado.

Spammers “marcados” nos resultados de busca do Yahoo

Há já algum tempo que os motores de busca alertam os utilizadores para possíveis consequências de clicar nos resultados, por exemplo, se o site é perigoso.

O Yahoo foi um pouco mais longe e está agora a alertar os utilizadores para uma outra prática deceptica: a recolha de emails de utilizadores para abuso ou revenda. VPor exemplo, nesta busca:

aviso de envio de email no yahoo

E seguindo o link encarnado, é fornecida a explicação do siteadvisor:
After entering our e-mail address on this site, we received 2.4 e-mails per week. They were very spammy.”

Como diz o Patrick, isto poderá reduzir o tráfico orgânico do Yahoo para o site a 10% do que seria de esperar.
Quem recolhe e vende emails nos seus sites que se ponha a pau; será só uma questão de tempo até o Google seguir o exemplo do Yahoo.

SEO PT: Um agregador sobre motores de busca


seo pt

O SEO PT – Search em Português é um novo agregador que permite seguir os blogues e media que publicam em português sobre motores de busca. O agregador mede o pulso à blogosfera através de feeds do Google blog Search associados a 5 temas: seo, marketing nos motores de busca, publicidade contextual, motores de busca e Google.

A inspiração surgiu ao ver o que o Hugo fez para as eleições internas do PSD com o mesmo script e os feeds do blog serch.

Por sugestão do Paulo, incluí uma timeline da dipity que apresenta um feed de resultados de forma visualmente apelativa. Sugiro que experimentem as visualizações List View e o Flipbook (na imagem).

O SEO-PT oferece ainda um motor de pesquisa próprio focado no tema dos motores de busca, e que mais não é do que uma aplicação do Google CSE. O valor deste mecanismo reside na selecção de fontes incluídas, o que permite resultados de superior qualidade para buscas em língua portuguesa sobre temas e assuntos associados a motores de busca e à optimização.
Contei ainda com a colaboração de alguns dos autores que, voluntariamente, me indicaram parcelas e paths dos seus sites para exclusão dos resultados, de forma a reduzir o ruído e melhorar os resultados de busca.

Termino convidando os leitores a visitar o SEO-PT e a partilhar as suas experiências e opiniões nos comentários a esta entrada.

Ainda se lembram do Quaero?

A comScore acaba de publicar o seu último estudo sobre o mercado de busca na Europa. Os resultados não deixam margens para dúvidas: quase 80% (ver quadro abaixo) das buscas dos europeus são efectuadas no Google (em Portugal o Google terá 94%) . Pior, o segundo site mais utilizado para procurar é um site de leilões com 3% das buscas.

E o Quaero, por onde anda o motor de busca europeu? Chama-se Exalead e da última vez que deu sinal de si liderava a corrida dos motores de busca alternativos.

Top 10 Motores de busca na Europa

Março 2008

Audiência europeia maior de 15 – Casa & Trabalho

Fonte: comScore qSearch

Site

Buscas (MM)

Percentagem de buscas

Total Internet

24,550

100

Google Sites

19,434

79.2

eBay

752

3.1

Yandex

528

2.2

Yahoo! Sites

486

2.0

Microsoft Sites

469

1.9

NASZA-KLASA.PL

320

1.3

QXL Ricardo

298

1.2

AOL LLC

224

0.9

Ask Network

201

0.8

Rambler Media

125

0.5

Apesar do peso dos números a esperança dos que prefeririam um mercado mais diverso vem do leste: o Yandex é líder na Rússia e este é um dos mercados de maior crescimento.

Uma nota curiosa: os portugueses são os segundos que mais buscas fazem na Europa, com 128 buscas por navegante – para uma média europeia de 111. Somos inquisitivos ou racionamos os computadores?

Perspectivas sobre o Algoritmo do Google

O algoritmo do Google permanece, ao fim deste tempo todo, uma entidade misteriosa e desconhecida para a maioria de nós, comuns mortais. Vasculhando pela internet podem-se encontrar as mais diversas interpretações e descrições do algoritmo.

Um matemático poderia descrever o algoritmo da seguinte forma:

algoritmo do Google

“E é assim, de uma forma simples, que poderá subir nos rankings dos motores de busca”

Já para um SEO/Search marketer o algoritmo é bastante mais simples:

o algoritmo de um SEO
“Este algoritmo do Google funciona sempre para mim…” ;)

Créditos: SEJ

Partilhar

Em Portugal, Motor de Busca = Google

O mais recente relatório da comScore “o estado da Internet” apresenta este interessante gráfico sobre a presença do Google em diferentes mercados geográficos:

quota de mercado do Google em Portugal

Portugal em primeiro na Europa e no mercado global: o Google detém, 94% do mercado de busca nacional. A fazer fé neste relatório, qual será a verdadeira percentagem das buscas servidas pelo algoritmo do Google tendo em atenção que boa parte das busca nos portais nacionais (Sapo, AEIOU, Clix) são sindicadas ao Google? Perto dos 100%?

Seria interessante analisar a informação e metodologia do relatório se este não custasse 5000$. A metodologia da ComScore já várias vezes foi questionada e também por cá a amostragem por painéis da marktest apresentou resultados muito pouco satisfatórios.

Por outro lado, recordo-me de um estudo recente que dava uma quota de mercado de 17% para o yahoo em Espanha (sem link mas creio que a informação tenha menos de 6 meses), o que reforça as minhas dúvidas.

Seja como for, não restam muitas dúvidas de que o Google é “o” motor de busca em Portugal.

(via Ramblings…)

Ask atira a toalha

A Ask anunciou ontem o seu fim enquanto motor de busca com tecnologia própria. Na realidade, o que a Ask comunicou foi que se estava a reinventar como “motor de busca para mulheres” mas toda a gente percebe o que isso significa e que num futuro não muito distante os seus resultados serão servidos pelo Google. A abdicação da Ask deste lucrativo mercado dá uma ideia dos recursos necessários para entrar e permanecer na corrida com o Google.
Sem a Ask, e com a eventual compra da Yahoo pela Microsoft mercado global fica reduzido a um duopólio Google/MS, o que não augura nada de bom para o mercado nem para os webmasters.

Sitemaps para os motores de busca

sitemap Um Sitemap é normalmente um ficheiro XML localizado na raiz de um domínio que sugere informação sobre as páginas de um site aos bots dos motores de busca (ex: www.marketingdebusca.com/sitemap.xml). O protocolo sitemaps é reconhecido pelos principais motores de busca: google, yahoo e live / msn.

Os robots dos motores de busca visitam as páginas do site com base na informação que vão encontrando na web, nomeadamente links. O sitemap suplementa essa informação com algumas sugestões para os motores de busca: localização das urls, data da última actualização, importância relativa da url. A inclusão de uma página no sitemap não é garantia da indexação, antes uma dica aos motores de busca. Mais informação em sitemaps.org.

Recentemente, o protocolo foi alterado de forma a facilitar a indexação e a tarefa de gestão dos sitemaps. O sitemap pode agora estar localizado num domínio externo. Desta forma o webmaster poderá manter e gerir os diferentes sitemaps dos seus sites no mesmo directório, desde que validados no respectivo ficheiro robots.txt.

Exemplo: criar o sitemap do site2.pt em site1.pt. Para validar um sitemap localizado externamente basta declarar no ficheiro robots.txt do site2.pt a seguinte informação:
Sitemap: http://www.site1.pt/sitemap-site2-pt.xml

Sem esta declaração os bots não saberiam se se trataria do sitemap autêntico do site2.pt ou de alguma falsificação. Notar ainda que:

Existem três opções para informar o motor de busca da existência de um sitemap: submetendo-o directamente junto de cada motor de busca, a declaração no robots.txt ou através de um HTTP request. Informação aqui. O primeiro e o terceiro são métodos válidos para submeter novos sites aos motores de busca.

Existem ferramentas que criam e actualizam sitemaps automaticamente no formato XML; como não podia deixar de ser algumas dessas são plugins para wordpress. O sitemap do Marketing de Busca foi criado com o plugin Google Sitemap Generator Plugin e pode ser visto aqui.

Next Page →