Documentos internos do Google Search’s Content Warehouse API vazaram, revelando segredos do Algoritmo do Google. Esses documentos destacam detalhes fundamentais sobre como o Google classifica sites, contradizendo algumas de suas declarações públicas. Descubra como a autoridade de site, cliques de usuários, e a qualidade dos links afetam seu ranking nos resultados de busca.
Documentos Internos Vazados que revelam os Segredos do Algoritmo do Google
Esses documentos detalham o armazenamento de dados para conteúdo, links e interações com usuários. Pontos-chave incluem:
- Módulos e Atributos: A documentação descreve 2.596 módulos com 14.014 atributos relacionados a diversos serviços do Google, como YouTube e Google Assistente.
- Autoridade do Site: Um recurso chamado ‘siteAuthority’ foi revelado, desmentindo as declarações públicas do Google que afirmavam não existir tal métrica.
- Cliques para Rankings: Sistemas como o NavBoost utilizam dados de cliques para influenciar os rankings, novamente contradizendo as declarações públicas do Google.
- Sandbox: Um atributo chamado ‘hostAge’ foi descoberto, usado para sandboxar novos sites.
Sistema de Ranking e Funcionalidades
A documentação interna do Google revelou que o sistema de ranking é composto por uma série de microserviços, em vez de um único algoritmo. Principais sistemas como Trawler (responsável pela coleta de dados), Alexandria (indexação), Mustang (classificação) e SuperRoot (processamento de consultas) desempenham papéis exclusivos no mecanismo de busca. Cada um desses componentes opera de maneira interligada, garantindo que a gigante das buscas possa processar vastas quantidades de dados de maneira eficaz e precisa.
Os chamados Twiddlers são funções de reclassificação que ajustam os resultados da busca antes de serem apresentados aos usuários. Exemplos de Twiddlers incluem NavBoost, QualityBoost e RealTimeBoost. Essas funções desempenham um papel crucial na otimização dos resultados de busca, permitindo ajustes em tempo real e melhorias na diversidade dos resultados apresentados.
Além disso, a documentação detalha 2.596 módulos com 14.014 atributos relacionados a diversos serviços do Google, como YouTube, Assistente e documentos da web. Estes módulos fazem parte de um repositório monolítico, onde todo o código é armazenado em um único local e está acessível por qualquer máquina na rede, permitindo uma integração e acesso simplificados.
Autoridade do Site e Cliques
A recente revelação dos documentos internos do Google expôs segredos importantes sobre como o gigante das buscas avalia a autoridade do site e o impacto dos cliques na classificação. Apesar das alegações públicas do Google de não usar um sistema de ‘autoridade de domínio‘, os documentos vazados indicam claramente a existência de um recurso chamado ‘siteAuthority’.
Esse recurso é parte dos sinais de qualidade comprimida armazenados por documento, demonstrando que o Google, de fato, mede a autoridade do site em uma escala ampla.
Além disso, o sistema NavBoost foi mencionado várias vezes nos documentos vazados. Este sistema utiliza dados de cliques para reforçar, promover ou até mesmo rebaixar certos resultados de busca. Analisando métricas como cliques longos e curtos e o engajamento do usuário, o Google consegue avaliar a qualidade geral de um site.
Por exemplo, se muitos usuários buscarem por ‘Rand Fishkin’, não encontrarem o SparkToro e depois alterarem sua busca para ‘SparkToro’ e clicarem no SparkToro.com, o site receberá um impulso nos resultados de busca para a palavra-chave ‘Rand Fishkin’.
Essa abordagem refuta diretamente as declarações públicas do Google de que os cliques não influenciam os rankings de pesquisa. Os documentos deixaram claro que a análise dos cliques dos usuários é uma parte integral dos algoritmos de classificação do Google.
Arquitetura dos Algoritmos do Google
Os algoritmos do Google não são baseados em um único algoritmo, mas em uma série de microserviços. Entre os principais sistemas envolvidos estão: Trawler para rastreamento, Alexandria para indexação, Mustang para classificação e SuperRoot para processamento de consultas. Estes sistemas trabalham em conjunto para fornecer os resultados de busca mais relevantes aos usuários.
Os Twiddlers são funções de reclassificação que ajustam os resultados de busca antes de serem apresentados aos usuários. Exemplos de Twiddlers incluem o NavBoost, QualityBoost e RealTimeBoost. Eles desempenham papéis cruciais na otimização dos resultados finais de busca, promovendo a diversidade e realizando experimentos ao vivo.
Os documentos vazados também apontam que Google utiliza dados do Chrome, apesar das negações públicas. Esses dados atuam nos algoritmos de ranqueamento para medir a originalidade do conteúdo e a interação dos usuários. Assim, colocar conteúdo relevante e original nos primeiros parágrafos de uma página é essencial para um bom ranqueamento.
A arquitetura altamente modular e interconectada dos algoritmos do Google garante a eficiência e a eficácia do sistema de busca, permitindo que diferentes componentes acessem e processem dados de forma colaborativa.
Impacto do NavBoost na Classificação
O NavBoost é um sistema de ranqueamento que utiliza dados de cliques para promover ou rebaixar páginas nos resultados de pesquisa do Google. De acordo com os documentos vazados, o NavBoost existe desde 2005 e trabalha com uma janela de 13 meses de dados de cliques. Esse sistema analisa o comportamento dos usuários ao clicar em resultados de pesquisa, incluindo a quantidade de cliques, a duração desses cliques (se são longos ou curtos) e o engajamento do usuário.
Os documentos mencionam o NavBoost 84 vezes, ressaltando sua importância como um dos sinais de ranqueamento mais robustos do Google. Por exemplo, se muitos usuários buscam por ‘Rand Fishkin’, não encontram o site SparkToro e depois ajustam a consulta para ‘SparkToro’ e clicam no SparkToro.com, o site receberá um impulso nos resultados de pesquisa para a palavra-chave ‘Rand Fishkin’.
Além disso, o NavBoost ajuda o Google a identificar tendências de busca e a avaliar a qualidade geral de um site. Isso indica que os dados de cliques são fundamentais não só para determinar o posicionamento das páginas, mas também para categorizar links em índices de baixa, média e alta qualidade, com base no engajamento do usuário.
Importância dos Links e Conteúdo
A recente revelação dos documentos internos do Google deixa claro a importância vital dos links e do conteúdo para a classificação nos resultados de busca. O Google mede a originalidade do conteúdo curto e conta tokens, reforçando que o posicionamento de conteúdo chave logo no início é crucial. Links permanecem essenciais, com métricas como ‘sourceType’ indicando o valor dos links baseados no local onde a página foi indexada.
O vazamento ainda confirma que o algoritmo Panda aplica modificadores de pontuação baseados no comportamento do usuário e links externos. Isso é aplicado em vários níveis, como domínio, subdomínio e subdiretório. Autores também têm um papel importante, com informações explícitas sendo armazenadas pelo Google, indicando a relevância da autoria nos rankings.
Em termos de deméritos, o Google aplica várias penalizações, incluindo para discrepâncias de âncora, insatisfação com a SERP e domínios de correspondência exata. O uso do Google Chrome também revela dados que integram os algoritmos de classificação.
Estratégias de SEO devem focar na criação de conteúdo de alta qualidade e na promoção eficaz, ao mesmo tempo que experimentam e testam novas abordagens. O vazamento confirma muitas crenças antigas de SEO e fornece uma visão mais clara dos mecanismos de classificação do Google, enfatizando a importância da qualidade do conteúdo, do engajamento dos usuários e da construção estratégica de links.
Implicações para SEO
Os vazamentos recentes revelaram várias implicações significativas para o SEO, baseadas nas novas informações sobre os algoritmos de classificação do Google.
Autoridade de Site: A funcionalidade de “siteAuthority” contraria as declarações públicas do Google, sugerindo a medição da autoridade do site em uma base global. Essa métrica pode impactar a forma como sites são ranqueados.
Clique para Classificação: Sistemas como NavBoost utilizam dados de clique para influenciar as classificações, provando que o comportamento do usuário tem um peso significativo na determinação da posição dos sites nos resultados da pesquisa.
Panda Algorithm:
Panda utiliza um modificador de pontuação baseado no comportamento do usuário e links externos, aplicando-se em diferentes níveis como domínio, subdomínio e subdiretório. Isso sugere que otimizar a experiência do usuário e adquirir links externos de qualidade pode beneficiar diretamente as classificações.
Informação dos Autores: O Google armazena explicitamente informações sobre os autores, destacando a importância da autoria nas classificações. Isso implica que a construção de uma autoridade de autor pode ser uma estratégia vantajosa para SEO.
Demotions: Vários fatores de rebaixamento são aplicados, incluindo a discrepância de âncora, insatisfação com os SERPs e domínios de correspondência exata.
Links: Continuam sendo um fator crucial para o SEO, com métricas como sourceType indicando o valor dos links baseado no local onde uma página é indexada.
Conteúdo: O Google mede a originalidade do conteúdo curto e contabiliza os tokens, reforçando a importância de posicionar o conteúdo chave logo no início dos textos para otimização das classificações.
Os vazamentos validam muitas crenças do SEO e fornecem uma imagem mais clara dos mecanismos de classificação do Google, enfatizando a importância do conteúdo de qualidade, engajamento do usuário e construção estratégica de links.