Veille SEO 2024, semaine 31
Nous sommes la 31ème semaine de l'année…
:)
Bonne lecture, et n'oubliez pas de vous amuser !
Calculer le taux de duplication avec SimHash en Python
Chez Babbar, Pierre Calvet s'est penché sur le problème de la duplication de contenu en interne : à partir d'un ensemble de pages déjà connues (on ne parle pas de trouver des gens qui copient votre contenu), comment détecter celles qui sont dupliquées ?
Pierre se sert de SimHash, un algo bien connu (et bien adapté au contexte), et vous donne un script en Python qu'il a utilisé, encadré d'une réflexion autour de l'utilisation des données crachées par le script.
OpenAI annonce SearchGPT
Et ça ne surprend personne : après avoir scrapé le web en long, en large, et surtout en travers pour entraîner son LLM, OpenAI a annoncé vouloir concurrencer Google frontalement, en ouvrant "SearchGPT", un moteur de recherche basé sur ChatGPT.
Je trouve le concept plutôt bon : vous tapez une requête, et SearchGPT vous renvoie des liens, en vous expliquant pour chacun en quoi il répond à votre question. Ça permet d'avoir de vrais liens cliquables, ET d'utiliser de l'IA pour scanner la SERP avant de choisir sur quel résultat cliquer.
Le prototype est disponible pour 10.000 utilisateurs actuellement, et sera déployé si les résultats correspondent aux attentes.
Pendant ce temps, Microsoft lance Bing Generative Search, qui est une technologie qui utilise ce que Bing connaît du web pour sortir un "exposé" autour de votre requête. Ça ressemble plus à un mix entre Perplexity et AI Overviews.
Bref, tout le monde code la même chose, ce qui en général annonce que ça sera complètement rentré dans les moeurs d'ici quelques courtes années.
Adieu SEOCamp, bienvenue FePSeM !
Ça y est, la transition prend forme : l'association SEOCamp continue sa mutation et devient officiellement FePSeM, la Fédération des Professionnels du Search Marketing.
On ne pourra pas reprocher à l'équipe en place de ne pas se bouger pour que les choses avancent : le nouveau site est plus clair, et des fonctions participatives permettent de mettre en avant les membres de la communauté, ce qui est une très bonne chose.
"La FePSeM est le point de contact privilégié de tous les organismes publics et privés dès qu’il s’agit de Search Marketing en France". Belle ambition, affaire à suivre !
Google renonce à abandonner les cookies tiers
chez Yumens, Marc Durel semble surpris que Google abandonne la suppression des cookies tiers dans Chrome.
À mes yeux, ce n'est pas si surprenant. Après deux décalages d'un an à chaque fois, je parie que Google a peur que le DoJ américain ne lui reproche - encore - d'utiliser sa position dominante dans le monde des navigateurs (quasiment 60% de parts de marché sur les ordinateurs de bureau, loin devant Firefox, deuxième, qui plafonne sous les 20%) pour imposer de nouveaux standards de tracking télémétrique qu'il serait le seul à pouvoir appliquer.
Mais bref, l'article est très intéressant : Marc y avoue qu'il a l'impression qu'on lui coupe l'herbe sous le pied, puisqu'il se préparait à devoir switcher vers des cookies "first-party". Il explique les bénéfices à passer au tracking server-side.
Copie de site : que faire ?
Sur son blog, Christophe Benoît (qui décidemment est un des mes auteurs préférés) nous explique comment réagir en cas de copie de site.
Il existe des solutions techniques (bloquer des ip pour tenir les crawlers à distance, limiter le crawl - à vos risques et périls -, caviarder le contenu en utilisant des caractères exotiques, etc), mais aussi juridiques (de l'avocat au DMCA en passant par l'AFNIC).
Un article à garder dans vos signets et à ressortir la prochaine fois qu'un malin viendra copier votre production.