
Murrough Foley
Articles récents
INDEX · 04 entries- 2026.04
La qualité du contenu prédit-elle réellement le classement Google ? J'ai analysé 44 000 pages pour le découvrir.
SEO9 min
- 2026.04
J'ai créé un benchmark d'extraction de contenu web de 2 000 pages. Voici ce que j'ai découvert.
SEO13 min
- 2026.04
Les Signaux au Niveau de la Page Qui Comptent : Évaluer la Qualité du Contenu à Grande Échelle
SEO25 min
- 2026.03
rs-trafilatura : Une bibliothèque d'extraction de contenu web en Rust
updatedSEO18 min
SEO Technique
Optimisation du crawl, architecture du site et stratégie d’indexation — les décisions d’infrastructure qui déterminent si vos pages seront trouvées. J’ai passé 15 ans à travailler sur cela pour des sites allant des petites entreprises locales aux plateformes multi-régions avec des millions de pages.
Extraction de Contenu Web
J’ai créé rs-trafilatura car les outils existants échouent sur tout ce qui n’est pas un article de blog. Extraction intelligente selon le type de page avec classification ML, score de confiance et sortie en markdown. Évalué contre 14 extracteurs sur un jeu de données de 2 008 pages.
Analyse et Notation du Contenu Web
Les LLM peuvent-ils évaluer la qualité du contenu comme le fait Google ? J’ai élaboré des grilles d’évaluation basées sur les signaux de la fuite de l’API Google — contentEffort, originalContentScore, page2vecLq — et les ai testées sur 44 000 résultats SERP. Réponse courte : la cohérence thématique prédit le classement, mais l’autorité du domaine est 10 fois plus importante.
Analyse Sémantique et Thématique
Autorité thématique, relations entre entités et analyse des lacunes de contenu. Google évalue la concentration thématique mathématiquement — en utilisant des signaux comme siteRadius et les embeddings au niveau de la page. Comprendre comment votre contenu s’inscrit dans ces structures vous indique où vous avez de la profondeur et où vous êtes trop dispersé.