Un client m'appelle en janvier. "Guillaume, on a perdu des positions sur nos pages produits." Je regarde la Search Console. Rien de flagrant. Je lance un crawl Screaming Frog. Et là, bingo : plus de deux cents pages renvoyaient un code 200 avec un contenu vide. Des soft 404 plein pot. Le bot de Google passait son temps à crawler des pages fantômes au lieu d'indexer les vrais contenus. Le site se cannibalait lui-même par ses propres erreurs.
C'est là que j'ai réalisé un truc que la plupart des SEO ignorent : la page la plus stratégique de votre site est probablement celle qui n'existe pas.
Le web pourrit, et c'est normal#
Un quart des pages web publiées entre 2013 et 2023 ne sont plus accessibles, selon Pew Research. Sur les pages datant de 2013 spécifiquement, la proportion monte à 38 %. Ahrefs a mesuré que deux tiers des liens pointant vers des sites sur une période de neuf ans sont morts. Ce n'est pas un dysfonctionnement. C'est la mécanique naturelle du web : les contenus naissent, vivent, et disparaissent.
Wikipedia n'est pas épargnée : plus de la moitié de ses pages contiennent au moins un lien mort. Les sites d'information : presque un quart. Les sites gouvernementaux : un cinquième. Brewster Kahle, le fondateur d'Internet Archive, estime la durée de vie moyenne d'une page web à environ cent jours. Cent jours. Votre dernier article de blog vivra statistiquement moins longtemps qu'un hamster.
Le problème, c'est que ces pages mortes ne disparaissent pas dans le vide. Elles laissent des traces : des backlinks qui pointent vers le néant, des signaux de qualité qui s'évaporent, et un crawl budget qui se consume pour rien.
Soft 404 contre vraies 404 : le vrai combat#
Voilà le paradoxe que beaucoup de SEO ne captent pas : une vraie 404 (code HTTP 404 ou 410) n'est pas un problème. John Mueller l'a dit explicitement : les 404 et 410 ne sont pas un signal négatif de qualité. C'est comme ça que le web est censé fonctionner. Google détecte le code, comprend que la page n'existe plus, et passe à autre chose. Signal clair : "ne reviens plus ici."
La différence entre 404 et 410 ? Négligeable en pratique pour le SEO, toujours selon Mueller. La 410 dit "c'est parti définitivement", la 404 dit "c'est pas là". Google traite les deux de la même façon.
Le vrai problème, ce sont les soft 404. Ces pages qui renvoient un code 200 (tout va bien !) mais qui affichent un contenu vide, un message d'erreur, ou une page tellement pauvre que Google la considère comme inexistante. Gary Illyes a confirmé à Search Central Live en 2025 que les soft 404 consomment du crawl budget malgré leur statut 200. Google les crawle, les analyse, les recrawle, réalise qu'il n'y a rien, et recommence. Un trou noir à ressources.
Mon client de janvier ? Deux cents soft 404. Chacune crawlée régulièrement. Pendant ce temps, ses nouvelles fiches produits attendaient des semaines avant d'être indexées. En corrigeant les soft 404 (soit en renvoyant un vrai code 404, soit en redirigeant vers du contenu pertinent), l'indexation de ses nouvelles pages a repris en quelques jours.
Les backlinks fantômes : le trésor caché dans vos 404#
C'est là que ça devient intéressant, et c'est le morceau que beaucoup de consultants SEO laissent sur la table.
Quand un site externe fait un lien vers une de vos pages et que cette page renvoie une 404, le link equity transmis est nul. Zéro. Pas réduit, pas dilué : zéro. C'est documenté par Ahrefs. En revanche, si vous mettez en place une redirection 301 vers une page thématiquement proche, Gary Illyes a confirmé en 2016 que les 301 transmettent la totalité du PageRank. Pas 85 %, pas 90 %. La totalité.
En clair : chaque backlink qui pointe vers une de vos 404, c'est du link equity que vous jetez à la poubelle.
La méthode est simple. Screaming Frog en version gratuite crawle jusqu'à cinq cents URLs, ce qui suffit pour un premier audit. Croisez ça avec un export Ahrefs des broken backlinks. Priorisez les 404 qui reçoivent le plus de liens entrants. Redirigez-les en 301 vers le contenu le plus pertinent thématiquement.
Attention cependant : si la redirection 301 pointe vers un contenu qui n'a rien à voir avec la page originale, Google peut la traiter comme une soft 404 et ignorer la redirection. La pertinence thématique n'est pas optionnelle, c'est la condition pour que le transfert de link equity fonctionne.
Honnêtement, la quantité de backlinks de qualité que certains sites perdent juste par négligence de leurs 404, ça me rend un peu dingue. J'ai vu des sites avec des dizaines de liens entrants de sites à forte autorité, tous pointant vers des pages supprimées depuis des mois. C'est comme avoir un portefeuille d'actions et oublier de les encaisser.
La 404 custom : pas juste un joli écran#
On arrive au volet "page 404 comme levier de trafic", et c'est là que le 1er avril prend tout son sens.
GitHub a longtemps affiché une parodie Star Wars en parallaxe sur sa 404. Pixar y mettait le personnage de Vice-versa qui pleure, mis à jour avec Anxiété à la sortie du deuxième film. C'est mignon. Ça fait sourire. Mais est-ce que ça convertit ?
Quelques marques ont compris que la 404 est une page de destination comme une autre. Tattly (tatouages temporaires) cache un produit exclusif accessible uniquement via sa page 404. Lush a proposé des bombes de bain gratuites via sa 404. MailerLite propose un essai gratuit de quatorze jours. Ce ne sont pas des gadgets : ce sont des filets de rattrapage pour des visiteurs qui, sinon, partent.
Et ils partent vite. Selon une étude d'Insightech, moins d'un quart des visiteurs qui atterrissent sur une 404 tentent une seconde recherche sur le site. Les trois quarts restants ferment l'onglet. Votre 404 par défaut (le message Apache blanc sur fond blanc) est une porte de sortie grande ouverte.
Sur ce point, j'hésite encore sur la meilleure approche entre la 404 "utilitaire" (barre de recherche, liens populaires, suggestions) et la 404 "conversion" (offre, incentive, CTA fort). Ça dépend probablement du type de site. Un e-commerce a tout intérêt à proposer un bon de réduction. Un blog SEO ferait mieux de suggérer ses meilleurs articles. Un SaaS peut tester l'essai gratuit. Le point commun : ne jamais laisser la 404 par défaut du serveur.
La checklist pragmatique#
Plutôt que de vous laisser avec de la théorie, voici ce que je fais systématiquement sur les sites que j'audite.
Premier réflexe : identifier les soft 404. Screaming Frog, onglet "Response Codes", filtre sur les codes 200 dont le contenu est vide ou quasi-vide. Corrigez-les avant toute autre chose. C'est le point qui a le plus d'impact sur le crawl budget.
Deuxième étape : cartographier les backlinks vers vos 404. Ahrefs, rapport "Broken Backlinks" sur votre domaine. Triez par Domain Rating décroissant. Les liens depuis des sites à forte autorité méritent une 301 immédiate vers votre contenu le plus pertinent.
Troisième étape : concevoir une 404 custom qui travaille pour vous. Au minimum : barre de recherche, trois à cinq liens vers vos contenus phares, ton cohérent avec votre marque. Au mieux : un CTA de conversion adapté à votre business model. Dans tous les cas, vérifiez qu'elle renvoie bien un code HTTP 404 (pas un 200 !).
Quatrième étape : surveiller. Les 404 ne sont pas un problème qu'on règle une fois. Les pages disparaissent, les URLs changent, les migrations cassent des trucs. Un crawl mensuel suffit pour rester propre. Si vous gérez un site de plus de dix mille pages, c'est hebdomadaire.
Le paradoxe du 1er avril#
La page la plus utile de votre site est celle qui n'existe pas. Ça ressemble à une blague. Ça n'en est pas une.
Un quart du web est en train de disparaître. Deux tiers des liens pourrissent. Et pendant que tout le monde optimise ses titles, ses H1 et ses Core Web Vitals, une armée silencieuse de 404 mal gérées siphonne du crawl budget, pulvérise du link equity et fait fuir des visiteurs qui ne reviendront pas.
La bonne nouvelle : c'est un des rares problèmes SEO où le correctif est simple, mesurable et rapide. Pas besoin d'attendre la prochaine core update. Pas besoin d'écrire cinquante articles. Juste un crawl, quelques 301, et une page 404 qui fait son boulot.
Bonne chasse aux fantômes.
Sources#
- Pew Research, "When Online Content Disappears" (pewresearch.org/data-labs/2024/05/17/when-online-content-disappears/)
- Search Engine Journal, "38% of Webpages From 2013 Have Vanished" (searchenginejournal.com/38-of-webpages-from-2013-have-vanished-pew-study-finds/516834/)
- Ahrefs, "Link Rot Study" (ahrefs.com/blog/link-rot-study/)
- Google Search Central, "Managing Crawl Budget" (developers.google.com/search/docs/crawling-indexing/large-site-managing-crawl-budget)
- Search Engine Journal, "Google Soft 404s Use Crawl Budget Despite 200 OK Status" (searchenginejournal.com/google-soft-404s-use-crawl-budget-despite-200-ok-status/552301/)
- Search Engine Journal, "Google's John Mueller Clarifies 404/410 Confusion" (searchenginejournal.com/googles-john-mueller-clarifies-404-410-confusion-for-seo/513576/)
- Search Engine Land, "No PageRank Dilution Using 301/302 Redirects" (searchengineland.com/google-no-pagerank-dilution-using-301-302-30x-redirects-anymore-254608)
- Ahrefs Academy, "Broken Backlinks" (ahrefs.com/academy/how-to-use-ahrefs/site-explorer/broken-backlinks)
- Library of Congress, "The Average Lifespan of a Webpage" (blogs.loc.gov/thesignal/2011/11/the-average-lifespan-of-a-webpage/)
- Insightech, "How 404 Errors Affect Website Conversion Rates" (insightech.com/how-404-errors-affect-website-conversion-rates-managing-digital-experience-friction/)
- Quick Growth Ideas, "404 Error Pages That Convert" (quickgrowthideas.com/p/404-error-pages-that-convert-examples)
- Search Engine Land, "404 Pages Best Practices & Examples" (searchengineland.com/404-pages-best-practices-examples-436618)
- Stellar SEO, "Do 301 Redirects Impact Link Equity?" (stellarseo.com/do-301-redirects-impact-link-equity/)





