Case study SEO : indexation d’un site de centaines de pages

En juin j’ai eu envie de transformer un site l’un de mes travaux les plus massifs: mon manuel de droit des obligations. Un mastodonte de 165k mots sur 700 pages, décliné en une série de fiches (50k mots). Le problème de ce projet allait être l’indexation: il allait faire plusieurs centaines de pages.

L’idée globale du site est, à long terme, de proposer des manuels pour les étudiants (qui doivent actuellement sortir 25-40€ par matière pour avoir un manuel, souvent pédagogiquement nul, à jour …). La structure est donc :

  • Lvl 1 : Droit des obligations
    • Lvl 2 : Fiches de droit des obligations
      • Fiche 1
      • Fiche 2
    • Lvl 2 : Manuel de droit des obligations
      • Partie 1
        • Section 1
          • I. (parfois)

Je commente au fil de mon travail de nombreux arrêts, qui vont chacun occuper un article.

J’ai d’abord intégré les fiches, puis, fin juillet, j’ai commencé à faire le manuel. Jusqu’à août, mon menu était « droit des obligations » et, il me semble, « blog ». Pour accélérer l’indexation, j’y ai mis les pages de niveau 3 du manuel de droit des obligations. Il me semble avoir défini le blog comme page d’accueil en même temps.

L’attribut alt de cette image est vide, son nom de fichier est image-1.png.
Menu à partir de courant aout

Voilà un aperçu du bestiau :

L’attribut alt de cette image est vide, son nom de fichier est image-1-1024x511.png.
Capture d’écran de mon site, www.manuels-de-droit.fr

Premier bilan : 04/09/2022

Le site

L’attribut alt de cette image est vide, son nom de fichier est image.png.

Voilà la liste d’URL indexées et crawlées :

J’ai remarqué que s’indexaient surtout les pages articles (55, soit 78%). Pourtant j’avais posté les 78 fiches bien avant et elles n’étaient que 6 (8.5%) à être indexées. Les pages du manuel sont moins nombreuses, mais sont 9 (12.8%) à avoir été indexées.

Mon hypothèse est que les articles en première page de blog sont les premiers à être indexés. Il serait donc logique de travailler petit bout par petit bout: on donne 10 articles à digérer, puis une fois que l’indexation a été mise à jour (ce qui semble mettre à peu près une semaine), on recommence.

Bilan au bout de 2 mois

Je n’ai rien touché depuis début septembre. Au bout de 3 semaines, l’indexation avait déjà rencontré son palier. Le 19 octobre, Google a brutalement identifié une centaine de page de plus à crawler.

L’attribut alt de cette image est vide, son nom de fichier est image.png.

Petite surprise en comparant les pages indexées: 5 pages auparavant indexées sont désindexées !

https://www.manuels-de-droit.fr/droit-des-obligations/manuel/generalites/delit-civil-et-contrat/
https://www.manuels-de-droit.fr/civ-2-14-janvier-2010-n09-12-110/
https://www.manuels-de-droit.fr/cjue-9-fevrier-2006-c-127-04-0byrne-et-sanofi-pasteur/
https://www.manuels-de-droit.fr/droit-des-obligations/fiches/la-capacite-a-contracter-article-1145/
https://www.manuels-de-droit.fr/droit-des-obligations/manuel/responsabilite-delictuelle/accidents-de-la-route/
https://www.manuels-de-droit.fr/author/abaumann/page/10/
https://www.manuels-de-droit.fr/droit-des-obligations/fiches/les-actions-ouvertes-au-creancier/
https://www.manuels-de-droit.fr/droit-des-obligations/fiches/la-condition-suspensive-ou-resolutoire/



Pour celle en italique, je comprends, les autres moins. Le manuel et les fiches (notées en gras) sont parfois très proches, il est possible qu’elles soient vues comme dupliquées. Quand aux deux articles … je ne comprends pas.

Rendez vous dans quelques mois voir comment cela a évolué.

Update octobre 2023

Maintenant, une large partie des pages sont indexées:

C’est passé de 220 pages en juillet à 313 pages aujourd’hui.

On devine une corrélation avec l’augmentation d’impressions et de clics: