• Par Yohan
  • 24 janvier 2017

Mon site est invisible : la face cachée du web

Mon site est invisible : la face cachée du web

Qui n’a pas connu cette grande excitation ressentie lors de la mise en ligne d’un nouveau site web ? L’impatience de le voir se positionner en première page dans les résultats de recherche sur les requêtes les plus complexes et attractives ? Bien que ce désir soit parfaitement justifié, il peut malheureusement arriver qu’un site web n’apparaisse pas dans les résultats de recherche.

Et soudainement, les questions commencent à surgir !

Mon site est disponible depuis quelques jours sur le web, mais ce dernier n’apparaît toujours pas ? Mais que fait Google ? Ses robots sont-ils en grève ? Ne paniquez pas, cela s’en vient ! Votre site est probablement englué dans la face cachée du web !

Le web caché : la face sombre du web

Le web profond, également appelé web invisible, web surfacique ou encore web caché est un espace encore inconnu du web, où se situent de nombreux sites en attente de l’approbation des moteurs de recherche. Sans cette approbation, l’ensemble des données plongées dans ce méandre infini n’apparaîtra jamais au grand jamais dans les résultats de recherche.

À ce jour, le web caché représenterait plus de 96% de la totalité du web, ce qui est impressionnant quand on sait déjà toutes les informations qui sont visibles depuis les résultats de recherche !

Mais comment cela arrive-t-il ?

Lorsqu’un webmaster conçoit un nouveau site internet, ce dernier créait une adresse propre à ce domaine, le rendant immédiatement disponible à toute personne disposant de cette même URL. Cependant, ce site restera totalement inconnu pour les moteurs de recherche et pour les internautes.

Mais pourquoi un site peut-il être disponible et totalement invisible à la fois ?

Robots d’indexation : À la recherche de la face cachée du web

Comme nous le disions plus haut, lorsqu’un site est mis en ligne, ce dernier devient automatiquement trouvable par quiconque connaît son adresse. Mais cette simple mise en ligne ne suffit pas pour sortir le site du côté obscur. Vous ne le trouverez donc pas nécessairement dans les résultats de recherche, et ce, quelle que soit la requête employée.

Pour que votre site puisse sortir de cette zone sombre, de nombreux robots spécialisés dans l’indexation des pages explorent le vaste univers du web invisible à la recherche de nouveaux sites. Afin de découvrir de nouvelles pages, les robots vont suivre tous les liens qu’ils trouvent sur leur passage.

Lorsque ceux-ci ont enfin trouvé une nouvelle plateforme, ils procèdent à l’analyse et stockent toutes les informations qu’ils ont découvertes, cela constitue la phase d’indexation.

Et si l’on indiquait le chemin aux robots, cela ne serait pas plus facile ?

Quand un nouveau domaine apparaît dans cet immense terrain de jeu qu’est le web, il est souvent conseillé au propriétaire de fournir toutes les informations utiles aux robots. Ainsi, ils retrouveront plus facilement le domaine indiqué parmi les innombrables sites répertoriés dans la face profonde d’internet.

Du côté des solutions existantes pour renseigner aux robots la direction à prendre pour trouver votre site dans les profondeurs du web caché, deux choix s’offrent à vous. Mais quels sont-ils ?

Site, où es-tu ? Donnez votre adresse aux robots, ils vous trouveront

Pour ne pas attendre que votre site soit découvert après de nombreuses explorations, la solution la plus directe consiste à communiquer aux robots l’adresse même de votre site en leur proposant de passer y faire un tour !

Tout bon webmaster devrait accomplir cette tâche en premier lieu lorsqu’un nouveau site est créé. Pour cela, Google, Yahoo ou Bing (pour ne citer qu’eux) fournissent des moyens faciles pour annoncer l’existence de votre site :

  • Pour Google, il vous suffit de renseigner l’URL de votre site grâce à l’outil Google Search Console créé par ce moteur.
  • Du côté de Yahoo et Bing, ces derniers ont également leur outil nommé Bing Webmaster Tools qui vous permet également d’indiquer votre site.

Une fois informés, les robots se chargeront de découvrir une contrée encore jamais explorée. Votre site devrait enfin sortir de ce web caché et voir le jour dans les résultats de recherche.

Bien évidemment, il ne suffit pas de fournir ces indications pour que les robots indexent instantanément tout le contenu de votre site. Il faut laisser le temps aux robots de visiter votre site et d’indexer les pages dans leurs bases de données.

Il est donc bien difficile de savoir avec exactitude le temps que Google mettra avant d’indexer votre site. Plusieurs jours ? Plusieurs semaines ? Cela ne dépend pas de vous, donc la patience est de mise pour la phase d’indexation.

Mais cela reste la méthode la plus directe, alors invitez les robots à passer en forçant l’indexation de vos pages avec les outils prévus à cet effet !

Chers robots, je vous indique le chemin

La solution indirecte à un problème d’indexation s’appelle l’acquisition de liens entrants ou «backlinks». Plus un site possède de liens entrants sur son site et plus il y a de chance pour que les robots trouvent votre site.

En effet, si votre adresse se trouve sur un site connu des moteurs de recherche, les robots qui naviguent sur ces pages tomberont par la force des choses sur votre site. Cette découverte entraînera l’analyse de votre site et facilitera son indexation.

Attention toutefois, l’obtention de liens entrants c’est bien, mais des liens de qualité c’est mieux ! Privilégiez les liens de qualité afin de vous faire bien voir par les moteurs de recherche, car sortir du web caché n’est pas une finalité !

Les pages vouées à rester dans la partie cachée du web

Dans cette mystérieuse partie qu’offre le web peuvent se cacher des pages qui   ne devraient jamais voir la lumière des résultats de recherche.

En effet, de nombreuses pages ont de bonnes raisons quant à leur non-indexation.

Les pages dynamiques qui diffèrent d’une visite à l’autre c’est-à-dire celles qui sont créées à la demande par un système de choix ne devraient par exemple pas apparaître dans les résultats de recherche. Les pages à faible contenu devraient également être bannies de la surface du web.

L’utilisation du langage JavaScript (comme Ajax) qui lie les pages entre elles constitue bien souvent un frein à leur indexation. En effet, les robots explorateurs sont des grands aventuriers, mais leur bagage linguistique n’est pas toujours suffisamment complet pour comprendre tout le web.

Des cas comme ceux-ci sont nombreux et il n’est donc pas rare pour un site web de ne pas pouvoir sortir l’entièreté de ses pages du web caché.

Web caché ou web surfacique : on conclut ?

Vous l’aurez compris, la face cachée du web est un vaste monde où se côtoient de nombreuses pages et de nombreux domaines. Il n’est donc pas rare de voir son propre site stagner au milieu de cet océan de données avant de rejoindre la surface. Mettez en place une stratégie de référencement naturel performante pour que votre site atteigne les résultats de recherche et munissez-vous de patience, votre tour viendra !

Pour patienter durant cette période, continuez de travailler sur votre site, ajoutez du nouveau contenu de qualité, trouvez les requêtes qui mettront en valeur ce contenu. Obtenez de nouveaux liens entrants et soyez prêt pour votre grand lancement. Le travail ne fait que commencer !

Si vous avez besoin d’un coup de pouce ou de bons conseils sur le web caché, prenez contact avec notre équipe d’experts !