Page d'accueil » Codage » Contrôle de la manière dont Google indexe votre contenu avec des balises méta

    Contrôle de la manière dont Google indexe votre contenu avec des balises méta

    Il existe de nombreux moteurs de recherche, mais la plupart du temps, les propriétaires de site se soucient de faire indexer leur site sur le tout-puissant Google. Une façon de mieux performer sur le moteur de recherche est de: utiliser les balises meta robot.

    le méta balise robot est une balise méta consensus parmi les moteurs de recherche tels que Google, Yahoo et Bing. L'utilisation de la balise meta permet aux développeurs Web de contrôler l'accessibilité des pages Web, par rapport aux robots d'exploration des moteurs de recherche. Par exemple, quelque chose comme noindex empêchera tous les robots des moteurs de recherche de mettre votre page Web dans leur index.

    Le propre robot de Google s'appelle Googlebot. Dans cet article, nous verrons comment nous adressons Googlebot exclusivement via balises META.

    S'adresser à Googlebot

    Pour adresser Googlebot, spécifiez la méta prénom comme googlebot au lieu de juste des robots. Cet exemple empêchera Googlebot de placer votre page Web dans son index, tout en permettant aux robots de Bing et de Yahoo d’explorer la page. Ainsi, vos pages Web peuvent toujours apparaître dans les résultats de recherche Bing et Yahoo.

      

    Google dispose d'un certain nombre de robots spéciaux qui explorent différents types de contenu tels que Image, Actualités, Vidéo, Annonces et Mobile. Google vous permet de bloquer ces robots individuellement. Si vous ne souhaitez pas que votre site Web apparaisse dans les résultats de recherche Google Mobile, par exemple, vous pouvez spécifier la balise meta robot de la manière suivante:

      

    La liste complète des types de bot Google peut être trouvée dans la page des Google Crawlers..

    Empêcher l'indexation d'images

    C'est très irritant de constater que votre image protégée par le droit d'auteur est utilisée par quelqu'un d'autre sans votre autorisation préalable. Si vous souhaitez éviter que cela ne se produise, vous pouvez empêcher Google de mettre vos images dans leur index..

    Spécifiez la balise meta robot avec la valeur de noimageindex. Cela empêchera le robot d'indexer toutes les images de la page et vos images n'apparaîtront pas dans les résultats de la recherche d'images Google, où les utilisateurs recherchent généralement des images..

      

    Alternativement, vous pouvez définir le nom de méta comme googlebot-image empêcher spécifiquement les robots de Google d'explorer votre site à la recherche d'images.

      

    Empêcher la traduction

    Google Chrome propose la traduction d'un site en langue étrangère dans la langue préférée ou dans la langue locale du visiteur, à l'aide de Google Translate. Bien que la traduction de Google Traduction s'améliore, elle est loin d'être parfaite pour certaines langues. La traduction peut parfois être vraiment originale.

    Si vous ne souhaitez pas que Google traduise vos pages Web, définissez la méta de googlebot sur la valeur suivante: ne pas traduire, ainsi.

      

    Si vous souhaitez empêcher la traduction d’une certaine section de la page, vous pouvez ajouter le ne pas traduire classe dans l'élément enveloppant le contenu:

     

    Google va ignorer cela

    complètement.

    Empêcher l'indexation après une heure spécifiée

    Vous pouvez également empêcher Google d’indexer vos pages Web après un certain temps. Cela sera particulièrement utile pour les pages Web qui ne sont pertinentes que dans une période donnée, telle qu'une page d'inscription à un événement, par exemple..

    Dans ce cas, vous voudrez probablement demander au robot de ne pas explorer et indexer cette page à la fin de l'événement, ce qui l'empêchera de s'afficher dans les résultats de recherche de Google..

    Pour ce faire, spécifiez la balise meta avec la valeur de indisponible_après puis suivi par les informations de temps. Le format de l'heure doit être conforme au format RFC-850, par exemple: jeudi, 26-sept.-14 10:00:00 UTC

      

    En donnant l'exemple ci-dessus, le robot Google n'explorera pas la page après le 29 sept. 14. La page finira par disparaître de l'index, mais vous pouvez toujours conserver la page pour l'archivage sur votre site Web..