Google actualites : etre visible et reussir son referencement !
7 commentaires
Google actualités est un service proposé par Google qui permet d’agréger de façon automatisée des articles de presse et d’actualité provenant d’une multitude de sources d’information sur le Web. Google actualités est lancé dans un premier temps en Avril 2002, dans plus de 20 pays.
Ce n’est en qu’en 2009 que la partie française est lancée dans sa version beta. Quelques chiffres pour illustrer ce qu’est actuellement Google Actualités à travers le monde :
- 1 milliard d’utilisateurs chaque semaine
- 55 000 sources indexées
- 6 milliards de clics vers les différentes sources d’information
Ce service est donc un agrégateur de contenu d’actualité sélectionnée en préalable selon plusieurs critères de pertinence et de notoriété, que nous développerons par la suite. Le moteur de recherche Google actualités à son propre algorithme lui permettant de classer des centaines de milliers d’actualités selon plusieurs thématiques :
- International
- Régional
- Economie
- Science / High-Tech
- Culture
- Sport
- Santé
Comment fonctionne réellement Google News ? Comment optimiser son référencement Google ? Quelles sont les subtilités et les méthodes à adopter pour apparaître dans Google actualités ?
Qu’est-ce que Google Actualités ?
Le moteur de recherche Google actualités est similaire au moteur classique de Google. Il explore via la google bot, il indexe les articles de presse éligibles et il classe ensuite selon un certain nombre de critères définis. En premier lieu, le contenu doit être exclusivement dédié à l’actualité. Le site doit donc comporter une partie consacrée à l’actualité. Pour Google actualités les consignes liées à la qualité sont également primordiales sous peine de sanction manuelle ou algorithmique et voir d’un retrait définitif du site concerné de son index. Petit rappel sur les consignes générales :
- Éviter toute technique pour tromper l’internaute d’une quelconque façon ; automatisation de contenu, cloacking, texte ou liens cachés et contenu détourné.
- Éviter toute technique pour booster votre référencement Google News ; liens artificiels, redirections trompeuses, pages satellites ou keyword stuffing.
- Votre site web ainsi que votre contenu doivent être destinés en priorité aux internautes et non aux moteurs de recherche, bannissez donc toute technique trompeuse du type contenu caché ou autre manipulation visant à tromper le visiteur.
La collecte et la diffusion d’information via Google actualités
Afin de proposer un contenu original et de qualité, le moteur Google actualités a mis en place un système de collecte et de diffusion d’information bien rodée.
La collecte d’information
Afin de pouvoir être visible il faut d’abord proposer sa candidature à Google news via un formulaire si vous estimez que votre site remplit bien l’ensemble des consignes cité ci-dessus. Remplir ce formulaire est une condition, il est soumis à une validation de la part des équipes de Google actualités. En cas de refus vous recevrez une réponse par mail, vous aurez ensuite 60 jours afin de faire une nouvelle demande en ayant corrigé les différents points négatifs.
Attention, les équipes de Google précisent bien qu’elles ne peuvent pas commenter chaque formulaire dans le détail ou de façon personnalisée. Il vous faudra donc déceler vous-mêmes les différents points négatifs de votre demande.
Sur l’ensemble des sources qui ont été éligibles au formulaire préalablement rempli, Google actualités utilise donc cet “index” de site afin de sélectionner les articles pertinents grâce au crawl de son Google bot. Chaque source présente dans l’ “index” Google news est donc visité / scruté plusieurs fois par jour par le robot Google. Suite à cela Google indexe l’article et utilise son algorithme afin de déterminer la thématique à associer.
La diffusion d’information
Une fois que Google a capté l’information et que celle-ci correspond à une actualité récente, il va donc la diffuser. Google actualités recense plus de 500 sources d’informations différentes, une priorité doit donc être émise afin d’avoir une classification claire et qualitative des actualités. Pour cela Google trie selon :
- Le degré de pertinence de l’actualité
- La notoriété de la source; un article provenant du monde aura plus de chances de remonter sur de l’actualité chaude qu’un quotidien régional par exemple
- Le degré de réactivité à l’actualité chaude (heure et date de mise en ligne)
- Comparaison du flow d’information selon les différents articles du même sujet
En fonction de ces différents critères, le moteur Google actualités va plus ou moins bien classée les différents articles sur son moteur de recherche.
Quel est la classification des sites éligibles à Google actualités ?
Afin d’aider les robots à classifier votre site et vos articles, il est possible d’insérer des libellés qui correspondent à des termes communs permettant de définir les différents types de catégories d’actualités :
Rubrique
Ce libellé permet au Google bot de classer les actualités associées à une URL de rubrique par sujet. Par exemple:
- Si vous utilisez le libellé “Sport” à votre URL : http://exemple.fr/sport le Google bot comprend cette rubrique et pourra classer l’actualité en conséquence
Source
Ce libellé permet de décrire le contenu de votre site et d’ainsi améliorer la visibilité et la classification de ce contenu.
- Si vous utilisez le libellé “blog” au site http://exampleblog.com/ sa classification en sera facilitée.
Quels sont les différents sites / sources éligibles ? En voici une liste exhaustive :
- Communiqué de presse
- Contenu d’opinion
- Blog
- Satire
- Etc
Les consignes générales d’éligibilité de Google actualités
Pour être présent sur Google actualités il faut respecter des consignes dites générales afin de pouvoir être visible dans l’une des grandes catégories de Google news. Ces règles concernent 3 grands axes: le contenu, l’éthique et la monétisation. En respectant les règles énoncées ci-dessous, vous aurez toutes les cartes en main pour être présent sur Google actualités.
Le contenu Google News
Priorité à l’actualité
Comme l’indique le moteur de recherche, les contenus présents sur Google actualités sont liés à de l’actualité chaude, à un événement récent. Autrement dit il faut traiter et analyser l’information dès sa sortie afin que votre contenu soit le plus frais possible et qu’il fournisse les informations les plus exclusives. Le Géant de Mountain view se refuse d’inclure des contenus du type didacticiels, courrier des lecteurs, offres d’emploi ou autres annonces immobilières. La priorité est donc à l’actualité !
Lisibilité et clarté
La lisibilité est un critère très important pour Google afin d’être dans l’index. Pour cela il y a des points fondamentaux à respecter : L’orthographe et la grammaire. Votre contenu doit donc être irréprochable sur ces points afin d’améliorer au maximum le confort de lecture de l’utilisateur. Le but de Google actualités est de fournir un contenu de qualité, la maîtrise du français est donc primordiale, mais pas seulement. Afin de ne pas altérer l’attention de l’utilisateur, Google préconise d’utiliser la publicité ou les annonces avec parcimonie. Vos contenus rémunérés ne doivent donc pas occuper d’avantage d’espace que votre contenu principal.
Un contenu original et unique
Comme sur son moteur de recherche classique, Google fait la guerre aux contenus dupliqués. Votre contenu doit être original et les sources éventuelles à l’article doivent être citées. Interdiction donc de copier ou de compiler des informations pour en faire un article, si c’est le cas, il est conseillé de séparer ces contenus de vos articles Google News. Pour cela, limitez l’accès à ces contenus “dupliqués” ou “compilés” via le fichier robots.txt.
Pour conclure, Google met l’accent sur le lecteur et l’expérience utilisateur. Votre contenu doit être pensé dans ce sens, n’oubliez donc pas les points suivants:
- Le contenu doit traiter d’une actualité chaude et exclusive
- Une orthographe et une grammaire irréprochables
- Publicités et annonces ne doivent pas occuper plus de place que votre contenu
- Aucune duplication autorisée
L’Éthique Google News
Sur ses différents moteurs de recherche, Google accorde une grande importance à l’éthique ainsi qu’à la qualité de l’information proposée à ses utilisateurs. Google News met donc en avant 3 points extrêmement importants pour être présent sur Google Actualités. Si ces points ne sont pas respectés vous aurez peu de chance d’accéder au moteur de recherche actualité :
- La responsabilité des éditeurs et la transparence
- Exclusion des sites trompeurs
- Annonceurs et publicitaires
La responsabilité des éditeurs
Google privilégie les sites d’actualités ayant une réelle équipe de rédaction, pour cela il est conseillé de proposer une biographie des rédacteurs ainsi que leurs réseaux sociaux. Ceci afin de démontrer leur activité et l’ensemble des contenus qu’ils ont rédigés.
Les sites trompeurs
La qualité de l’information est le fer de lance de Google actualité. En aucun cas un site ne doit diffuser de fausses informations, ni masquer les informations portant sur leur propriétaire et leur objectif principal..
Les sites privilégiés sont donc les sites d’information reconnues et qui ont une totale transparence sur leur source d’information ainsi que leurs équipes de rédaction.
Annonceurs et publicitaires
Sachant que es priorités de Google actualités sont l’information de qualité ainsi que le confort de lecture de l’utilisateur, le moteur de recherche souhaite réduire au maximum les espaces de pubs et autre pop-up qui pourraient altérer l’expérience utilisateur du visiteur. La publicité et autre contenu promotionnel, Adsense et autres plateformes promotionnelles sont donc à utiliser avec parcimonie.
- Vos contenus promotionnels ne doivent pas occuper plus d’espace que vos contenus d’information textuels
Structure d’article à adopter sur Google actualité
Comme pour son moteur de recherche principal, un site souhaitant correctement s’indexer Google actualité doit respecter les règles de base de structure de page. Il y a donc des critères On-page à respecter afin d’être visible sur le moteur de recherche actualité.
Les critères On-page
Les critères on-page sont très importants, car ce sont souvent les critères techniques que vont prendre en compte les différents robots de l’algorithme.
Chaque article doit disposer de sa page dédiée
Un article doit donc être disponible via une seule URL non dupliquée et compréhensible par les moteurs (absence de caractères spéciaux).
Les ID d’au moins 3 chiffres ne sont plus obligatoires depuis peu dans les URL, vous pouvez donc disposer d’une URL classique claire et compréhensible par les utilisateurs. Certaines pages sont à proscrire pour Google News, du type :
- Les pages listant plusieurs actualités
- Les listes d’articles ne pointant pas la page dédiée à chaque news
- Les pages compilant le contenu intégral de plusieurs articles
- Chaque sous-domaine doit être soumis indépendamment au formulaire Google actualité
- Privilégier UTF-8 pour l’encodage
- Le contenu doit être en ligne au moins 30 jours, au-delà de ce délai l’article ne remonte plus dans les résultats
- Une seule langue par page à préciser dans la search console ainsi que via la balise hreflang si votre site est multilingue
- Optimisation des images, afin de posséder une vignette à côté de votre article dans le moteur de recherche Google actualité
Pour ce dernier point vous devrez vous assurer des points suivants :
- Format de l’image: GIF ou JPEG avec les attributs height, width et alt renseignées. Le format PNG ne permet pas d’avoir une vignette illustrant votre article
- Avec une illustration, votre article aura logiquement un taux de clic plus important que sans
La structure d’article Google actualité
La structure d’article est importante pour apparaître dans les résultats de recherche de Google News. Voici les pré-requis techniques à respecter :
- Le titre H1 doit correspondre à 100% à la balise Title
Exemple d’article du Figaro : https://lc.cx/JXDN
- Afficher l’heure et la date de la publication: critère important pour Google actualités, car il permet de voir la fraîcheur de votre contenu.
Plus vous êtes rapide sur la diffusion de l’information plus vous aurez plus de chances d’apparaître dans les résultats de Google actualité. Le “Scoop” est un élément décisif sur Google News.
Il y a-t-il un minimum de mot pour être dans le fil d’actualité d’un trends topic ou d’une catégorie ?
On observe qu’il y a aucune corrélation entre le positionnement et le nombre de mot dans l’article. Tous les médias présents sont des sites avec un haut « source rank « , il n’y aucun média « mineur » présent sur ce trends topic. La densité du contenu ne fait donc pas le positionnement de l’article.
- Baliser au maximum votre contenu avec H2, H3, etc
- Le format AMP est fortement privilégié sur Mobile, avoir le label AMP est donc conseillé pour apparaître sur mobile. Plus d’information sur l’AMP project.
La structure à ne pas adopter
Lorsque votre site a été validé par Google et que vous êtes éligible à la diffusion sur le moteur de recherche actualité, Google se réserve le droit de publier ou non l’article. La structure de votre texte peut en être la cause, voici donc quelques conseils pour l’améliorer :
- Évitez d’insérer des éléments multimédias trop hauts dans l’article tel que des vidéos, tweet ou infographie par exemple. Le contenu textuel est à privilégier
- Evitez de commencer ou d’insérer trop haut dans l’article une liste à puce
- Privilégiez des paragraphes long (3-4 lignes). Votre chapô si vous en aviez un devra donc respecter cette consigne.
Source Rank
Il semblerait que tous les médias ne soient pas totalement sur un pied d’égalité et qu’il existe une notion de “source rank” qui classerait les différents articles. Les sites de presse, les sites de radio ou de chaîne TV bénéficieraient d’un haut “source rank” et seraient fortement trustés.
- Publier un maximum d’article au quotidien et de façon régulière sur des sujets chauds
- Produire des contenus ayant des sujets connexes, mais des angles d’approches différents
- Publier du contenu sur les “trending topics” (les sous-catégories correspondant à l’actualité du moment)
- La notion de CTR et de partage sur les réseaux sociaux est également très importante
« GoogleActualités est compilé intégralement par un algorithme informatique qui analyse tous les sites présents dans notre système. Pour que votre contenu puisse figurer dans GoogleActualités, sa mise en page et son format doivent être facilement lisibles et déchiffrables par notre robot. Par ailleurs, nous avons mis en place certaines restrictions, de façon à ce que notre robot d’exploration inclue uniquement des liens vers des URL qui correspondent effectivement à des articles d’actualité. »
Source : Support Google
La structure technique d’un article Google actualités
Nous en avons déjà légèrement parlé précédemment, mais il y a des prés requis pour être visible sur Google actualités. Ces derniers comprennent la problématique de duplication d’URL et d’accès au Google Bot, ainsi que l’implémentation d’un sitemap Google news.
URL et duplication
Chaque page doit avoir sa propre URL et son contenu doit être unique. Les agrégateurs de brèves, les pages contenant plusieurs contenus d’articles semblables ou des contenus ayant une URL dynamique seront systématiquement refusées par Google actualités.
La balise Meta Keywords
Tout SEO vous dira que cette balise n’est plus prise en compte par Google et qu’elle est même considérée comme du Keyword stuffing. Mais pour Google Actualités, cette balise permet de mieux comprendre votre sujet et d’éventuellement vous inclure plus facilement dans un “trending topics”.
La balise Standout
La balise “standout” est déployée en 2011 aux Etats-Unis et permet aux sites présents sur Google actualité de mettre en avant certains articles d’excellente qualité :
La balise “standout” doit être insérée dans la partie “Head” et il est possible de mentionner 7 articles maximum par semaine. Vous pouvez également mentionner des articles de sources externes ayant servi comme source d’écriture.
Le robots.txt
Google actualités à son propre robot d’exploration : Googlebot-News. Dans ce cas, le robots.txt permet d’orienter le robot Google vers les parties de votre site que vous souhaitez voir apparaître dans Google et dans Google actualités :
- Pour empêcher votre site de figurer dans Google Actualités, bloquez l’accès à Googlebot-News à l’aide d’un fichier robots.txt
Vous avez également la possibilité de bloquer l’exploration et l’indexation à Googlebot-News via la balise Meta suivante :
La 3 digital-rule encore d’actualité ?
Avant 2016, afin d’apparaître dans Google actualité il fallait avoir un ID de 3 chiffres dans son URL afin que les robots Google puissent reconnaitre que ces URLs étaient à crawler, et donc à indexer dans Google news. Depuis septembre 2015 cette règle n’est plus d’actualité, car le sitemap Google actualité permet aux robots de distinguer les pages destinées à Google actu.
L’annonce de Stacie Chan le 28 septembre 2015 sur la fin de la “3-digitale rule”
Source : Forum Google
Sitemap Google news
Afin d’être éligible à Google actualité il est primordial d’avoir ce type de sitemap dédié à Google news ; voici les principales règles à respecter pour que ce sitemap soit compris et pris en compte par les robots Google :
- Le sitemap doit contenir uniquement les Urls des articles publiés sur les dernières 48 heures. Il faut donc supprimer les Urls des anciens articles, ces derniers resteront tout de même dans l’index sous 30 jours, comme prévu habituellement.
- Il est préférable de mettre à jour votre sitemap suite à chaque publication, car celui-ci est visité régulièrement par les robots Google.
- Le sitemap Google actualité ne doit pas contenir plus de 1 000 Urls
- N’utilisez pas votre outil de génération de sitemap Google, car il inclurait des Urls ne correspondant pas au sitemap Google actu. Des outils peuvent remplacer l’outil Google, voir ici.
Des exemples de site Google actualité :
- http://www.lefigaro.fr/sitemap_actu.xml
- http://www.lexpress.fr/sitemap_actu_1.xml
- http://www.bfmtv.com/sitemap_news.xml
Tableau des balises Google Actualités
Découvrez sans plus attendre le tableau des balises Google actualités à retenir pour être éligible à Google News.
Balise | Obligatoire | Description |
---|---|---|
Publication | Oui | La balise |
Genres | À utiliser uniquement si l’article correspond à un type de contenu particulier | Liste de propriétés séparées par des virgules décrivant le contenu de l’article : « PressRelease » ou « UserGenerated. » Consultez les propriétés de contenu Google Actualités pour connaître les différentes valeurs possibles. Pour assurer aux internautes une certaine cohérence, vous devez appliquer les bons libellés à votre contenu. |
Publication_date | Oui | Date de publication de l’article au format W3C, avec soit la date complète (AAAA-MM-JJ), soit la date complète suivie des heures, des minutes, des secondes et du fuseau horaire (AAAA-MM-JJThh:mm:ssTZD). Assurez-vous d’indiquer la date et l’heure d’origine auxquelles l’article a été publié sur votre site. N’indiquez pas l’heure à laquelle l’article a été ajouté à votre sitemap.
Notre robot d’exploration accepte les formats suivants : Date complète suivie des heures et des minutes Date complète suivie des heures, minutes et secondes Date complète suivie des heures, minutes, secondes et dixièmes de seconde |
Title | Oui | Titre de l’article. Remarque : en raison de restrictions de longueur, le titre peut apparaître tronqué dans Google Actualités. La balise de titre d’article doit contenir uniquement le titre de l’article, tel qu’il apparaît sur votre site. Le nom de l’auteur, le nom de la publication ou la date de publication ne doivent pas être indiqués dans cette balise. |
Keywords | Non | Liste de mots clés séparés par des virgules décrivant le sujet de l’article. Les mots clés peuvent en partie être issus de la liste des mots clés Google Actualités existants sans toutefois s’y limiter. |
Stock_tickers | Non | Liste (limitée à cinq entrées) des symboles boursiers, fonds communs ou autres entités financières, séparés par des virgules, qui constituent le sujet principal de l’article. Cette section est surtout pertinente pour les articles d’ordre financier. Chaque symbole boursier doit être précédé de l’indice boursier auquel il est associé et doit être identique à celui indiqué dans Google Finance. Par exemple, les formulations « NASDAQ:AMAT » ou « BOM:500325 » sont correctes, tandis que « NASD:AMAT » et « BOM:RIL » ne le sont pas. |
Source : https://support.google.com/news/publisher/answer/74288?hl=fr
Conclusion
Google actualité est un média à part entière, de par sa capitalisation de visite et son nombre d’utilisateurs quotidiens. Avec l’avènement du mobile et la constante augmentation des visites sur ce device, Google cherche toujours à satisfaire pleinement l’utilisateur. La sortie d’AMP en 2016 en est la preuve, car actuellement aux Etats-Unis les résultats aux formats AMP sont passés de 30 à 70% des liens renvoyés par Google actualité.
- Téléchargez notre infographie : Infographie Google Actualités
Ce label va donc devenir primordial pour être présent sur Google news. L’actualité est fortement consommée via mobile, il est donc logique que Google prenne ce virage et optimise au maximum son moteur de recherche en ce sens.
Vous souhaitez en savoir plus sur la mise en place d’une stratégie SEO ?
N'hésitez pas à nous contacter dès à présent !
Merci à vous pour cet article ultra bien détaillé sur Google Actualités ! Vous me direz si je me trompe, mais je vois parfois des sites qui semblent être « de basse qualité » qui arrivent à figurer dans Google news… existe-t-il des méthodes « non vertueuses » pour figurer dans cet index ? (un peu comme en SEO me direz-vous)
Bonjour Alice,
Merci pour votre commentaire, je vais essayer d’être le plus claire possible dans ma réponse 🙂
Alors effectivement il y a des sites peu qualitatifs qui peuvent remonter lorsque vous tapez un keywords dans la barre de recherche Google actualité, mais sur le flux d’actualité et sur les trending topics nous rencontrons uniquement des sites dits de « haute qualité ». Il faut savoir que ces sites sont soumis à validation par Google, il existe peut-être comme sur le moteur de recherche un index primaire pour les sites de haute qualité et un index secondaires ou nous pouvons retrouver des sites plus médiocres.
Comme en sur Google il existe des méthodes pour forcer son indexation dans Google actualités telle que la mise en ligne en masse de contenu, la duplication de contenu de haute autorité, le keywords stuffing dans les balises associées, etc.. Vous pouvez donc être sanctionné et être supprimé de l’indexation de Google actualité. A savoir également que le site est soumis à validation, il est donc à mon sens plus compliqué de « tricher » avec Google actu que avec le moteur principal.
Bonne journée !
Bonjour,
Pour faire apparaître des articles sur Google actualités, il me semble indispensable d’aligner les catégories de son blog sur celles de Google actualités : France, santé, sport, culture, économie, international. Tout en restant bien évidemment dans sa ligne éditoriale et son Topical Trust Flow.
Naturellement, l’expérience utilisateur n’est pas à négliger et une attention particulière devra être apportée à tout ce qui favorise les visites et limite le taux de rebond ; autrement dit, des sujets au plus près de l’actualité et des attentes des internautes, un titre accrocheur…
Bonjour Damien,
Effectivement lorsqu’on observe les médias les plus présents sur Google actualités, ils utilisent la même catégorisation qui est plutôt logique lorsque l’on traite de sujet d’actualités. Pour un média « généraliste » il est donc essentiel d’avoir ce type de catégorisation, ce qui est moins vrai sur des médias plus spécialisés.
Le plus important est comme vous le dites de traiter d’un sujet chaud tout en optimisant au maximum l’expérience utilisateur.
Merci Damien, pour votre commentaire !
Bonjour,
merci pour cette synthèse.
Petite question relative à votre phrase « Chaque page doit avoir sa propre URL et son contenu doit être unique »
Sur notre site (que nous n’arrivons pas à faire référencer dans google actus, sans réussir à savoir pourquoi ) nous faisons de la multi-diffusion de contenus (pas mal de sous sites dédiés à des publics différents mais pouvant s’intéresser au même contenu) mais en prenant soin d’être réglo sur la balise meta « canonical » censée prévenir le déréférencement pour duplicate content.
Cette balise canonique est elle bien prise en compte par google actualités ?
Par ailleurs vous écrivez « En cas de refus vous recevrez une réponse par mail, » : en l’occurence je n’ai jamais reçu de mail, encore moins d’explication de ce qu’il faudrait corriger, et j’en suis donc réduit à tâtonner…
merci
J
Bonjour Julien,
Merci pour votre commentaire.
Effectivement c’est un très bon réflexe d’avoir mis les balises canonical et oui Google actualités prend « normalement » bien en compte cette balise.
Je vous invite à vous rendre ici pour un complément d’information, notamment dans la section: « Le contenu de ce blog destiné à la syndication »
https://support.google.com/webmasters/answer/139066?hl=fr
Avez-vous regardé dans vos messages sur Google Search consol ?
Bonjour,
En matière de précision sur Google Actualités on pourra faire difficilement mieux. Merci pour ce précieux contenu.