Agrégation de données Web : récupérer pour mieux comprendre

Qu’il s’agisse de statuer sur une orientation à prendre ou de savoir quelles sont les résultats de vos actions, les données sont au centre de toutes les attentions. De fait, leur récupération à partir de votre site Internet puis leur agrégation est un enjeu majeur pour, in fine, les analyser, gagner de l’audience, améliorer votre chiffre d’affaires, retours sur investissements...

En préambule : les données et le RGPD

Depuis 2018, la récupération des données en Europe est réglementée par le Règlement Général sur la Protection des Données (RGPD). Celui-ci pose un cadre légal quant à leur captation d’une part et leur utilisation d’autre part. Découvrez ci-contre les 5 grands principes du RGPD.

1

Le principe de finalité

Vous ne devez enregistrer et utiliser des données nominatives que dans un besoin précis, légal et légitime, et où chaque finalité doit nécessiter un consentement propre.

2

Le principe de proportionnalité et de pertinence

Les données enregistrées doivent être pertinentes et strictement nécessaires au regard du besoin qui est le vôtre.

3

Le principe de durée de conservation limitée

Vous devez limiter la durée de conservation de vos données nominatives, informer vos utilisateurs par mention sous un formulaire avant soumission, mais aussi sur une page dédiée. Tandis qu’une durée de conservation doit être spécifiée, celle-ci devra être fonction du type de données et du besoin.

4

Le principe de confidentialité et de sécurité

Vous devez garantir la confidentialité et la sécurité de vos données et des informations qu’elles contiennent. En particulier, vous devez veiller à ce que seules des personnes autorisées aient accès à ces données.

5

Le principe de droit des personnes

Toute personne doit pouvoir vous contacter, être informée, disposer d’un droit d’accès, de rectification, d’effacement, de limitation du traitement, de portabilité et d’opposition à propos des données la concernant.

Les logiciels d'analyse statistiques

Google Analytics - Les logiciels d'analyse statistique

Il existe 2 techniques pour récupérer des données sur votre site Internet. La première d'entre elles provient des logiciels d'analyse statistiques. Les logiciels d'analyse statistiques vous permettent, à l'aide d'une petite balise sur toutes les pages de votre site Internet, de déposer un traceur sous la forme d'un cookie, visant à capter les informations de navigation de tous vos visiteurs.

Les données Web remontées peuvent être très diverses, comme :

  • La géolocalisation des visiteurs (via l'adresse IP)
  • Les différentes technologies utilisées (navigateurs, appareils...)
  • La provenance sur le Web (Recherche Google, depuis un autre site...)
  • Les pages visionnées et la durée de visionnage (navigation)
  • Les conversions et actions engendrées (achats, formulaires...)
  • Les temps de chargement globaux de votre site et de vos pages lors des visites
  • Et bien plus encore

Il existe de nombreux logiciels d'analyse statistiques, dont les deux plus populaires sont Google Analytics et Matomo. Ils vous permettront de capter des données puis de les visionner via des tableaux de bord. Mais il sera également possible d'agréger et de transférer ces données à d'autres outils, dans le but de les rassembler et de mieux les faire parler.

Par exemple, il n'est pas rare de voir des données de sources diverses être utilisées dans le cadre de l'utilisation d'un CRM, de campagnes de newsletters, SMS, remarketing, etc. Ces besoins précis (réception d'appels clients, campagnes publicitaires diverses...) ont besoin de données personnalisées, pertinentes et à jour pour pouvoir toucher leur cible. Et ce, en restant sans cesse dans les limites fixées par le Règlement Général sur la Protection des Données (RGPD).

Les fichiers de logs serveur

Logs serveurs - La récupération de données Web

La seconde technique de récupération des données de votre site Internet provient des fichiers de logs serveur. Ce sont des fichiers sur votre serveur Web enregistrant les données en provenance de vos programmes ou APIs, des robots d'indexation, des visiteurs parcourant vos pages...

Une fois extraites, ces données Web fournissent :

  • La géolocalisation de tout ce qui transite (via l'adresse IP)
  • L'user-agent, ou plus simplement le type de visiteurs (robots, humains)
  • Les codes réponses HTTP (200 pages OK, 404 pages introuvables, etc.)
  • L'appel aux différents fichiers demandé (images, CSS, JavaScript, etc.)
  • Et bien plus encore

De fait, les fichiers de logs serveur vous permettront aussi bien d'analyser la navigation de vos utilisateurs que celles des robots des moteurs de recherche comme Google, Bing... Vous pourrez connaître précisément la fréquence de leurs allées et venues, les pages les plus fréquentées ou les erreurs rencontrées.

Véritable mine d'or, les logs serveur sont souvent les oubliés de l'équation ! Notez que leur utilisation est aussi soumise au RGPD, en ce sens que leur durée de conservation est limitée et qu'ils devront être régulièrement purgés.

Récupération de données Web : quelle technique choisir ?

Il faut choisir... les deux ! Les fichiers de logs serveur viennent souvent en complément des logiciels d'analyse statistiques. En effet, bien qu'ils fournissent certaines données identiques (géolocalisation, ...), d'autres sont bien plus précieuses et difficiles à obtenir (user-agent, ...). Dès lors, il s'agira de corréler ces deux outils pour mieux faire parler votre site Internet.

Autre information notable : les fichiers de logs serveur ne nécessitent pas l'installation de traceurs (cookies). En effet, tout serveur Web dispose de tels logs. Il s'agit simplement de savoir où chercher ! Pour terminer, la seule donnée sensible contenue dans ces fichiers est l'adresse IP, qu'il faudra anonymiser.

Données Web : place à l'agrégation

Une fois les données obtenues, il s'agit maintenant de les agréger pour mieux les faire parler. Il est évident qu'aller dans votre onglet Google Analytics, log serveur, Google Ads ou autre pour voir toutes vos données à jour n'est pas un gain de temps en soi. Non, ce qu'il faut, c'est avoir toutes vos données Web au même endroit.

Pour ce faire, de nombreuses solutions existent, à l'image des plus connues : Looker Studio (anciennement Google Data Studio), Microsoft Power BI et Tableau. Bien que Power BI et Tableau soient des solutions de Business Intelligence (BI) très en vogue, il s'agit de logiciels d'analyse avec une courbe d'apprentissage très élevée. Pour une utilisation concrète, simple et conforme RGPD (n'oubliez pas d'anonymiser vos données en amont), Looker Studio fera très bien l'affaire.

 
Google DataStudio - Les logiciels d'agrégation de données
 

Avec Looker Studio, vous pourrez créer des rapports personnalisés, qui iront chercher la donnée et la récupérer, vous permettant enfin de la visualiser, voire de la conjuguer avec d'autres informations. Vous aurez accès à tout, au même endroit, et pourrez même avoir le luxe de modifier comme bon vous semble un ou plusieurs rapports, de les recevoir à heure régulière dans votre boîte e-mail, de les partager auprès de vos équipes techniques, marketing, commerciales, direction...

Agrégation de données Web : quelle solution choisir ?

Looker Studio a pour vocation de corréler principalement vos données issues du marketing en ligne (analyse statistique, SEO / SEA, e-mailing...). C'est le choix de la simplicité : en effet, toutes les entreprises n'ont vocation à disposer d'une solution complète pour seulement récupérer quelques données Web. En revanche, si votre but est de véritablement centraliser toutes vos données issues de vos différents départements (site Web, CRM, production...), Microsoft Power BI et Tableau sont des outils de Business Intelligence (BI) avancés à même de répondre à vos besoins actuels et futurs.

Le pôle webmarketing

Mise en place de Google Analytics, Matomo, Google Tag Manager, Matomo Tag Manager, Looker Studio... L'équipe webmarketing vous accompagne de A à Z pour récupérer toutes vos données Web et vous aider à mieux faire parler vos indicateurs clés (KPIs) dans un contexte RGPD.

Découvrir le pôle webmarketing

Vous souhaitez aller plus loin sur le sujet ?

Basée à Orléans, notre agence webmarketing répond à vos besoins : étude de projet, analyse et configuration de vos outils, mise en place et optimisation de vos performances, formations...

Contactez-nous pour que nous puissions faire parler à l'unisson toutes vos données Web !

Pour ce faire, complétez le formulaire ci-contre ou téléphonez-nous au 02 38 21 55 21.

*champs obligatoires

Les informations personnelles saisies dans ce formulaire sont facultatives. Elles serviront exclusivement le traitement de votre demande (en savoir plus).