Collecter l'information

Dans un système d'information, la collecte des données peut être manuelle, semi-automatique ou automatique.

Manuelle

La saisie de données

La saisie est réalisée par un être humain utilisant une interface utilisateur (exemples : Masque de saisie du PGI, formulaire de contact...).

Pour éviter les erreurs, les interfaces utilisateur peuvent intégrer des contrôles (exemples : date saisie au format JJ/MM/AAAA, le chiffre interdit pour le nom de famille ...).

La recherche documentaire

la recherche documentaire consiste à chercher et identifier des documents issus de sources fiables (revue, livre, site Web...).

ComplémentLa méthode "PULL"

Dans la méthode "PULL", l'utilisateur se rend directement et régulièrement sur internet pour en "tirer" les informations les plus récentes dans un domaine particulier en utilisant notamment des moteurs de recherche.

La méthode "PULL" permet au chercheur de sélectionner lui-même l'information. L'information recueillie est plus pertinente et le chercheur ne risque pas d'être noyé sous un flot d'informations trop volumineux.

Néanmoins, le chercheur doit se rendre régulièrement sur les sites web et relancer manuellement la recherche.

Exemple

https://www.quiziniere.com/#/Exercice/QW8EDL

Semi-automatique

Veille informationnelle

Définition

Une veille informationnelle est l'ensemble des stratégies mises en place pour rester informé, en y consacrant le moins de temps possible et en utilisant des processus de signalement automatisés.

Source : Jean-Pierre LARDY - URFIST de Lyon

ComplémentLa méthode "PUSH"

Avec la méthode "PUSH", l'information est "poussée" de manière automatique vers l'utilisateur en fonction de ses préférences et de ses critères en utilisant des flux RSS , des alertes, des abonnements sur les réseaux sociaux ou encore des abonnements à des lettres d'information.

Le chercheur n'effectue plus de recherche et se contente d'évaluer l'information reçue.

Cette méthode permet une économie de temps puisque le processus est automatisé.

Remarque

RSS se traduit par "Really Simple Syndication" (syndication vraiment simple). Un  flux RSS contient au minimum le titre et le lien des derniers articles mis en ligne par un site web.

Collecte dématérialisée

Les documents "papier" reçus par les organisations sont scannés et analyser par des logiciels pour en extraire des données.

Exemple

Services de dématérialisation des factures fournisseurs (vidéo) :

https://youtu.be/z_zJQzzsGHw

Automatique

Collecte de données massives

Les mégadonnées (Big data)
Définition

Avec le développement des nouvelles technologies, d'internet et des réseaux sociaux ces vingt dernières années, la production de données numériques a été de plus en plus nombreuse : textes, photos, vidéos, etc. Le gigantesque volume de données numériques produites combiné aux capacités sans cesse accrues de stockage et à des outils d'analyse en temps réel de plus en plus sophistiqués offre aujourd'hui des possibilités inégalées d'exploitation des informations.

Les données répondent à trois caractéristiques principales : volume, vélocité et variété.

Source : Commission nationale de l'informatique et des libertés (CNIL)

Données ouvertes (Open data)

L'open data désigne l'effort que font les institutions, notamment gouvernementales, qui partagent les données dont elles disposent.

Ce partage doit être gratuit, dans des formats ouverts, et permettre la réutilisation des données.

L'open data est un outil au service de trois objectifs :

  • améliorer le fonctionnement démocratique, non seulement par la transparence mais par la concertation et l'ouverture à de nouveaux points de vue ;

  • améliorer l'efficacité de l'action publique ;

  • proposer de nouvelles ressources pour l'innovation économique et sociale : les données partagées trouvent des réutilisateurs qui les intègrent dans de nouveaux services à forte valeur ajoutée économique ou sociale.

Source : Le Gouvernement, le 15 mai 2017 - https://www.gouvernement.fr/action/l-ouverture-des-donnees-publiques

Exemple

Plateforme ouverte des données publiques françaises :

https://www.data.gouv.fr/fr/