Pourquoi normaliser les données ?
La normalisation des données au sein d’un EDS est fondamentale pour en assurer une bonne exploitation.
Les données capturées de différentes sources et dans différents formats doivent être saines avant d’être stockées c’est à dire unifiées, nettoyées et prêtes à être exploitées.
Les grandes étapes de normalisation des données sont :
- Agrégation
- Rapprochement
- Déduplication
- Alignement terminologique
L’agrégation des données permet de rassembler toutes les informations d’un même patient en un même endroit. Puis le rapprochement de certaines données telles que les identités, observations, résultats de laboratoires, … est nécessaire afin de qualifier ces informations. La phase de déduplication est indispensable dans la mesure où par exemple l’utilisation massive HL7v2 dans les centres hospitaliers crée de nombreux doublons qu’il faut supprimer. Enfin, l’alignement terminologique assure la bonne concordance des différentes nomenclatures, ex SNOMED, ICD-xxx, Loinc.
Une fois normalisées, les données de santé sont prêtes pour être stockées puis exploitées.
Les fonctions clé d’un EDS:
Capture,
Normalisation,
Stockage,
Expoitation