Comment coder les enregistrements des certificateurs et pour quoi faire ? [ Répondre ] Par : Bruno Vincenti on 2011-09-29 17:58 | [forum:476323] |
Le codage des données personnelles des certificateurs a 3 fonctions : - l'identification certaine et anonyme des candidats - l'identification et la suppression des doublons. - le rapprochement des enregistrements de la base avec des fichiers complémentaires (PRC, Pass VAE etc) Partant du principe que les enregistrements sans code sont supprimés, il faut viser à en éliminer le moins possible. 1. L'identification certaine des candidats implique de coder à partir des données personnelles : noms et prénoms en rajoutant une donnée permettant de distinguer les homonymes : la date de naissance. - en cas d'absence de date de naissance, il faut pouvoir générer un autre code, par exemple : nom + prénom + code postal - en cas d'absence de "nom", il faut vérifier si la rubrique "nom d'épouse" est remplie et coder sur : nom d'épouse + prénom + date de naissance (ou code postal). - si aucune des rubriques "nom" et "nom d'épouse" n'est remplie, il faut supprimer l'enregistrement avant import du fichier. 2. Le dédoublonnage des fichiers Il s'agit de repérer et d'éliminer les doublons parfaits (la reproduction à l'identique d'un enregistrement). Cela peut se faire dès l'attachement du fichier : pas besoin d'avoir recours au code. Il faut préciser que les codes pourront se retrouver en doublons dans la base, un candidat pouvant suivre plusieurs parcours VAE. Rappelons que l'identifiant unique de la base est un couple : Code + diplôme visé. 3. Le rapprochement avec d'autres fichiers L'identification d'un même candidat entre la base et les fichiers complémentaires impliquent de coder le candidat de la même manière des deux côtés. Un codage de type : nom (ou nom d'épouse) + prénom + date de naissance permet ce rapprochement, à condition que ces champs soient remplis. Faut-il coder autrement ? - Un codage de type : "nom+prénom+sexe+diplome visé" pose problème. Le sexe est peu discriminant, beaucoup moins que la date de naissance. Le diplôme visé n'est parfois pas renseigné. De plus ce champ n'existe pas dans le fichier PRC, ce qui ne permet pas le rapprochement. - En Rhône-alpes, le système génère 3 codes : "nom+prénom+date de naissance", "nom+prénom","nom+date de naissance". Cette approche permet de récupérer un maximum d'enregistrements. Mais elle augmente le risque de doublons (qui peuvent être identifiés plus tard avec d'autres rubriques). Les rapprochements PRC ne pourront être effectués que sur le 1er code. Merci de vos commentaires... Bruno Vincenti |