GEOTRUST SSL CERTIFICATE
Titre : | Sélection semi automatique de clé blocage Pour le couplage d’enregistrement |
Auteurs : | Pr BENYAHIA miloud, Directeur de thèse |
Type de document : | texte imprimé |
Editeur : | Algèrie:unv saida-Dr Moulay Tahar, 2020-2021 |
Format : | 53P. / 29CM |
Accompagnement : | CD |
Note générale : | Bibliographie |
Langues: | Français |
Catégories : | |
Mots-clés: | Qualité des données, Record linkage, clés de blocage, technique de clustering. |
Résumé : |
Tous les ans, plusieurs organisations du monde entier subissent d'énormes pertes à cause des problèmes de qualité des données. Ainsi ces dernières sont désormais plus conscientes de l’importance de la qualité des données, et comme conséquence, beaucoup d'efforts sont investi pour améliorer la qualité des données stockées.
Parmi les principaux processus dans ce domaine est le Record Linkage (RL), également connu sous le nom de résolution d’entité. Il s'agit d'un processus de détection des doublons qui font référence à la même entité réelle dans un ou plusieurs ensembles de données. Dans ce processus, l'étape la plus importante est celle du blocage, celle-ci vise à réduire la complexité quadratique du processus en divisant les données en un ensemble de blocs. Ainsi, la mise en correspondance n’est effectuée qu’entre les enregistrements du même bloc. Par contre, le choix des meilleures clés de blocage pour diviser les données est une tâche difficile et, dans la plupart des cas, elle est effectuée par un expert du domaine. Le but de notre travail est d’utilise une technique de clustering proposée par Huang comme alternative à l'analyse de clustering pour les données catégorielles uniquement, cette technique est l'algorithme k-Mode. Les résultats que nous avons obtenus à partir des expériences sur des datasets du monde réel ont démontré l’efficacité de notre choix où le k-Mode a donné des résultats remarquables pour la sélection d’entités a renvoyé les meilleures clés de blocage. |
Note de contenu : |
1- qualité des données
2- Record Linkage 3- Méthode utilisée et Expérimentations 4- Conclusion Générale |
Exemplaires (1)
Code-barres | Cote | Support | Localisation | Section | Disponibilité |
---|---|---|---|---|---|
TECT06448 | T.I.MS00610 | Périodique | Salle des Thèses | Informatique | Exclu du prêt |
Documents numériques (1)
![]() ![]() Sélection semi automatique de clé blocage Pour le couplage d’enregistrement Adobe Acrobat PDF |