GEOTRUST SSL CERTIFICATE
Titre : | La sélection automatique des attribut lors de la mise en correspondance (matching) pour le couplage d'enregistrements |
Auteurs : | Benyahia Miloud, Directeur de thèse ; Dahmani Fadhila, Auteur ; Barka Majda, Auteur |
Type de document : | texte imprimé |
Editeur : | univ DR taher moulay saida, 2022-2023 |
ISBN/ISSN/EAN : | TECT03159 |
Format : | 44 p / ill / 29 cm |
Langues: | Français |
Catégories : | |
Mots-clés: | Record linkage, clés de blocage, blocage, Matching, sélection des attributes |
Résumé : |
Le processus d'identification des paires d'enregistrements qui
représentent la même entité du monde réel dans plusieurs bases de données, communément appelé couplage d'enregistrements ou le record linkage (RL), est l'une des étapes initiales importantes de nombreuses applications d'exploration de données. Le record linkage peut être défini comme un processus en trois étapes : (i) Le nettoyage et la normalisation (ii) L’indexation et le blocage (iii) La mise en correspondance des paires d’enregistrements indexés (Matching). Une clé de blocage (BK: Blocking Key) peut être choisie comme un attribut unique où avec la concaténation de plusieurs attributs, deux paramètres importants contrôlent les performances des clés de blocage : la valeur de la clé de blocage (BKV: blocking key value) et le nombre de clés de blocage et elle est utilisée durant les deux dernier étapes de RL. Les caractéristiques d'attribut qui affectent la décision de sélection comprennent le niveau d'erreurs dans les valeurs d'attribut et le nombre (et la distribution) des valeurs d'attribut, c'est-à-dire le contenu informationnel de l'attribut. Les résultats obtenus à partir des expériences sur des data sets du monde réel ont montrél’efficacité de choisir des clés de blocage différentes dans chaque étape de RL. |
Note de contenu : |
Chapitre I : Qualité deDonnées
Chapitre II: Record Linkage Chapitre III : Implémentation et expérimentation |
Exemplaires (1)
Code-barres | Cote | Support | Localisation | Section | Disponibilité |
---|---|---|---|---|---|
TECT03159 | T.I.MS00702 | Périodique | Salle des Thèses | Informatique | Exclu du prêt |
Documents numériques (1)
![]() La sélection automatique des attribut lors de la mise en correspondance (matching) pour le couplage d'enregistrements Adobe Acrobat PDF |