Les listes d'adresses sont souvent gérées avec Excel. Et les listes d'adresses contiennent souvent des adresses en double:
Pour supprimer facilement et rapidement ces adresses en double dans Excel, procédez comme suit:
- Si vous ne l’avez pas encore fait, téléchargez DedupeWizard gratuitement ici. Installez le logiciel et demandez une activation d’essai. Ainsi, vous pouvez travailler avec le logiciel pendant une semaine sans aucune restriction.
- Lancez DedupeWizard et affichez la fonction «Dédoublonage dans une table» :
- Sélectionnez l'«adresse postale» comme critère de recherche de doublons, puis cliquez sur «Suivant»:
- Dans l'étape suivante, sélectionnez le fichier Excel à traiter :
- Ensuite, vous serez redirigé vers une boîte de dialogue qui vous permettra de spécifier la colonne de la table Excel dans laquelle le programme trouvera les informations pertinentes. Le programme a déjà effectué cette affectation dans la mesure du possible à l'aide des en-têtes de colonnes. Par exemple, la colonne «Street» de notre table contient la rue:
- Dans la boîte de dialogue suivante, nous pouvons indiquer au programme quelles parties de l'adresse doivent être comparées, il s'agit généralement de toutes. Et nous pouvons spécifier la taille du degré de concordance calculé entre deux adresses pour qu'elles apparaissent dans le résultat. Dans notre exemple, une valeur seuil de «70%» est utilisée pour le degré de concordance:
- Un nouveau clic sur «Suivant» permet de traiter les données. Au bout de quelques instants, le programme présente un résumé du résultat:
- Le résultat de la comparaison est ensuite présenté sous forme de tableau. Là, nous pouvons encore modifier le résultat en supprimant la croix rouge dans la colonne «supprimer» ou en la transférant vers une autre adresse dans le groupe:
- Une fois que nous sommes satisfaits du résultat, nous pouvons produire ou faire traiter le résultat à l'étape finale en fonction de nos besoins. Le protocole de suppression peut être imprimé, les adresses en double peuvent être supprimées directement dans la table d'origine ou les données corrigées peuvent être sauvegardées dans un nouveau fichier:
DataQualityTools proposent plus de possibilités de traitement du résultat que DedupeWizard. Entre autres, les enregistrements en double peuvent y être marquées. Il est également possible de transférer les données d'une série de données provenant du groupe de doublons vers un autre en utilisant le résultat de la comparaison pour le compléter. Une vue d'ensemble complète est disponible ici.