Lorsque vous joignez des colonnes de table, vous n’avez plus besoin et ne faites plus de correspondance exacte. La correspondance floue vous permet de comparer des éléments dans des listes distinctes et de les joindre si elles sont proches les unes des autres. Vous pouvez même définir la tolérance ou le seuil de similitude correspondant.
Pour une correspondance floue, il est courant d’utiliser des champs de texte libre, par exemple, dans une enquête où la question de votre fruit favori peut avoir des fautes de frappe, des singulars, des plural, des uppercase, des minuscules et d’autres variantes qui ne correspondent pas exactement.
La correspondance floue n’est prise en charge que sur les opérations de fusion de colonnes de texte. Power Query utilise l’algorithme de similitude Tyzcard pour mesurer la similitude entre des paires d’instances.
Procédure
-
Pour ouvrir une requête, recherchez-en une précédemment chargée à partir de l’Éditeur Power Query, sélectionnez une cellule dans les données, puis sélectionnez Requête >Modifier. Pour plus d’informations, voir Créer, modifier et charger une requête dans Excel (Power Query).
-
Sélectionnez Accueil> Combiner >fusionner des requêtes. Vous pouvez également sélectionner Fusionner des requêtes comme Nouvelles. La boîte de dialogue Fusionner apparaît avec la table primaire en haut.
-
Sélectionnez la colonne que vous voulez utiliser pour une correspondance floue. Dans cet exemple, nous sélectionnons Prénom.
-
Dans la liste drop-down, sélectionnez le tableau secondaire, puis la colonne de correspondance floue correspondante. Dans cet exemple, nous sélectionnons Prénom.
-
Sélectionnez un type de joint vous-même. Il existe plusieurs façons de les rejoindre. Left Outer est la valeur par défaut et la plus courante. Pour plus d’informations sur chaque type de jointille, voir Fusionner des requêtes.
-
Sélectionnez Utiliser une correspondance floue pour effectuer la fusion,sélectionnez Les optionsde correspondance ne sont pas floues, puis sélectionnez l’une des options suivantes :
-
Seuil de similitude Indique à quel point deux valeurs similaires doivent être pour correspondre. La valeur minimale de 0,00 entraîne la correspondance entre toutes les valeurs. La valeur maximale de 1,00 autorise uniquement les correspondances exactes. La valeur par défaut est 0,80.
-
Ignorer un cas Indique si les valeurs de texte doivent être comparées d’une manière sensible à la cas ou non. Le comportement par défaut n’est pas sensible à la cas, ce qui signifie que le cas est ignoré.
-
Nombre maximal de correspondances Contrôle le nombre maximal de lignes correspondantes qui seront renvoyées pour chaque ligne d’entrée. Par exemple, si vous ne voulez rechercher qu’une seule ligne correspondante pour chaque ligne d’entrée, spécifiez la valeur 1. Le comportement par défaut consiste à renvoyer toutes les correspondances.
-
Table de transformation Spécifiez une autre requête qui contient une table de mappage, afin que certaines valeurs peuvent être mappées automatiquement dans le cadre de la logique de correspondance. Par exemple, si vous définissez une table à deux colonnes avec des colonnes de texte « De » et « À » avec les valeurs « Microsoft » et « MSFT », ces deux valeurs seront considérées comme identiques (score de similitude de 1,00).
-
-
Power Query analyse les deux tables et affiche un message sur le nombre de correspondances qu’elles ont effectué. Dans l’exemple, la sélection correspond à 3 lignes sur 4 du premier tableau. Sans correspondance floue, seules 2 lignes sur 4 correspondent.
-
Si vous êtes satisfait, sélectionnez OK. Si ce n’est pas le cas, essayez différentes options de fusion floue pour personnaliser votre expérience.
-
Lorsque vous êtes satisfait, sélectionnez OK.