Ao ingressar em colunas de tabela, você não precisa mais e a combinação exata. A correspondência difusa permite comparar itens em listas separadas e juná-los se eles estão próximos um do outro. Você pode até definir a tolerância correspondente ou o Limite de Semelhança.
Um caso de uso comum para correspondência difusa é com campos de texto de forma livre, como em uma pesquisa em que a pergunta de sua fruta favorita pode ter tipografias, singulares, plurales, maiúsculas, minúsculas e outras variações que não são uma correspondência exata.
A correspondência difusa só é suportada em operações de mesclagem em colunas de texto. A Consulta do Power usa o algoritmo de similaridade de Jaccard para medir a semelhança entre pares de instâncias.
Procedimento
-
Para abrir uma consulta, localize uma carregada anteriormente no Editor de Consulta do Power, selecione uma célula nos dados e selecione Consulta > Editar. Para obter mais informações, consulte Create, edit, and load a query in Excel (Power Query).
-
Selecione Home > Combine > Merge Queries. Você também pode selecionar Mesclar Consultas como Novo. A caixa de diálogo Mesclar aparece com a tabela primária na parte superior.
-
Selecione a coluna que você deseja usar para a sua combinação difusa. Neste exemplo, selecionamos Nome.
-
Na lista lista listada, selecione a tabela secundária e selecione a coluna correspondente de match difusa. Neste exemplo, selecionamos Nome.
-
Selecione um Tipo de Junção. Há várias maneiras diferentes de ingressar. Left Outer é o padrão e o mais comum. Para obter mais informações sobre cada tipo de junção, consulte Mesclar consultas.
-
Selecione Usar correspondência difusa para executar amesclagem, selecione Opções decorrespondência difusa e selecione entre as seguintes opções:
-
Limite de semelhança Indica como dois valores semelhantes precisam ser para corresponder. O valor mínimo de 0,00 faz com que todos os valores se igualem uns aos outros. O valor máximo de 1,00 só permite as combinações exatas. O valor padrão é 0,80.
-
Ignorar caso Indica se os valores de texto devem ser comparados de forma sensível ou insensível a maiúsculas e minúsculas. O comportamento padrão é insensível a maiúsculas e minúsculas, o que significa que o caso é ignorado.
-
Número máximo de partidas Controla o número máximo de linhas correspondentes que serão retornadas para cada linha de entrada. Por exemplo, se você quiser apenas encontrar uma linha correspondente para cada linha de entrada, especifique um valor de 1. O comportamento padrão é retornar todas as partidas.
-
Tabela de transformação Especifique outra consulta que contém uma tabela de mapeamento, para que alguns valores possam ser mapeados automaticamente como parte da lógica correspondente. Por exemplo, definir uma tabela de duas colunas com colunas de texto "De" e "Para" com valores "Microsoft" e "MSFT" fará com que esses dois valores sejam considerados os mesmos (pontuação de semelhança de 1,00).
-
-
A Consulta do Power analisa ambas as tabelas e exibe uma mensagem sobre quantas combinações fez. No exemplo, a seleção corresponde a 3 de 4 linhas da primeira tabela. Sem usar correspondência difusa, apenas 2 de 4 linhas corresponderiam.
-
Se você estiver satisfeito, selecione OK. Caso não seja, experimente diferentes opções de mesclagem difusa para personalizar sua experiência.
-
Quando satisfeito, Selecione OK.
Confira também
Ajuda do Power Query para Excel