Kada se udružite u stupce tablice, više vam nije potrebna i točna podudarnost. Fuzzy matching omogućuje vam usporedbu stavki na zasebnim popisima i pridruživanje njima ako su međusobno bliske. Možete čak i postaviti podudarnu toleranciju ili prag sličnosti.
Slučaj fuzzy podudaranja često se koristi s poljima prostoručnog teksta, primjerice u anketi u kojoj pitanje o vašem omiljenom voću može imati pogreške, singulare, množinu, velika slova, mala slova i druge varijacije koje se ne podudaraju.
Neizrazito podudaranje podržano je samo u operacijama spajanja preko tekstnih stupaca. Power Query koristi algoritam sličnosti jaccard za mjerenje sličnosti između parova instanci.
Procedura
-
Da biste otvorili upit, pronađite prethodno učitan iz uređivača dodatka Power Query, odaberite ćeliju u podacima, a zatim odaberite Upit > Uređivanje. Dodatne informacije potražite u članku Stvaranje, uređivanje i učitavanje upita u programu Excel (Power Query).
-
Odaberite Polazno > Kombiniraj > spajanje upita. Upite spajanja možete odabrati i kao Novo. Pojavit će se dijaloški okvir Spajanje s primarnom tablicom pri vrhu.
-
Odaberite stupac koji želite koristiti za neizrazito podudaranje. U ovom primjeru odabiremo Ime.
-
Na padajućem popisu odaberite sekundarnu tablicu, a zatim odaberite odgovarajući stupac za neizrazito podudaranje. U ovom primjeru odabiremo Ime.
-
Odaberite vrstu pridruživanja. Postoji nekoliko različitih načina pridruživanja. Left Outer je zadana i najčešće. Dodatne informacije o svakoj vrsti spoja potražite u članku Spajanje upita.
-
Odaberite Koristi neizrazito podudaranjeda biste izvršili spajanje , odaberite Fuzzy podudarnemogućnosti , a zatim odaberite jednu od sljedećih mogućnosti:
-
Prag sličnosti Označava koliko se slične dvije vrijednosti moraju podudarati. Minimalna vrijednost od 0,00 uzrokuje da se sve vrijednosti međusobno podudaraju. Maksimalna vrijednost od 1,00 omogućuje samo točne podudaranja. Zadana je vrijednost 0,80.
-
Zanemari velika i mala slova Označava treba li se tekstne vrijednosti uspoređivati na neosjetljiv način ili prema velika i mala slova. Zadano je ponašanje neosjetljivo na velika i mala slova, što znači da se zanemaruje velika i mala slova.
-
Maksimalan broj podudaranja Određuje maksimalan broj podudarnih redaka koji će se vratiti za svaki redak unosa. Ako, primjerice, želite pronaći samo jedan podudarni redak za svaki redak unosa, navedite vrijednost 1. Zadano je ponašanje vraćanje svih podudaranja.
-
Transformacijska tablica Navedite drugi upit koji sadrži tablicu mapiranja da bi se neke vrijednosti automatski mapirane kao dio odgovarajuće logike. Na primjer, definiranjem tablice s dva stupca s tekstnim stupcima "Šalje" i "Prima" s vrijednostima "Microsoft" i "MSFT" te će se dvije vrijednosti smatrati jednakima (rezultat sličnosti od 1,00).
-
-
Power Query analizira obje tablice i prikazuje poruku o tome koliko je podudaranja. U primjeru se odabir podudara s 3 od 4 retka iz prve tablice. Bez korištenja neizrazisnog podudaranja, podudaraju se samo dva od četiri retka.
-
Ako ste zadovoljni, odaberite U redu. Ako ne, isprobajte različite mogućnosti fuzzy spajanja da biste prilagodili svoje iskustvo.
-
Kada ste zadovoljni, odaberite U redu.