Savienojot tabulas kolonnas, vairs nav nepieciešama precīza atbilstība. Fuzzy matching ļauj salīdzināt vienumus atsevišķos sarakstos un pievienot tos, ja tie ir tuvu viens otram. Varat pat iestatīt atbilstošo pielaidi jeb līdzības slieksni.
Bieži tiek izmantots gadījums, kad veikta aptuvena atbilstība, izmantojot brīvformas teksta laukus, piemēram, aptaujās, kur izlases augļi jautājumam var būt pareizrakstības kļūdas, vienskaitlis, daudzskaitļi, lielie burti, mazie burti un citi varianti, kas precīzi neatbilst.
Aptuvenā atbilstība tiek atbalstīta tikai sapludināšanas operācijās teksta kolonnās. Power Query izmanto Jaccard līdzības algoritmu, lai novērtētu līdzību starp instanču pāriem.
Procedūra
-
Lai atvērtu vaicājumu, atrodiet vaicājumu, kas iepriekš ielādēts no Power Query redaktora, atlasiet kādu datu šūnu un pēc tam atlasiet Vaicājuma >Rediģēt. Papildinformāciju skatiet rakstā Vaicājuma izveide, rediģēšana un ielāde programmā Excel (Power Query).
-
Atlasiet Sākums> Sapludināšanas > apvienošana. Varat arī atlasīt Sapludināt vaicājumus kā jaunus. Tiek parādīts dialoglodziņš Sapludināšana, kura augšdaļā ir primārā tabula.
-
Atlasiet kolonnu, kuru vēlaties izmantot savām aptuvenās atbilstības vajadzībām. Šajā piemērā mēs atlasām Vārds.
-
Nolaižamajā sarakstā atlasiet sekundāro tabulu un pēc tam atlasiet atbilstošo aptuvenās atbilstības kolonnu. Šajā piemērā mēs atlasām Vārds.
-
Atlasiet Savienojuma veids. Ir vairāki atšķirīgi veidi, kā pievienoties. Noklusējums ir Kreisais Ārējais, un tā ir visbiežāk lietotā. Papildinformāciju par katra veida savienojumiem skatiet sadaļā Vaicājumu sapludināšana.
-
Atlasiet Izmantot izplūdušu atbilstību, lai veiktu sapludināšanu, atlasiet Fuzzy atbilstošāsopcijas un pēc tam atlasiet kādu no šīm opcijām:
-
Līdzības slieksnis Norāda, cik jāatbilst divām vērtībām. Minimālā vērtība 0,00 izraisa visu vērtību atbilstību. Maksimālā vērtība 1,00 ļauj tikai precīzas atbilstības. Noklusējuma vērtība ir 0,80.
-
Ignorēt reģistru Norāda, vai teksta vērtības ir jāsalīdzina reģistrjutīgā vai nejutīgā veidā. Noklusējuma darbība ir reģistrnejutīga, kas nozīmē, ka gadījums tiek ignorēts.
-
Maksimālais atbilsmju skaits Kontrolē maksimālo atbilstošo rindu skaitu, kas tiks atgriezts katrai ievades rindai. Piemēram, ja vēlaties atrast tikai vienu atbilstošu rindu katrai ievades rindai, norādiet vērtību 1. Noklusējuma darbība ir atgriezt visas atbilstības.
-
Transformation table Norādiet citu vaicājumu, kas satur kartēšanas tabulu, lai dažas vērtības varētu automātiski kartēt kā daļu no atbilstošās loģikas. Piemēram, definējot divu kolonnu tabulu ar teksta kolonnām "No" un "Uz" ar vērtībām "Microsoft" un "MSFT", šīs divas vērtības tiek uzskatītas par vienādām (līdzības rezultāts ir 1,00).
-
-
Power Query analizē abas tabulas un parāda ziņojumu par to, cik tam atbilst. Šajā piemērā atlase atbilst 3 no 4 rindām no pirmās tabulas. Ja neizmantojat aptuvenu atbilstību, atbilstības atbilst tikai 2 no 4 rindām.
-
Ja esat apmierināts, atlasiet Labi. Ja ne, izmēģiniet atšķirīgas izplūdušu sapludināšanas opcijas, lai pielāgotu pieredzi.
-
Kad esat apmierināts, atlasiet Labi.
Skatiet arī
Palīdzība par Power Query Excel lietojumprogrammām