테이블 열에 조인할 때 더 이상 필요하지 않습니다. 퍼지 매칭을 사용하면 개별 목록의 항목을 비교하고 서로 가까이 있는 경우 참가할 수 있습니다. 일치하는 허용 오차 또는 유사성 임계값을 설정할 수도 있습니다.
퍼지 매칭에 대한 일반적인 사용 사례는 선호하는 과일의 질문에 오타, 단수, 복수, 대문자, 소문자 및 정확한 일치하지 않는 다른 변형이 있을 수 있는 설문 조사와 같은 자유형 텍스트 필드를 사용하는 것입니다.
퍼지 일치는 텍스트 열을 통해 병합 작업에만 지원됩니다. Power Query는 Jaccard 유사성 알고리즘을 사용하여 인스턴스 쌍 간의 유사성을 측정합니다.
절차
-
쿼리를 열기 위해 파워 쿼리 편집기에서 이전에 로드된 셀을 찾아 데이터에서 셀을 선택한 다음, 쿼리> 선택합니다. 자세한 내용은 쿼리 만들기, 편집 및 로드를 Excel(Power Query)를 참조하세요.
-
홈> 병합 > 를 선택합니다. 쿼리 병합을 새로 고를 수 있습니다. 병합 대화 상자가 맨 위에 기본 테이블과 함께 나타납니다.
-
퍼지 매치에 사용할 열을 선택합니다. 이 예제에서는 이름을 선택합니다.
-
드롭다운 목록에서 보조 테이블을 선택한 다음 해당 퍼지 일치 열을 선택합니다. 이 예제에서는 이름을 선택합니다.
-
조인 종류를 선택합니다. 참가하는 방법에는 여러 가지가 있습니다. 왼쪽 외측은 기본값이자 가장 일반적입니다. 각 조인 종류에 대한 자세한 내용은 쿼리 병합을 참조하세요.
-
퍼지 일치 사용을선택하여 병합을 수행하고, Fuzzy일치 옵션을 선택한 다음 다음 옵션에서 선택합니다.
-
유사성 임계값 일치하는 두 값이 얼마나 유사해야 하는지 나타냅니다. 최소값이 0.00이면 모든 값이 서로 일치합니다. 최대값 1.00은 정확한 일치만 허용합니다. 기본값은 0.80입니다.
-
대소문자 무시 텍스트 값을 대소문자 구분 또는 무감실 방식으로 비교해야 하는지 여부를 나타냅니다. 기본 동작은 대소문자 무감소입니다. 즉, 대소문자 무시입니다.
-
최대 일치 횟수 각 입력 행에 대해 반환될 일치 행의 최대 수를 제어합니다. 예를 들어 각 입력 행에 대해 일치하는 행 하나만 찾으면 값을 1로 지정합니다. 기본 동작은 모든 일치를 반환하는 것입니다.
-
변환 테이블 일치하는 논리의 일부로 일부 값을 자동으로 매핑할 수 있도록 매핑 테이블을 보유하는 다른 쿼리를 지정합니다. 예를 들어 "From" 및 "To" 텍스트 열에 값 "Microsoft" 및 "MSFT"가 있는 두 열 테이블을 정의하면 이러한 두 값이 동일하게 간주됩니다(유사도 점수 1.00).
-
-
Power Query는 두 테이블을 모두 분석하고 일치하는 수에 대한 메시지를 표시합니다. 예제에서 선택 영역은 첫 번째 테이블의 행 4개 중 3개와 일치합니다. 퍼지 일치를 사용하지 않으면 4개 행 중 2개만 일치합니다.
-
만족하면 확인 을 선택합니다. 그렇지 않은 경우 다른 Fuzzy 병합 옵션을 사용해 환경을 사용자 지정합니다.
-
만족하면 확인 을 선택합니다.