파워쿼리 14

파워쿼리 에디터 - 그룹화로 SUMIFS, COUNTIFS 간단히 해

파워쿼리에는 간단히 버튼 하나만 클릭하면 복잡한 수식을 입력하는 것과 똑같은 효과를 볼 수 있는 명령이 있는데요. 그 중 대표적인 것이 그룹화입니다. 엑셀을 써보신 분들은 조건에 맞는 합이나 행의 개수를 파악하기 위해 SUMIF, SUMIFS, COUNTIF, COUNTIFS같은 수식을 수시로 썼을 거라 생각합니다. 처음에는 복잡해 보이지만 수식을 이해하면 이처럼 편한 수식이 없죠. 아마 엑셀 수식 중 가장 많이 사용되는 수식중 하나가 아닐까 합니다. DAX에서 FILTER를 이용해 구할 수 있지만, 만일 쿼리 에디터에서 작업을 해도 된다면 아주 쉽게 해결할 수 있습니다. 그룹화는 무엇인가? 그룹화는 위에 설명해 드린 데로 열의 조건에 따라 원하는 열의 데이터를 연산하는 것입니다. 조건이 몇 개든 요약하..

파워쿼리 에디터 - 열 분할로 입맛에 맞게 데이터 나누기

파워 쿼리에서 작업하면, 데이터를 목적에 맞게 나누어야 할 때가 많습니다. 예를 들어 텍스트가 너무 길다거나, 날짜 데이터에서 연도, 월을 따로 구분한다거나, 고객 명단에서 성과 이름을 각각 다른 열에 저장하고 싶을 때 버튼 하나로 아주 간단히 해결할 수 있습니다. 열 분할 이란? 열 안에 있는 문자나 숫자 등을 필요한 만큼 자르거나 나누는 기능입니다. 홈 혹은 변환 탭 안에서 찾을 수 있는데, 열 분할 버튼을 누르면 총 7가지 선택사항이 나오는데, 여기서 가장 많이 사용하는 구분 구호 기준, 문자 수 기준에 대해 말씀드리겠습니다. 구분 구호 기준 Date 열을 보면 연-월-일로 정리가 되어있습니다. 여기서 똑같이 반복되는 기호가 -이라는 건 금방 알 수 있습니다. 여기서 연, 월, 일을 각각 하나의 열..

파워 쿼리 에디터 - 공백 제거, 정리 명령으로 데이터 정리하기

눈에 보이지 않는 데이터의 공백 데이터 전처리에서 눈에 보이지 않는 요소로 인해서 많은 양의 데이터가 누락되는 경우가 많습니다 아래의 예를 한번 보시면 금방 이해가 될 거로 생각합니다. 네 개의 데이터가 모두 같아 보이지만 실제로 파워 쿼리에서는 4개의 각각 다른 데이터로 인식합니다. 세 번째는 차이가 느껴지죠? Power 앞에 공백 하나를 가지고 있습니다. 이 공백 하나 차이로 세 번째 데이터는 다른 데이터로 인식됩니다. 그럼, 나머지는 뭐가 차이가 있을까요? 첫 번째는 아무 글 앞뒤로 아무 공백이 없으며, 두 번째는 마지막 BI 뒤에 공백 하나, 네 번째는 BI 뒤에 공백 2개를 가지고 있습니다. 이러한 차이로 인해 파워 쿼리에서는 상이 값 4개, 고유 값 4개로 인식합니다. 만일 이런 차이점을 무시..

파워 퀴리 에디터에서 열 이름, 서식 지정하고 오류 확인하기

열 이름으로 사용될 행을 머리글로 지정했다면 다음을 가장 먼저 확인해야 합니다. 열 속성 오류 확인 속성은 아래와 같이 크게 5가지로 구분되나 숫자, 날짜, 문자가 가장 많이 사용되며, 숫자, 날짜는 좀 더 세분화 됩니다. 숫자 날짜 문자 참/거짓 이진법 열 속성 지정 처음 데이터를 가져오면 모든 열 속성이 문자와 숫자가 동시에 보이는데 이는 열 속성 지정이 되지 않았음을 의미합니다. 열 속성을 나타내는 곳을 클릭하면 메뉴가 나오는데 이 중 하나를 선택하면 속성이 바뀌는 것을 확인할 수 있습니다. 주의할 점 열 속성이 지정되지 않아도 작업 진행에는 문제가 없습니다. 하지만, 첫 번째 Segmant 열을 예로 들면 화면상에서는 모두 문자를 보여주고 있지만, 아래 보이지 않는 곳에 수많은 행이 있는데 그 중..

데이터 분석의 시작 - 첫 행을 머리글로 올려 열 이름 지정하기

파워비아이 쿼리 에디터로 데이터를 가져오면 가장 먼저 해야 할 것이 열 이름을 지정하는 것입니다. 쿼리는 열 이름을 사용하여 모든 명령을 실행하기 때문에 이를 지정하는 것이 쿼리 에디터에서 데이터 분석을 시작하는 첫걸음입니다. 파워비아이에서 엑셀 파일로부터 데이터를 가져올 때 아래와 같은 경우가 많습니다. 때로는 자동으로 인식해서 열 이름을 알아서 지정하는 때도 있지만 아래의 경우를 볼 수 있습니다. 최상의 행이 열 이름으로 지정되며, 보시는 것과 같이 회색 바탕을 두고 있습니다. 현재 열 이름은 Column1, Column2와 같은 형태로 되어있으며, 엄연하게 열 이름을 가지고 있으니 현재 상태로도 Column1, Column2를 열 이름으로 하여 수식을 만들거나 편집하는 데는 아무 문제가 없습니다. ..

데이터 전처리 입력 도구 - 파워쿼리 에디터 리본과 데이터 보기의 DAX

엑셀에서 데이터 분석을 지원하기 위해 등장한 파워쿼리 에디터는 특별한 코딩 지식이 없는 분도 쉽게 데이터 전처리 진행이 가능하여지도록 했습니다. 엑셀과 비슷하게 구성되었기에 거부감 없이 접근할 수 있지만, 역으로 엑셀과는 너무나도 다른 작업환경에 크게 당황하게 되는데요. 사용이 그리 어렵지 않으니 하나하나 차근차근 명령 도구를 익히면 금방 익숙해집니다. 맨 위에 있는 쿼리 에디터 리본으로 모든 명령을 수행하게 됩니다. 이곳에서 실행한 모든 명령은 일명 M-Code라고 하는 파워쿼리를 구성하는 컴퓨터 언어로 저장될 뿐 아니라 오른편 적용된 단계 창을 통해 실행된 명령이 순서대로 기록이 되어 나중에 쿼리 수정에 유용하게 쓰입니다. 쿼리 에디터 리본은 홈, 변환, 열 추가, 보기, 도구, 도구의 5가지 메뉴를..

파워쿼리 데이터 전처리에서 꼭 해야 할 것 - 오류 및 결측치 확인 및 제거

파워 비아이에서 파워쿼리 에디터로 데이터를 가지고 온 뒤 가장 먼저 확인해야 할 것이 있습니다. 데이터에 오류가 있는지 확인 (셀에 Error로 표시됩니다) 데이터에 결측치가 있는지 확인 (여기서 결측치란 데이터가 누락되거나 계산상의 오류로 인식을 못 하는 경우를 말합니다 - 파워쿼리 에디터에서는 “비어있음”, “NaN”, “빈 문자열”로 표시됩니다) 데이터 오류 확인 방법은 아래의 두 가지만 확인하시면 됩니다. 열 품질 확인 (데이터에 오류나 결측치가 있는지 확인) 열 프로필 확인 (좀 더 자세히 열의 정보를 확인) 위에서 말씀드린 열 품질 및 열 프로필을 확인하려면 아래와 같이 메뉴에서 보기를 선택하고 데이터 미리 보기 리본에서 열 품질을 선택하면 행이 추가되고, 열 프로필을 선택하면 작업 창 아래에..

파워쿼리 에디터 - 적용된 단계 창에서 알아 두어야 할것

쿼리 세팅에서 적용된 단계에 대해 잠시 알아보겠습니다. 이전에 설명해 드린 데로 명령을 수행할 때마다 단계별로 저장을 하고 그 단계를 보여줍니다. 모든 프로그램이 그렇듯 파워쿼리도 실행할 때 사용되는 프로그래밍 언어가 있는데, M-Code 혹은 M 언어라고 하는 프로그램으로 명령을 수행합니다. M 코드 (M-Code)를 확인하는 방법은 파워쿼리 에디터에서 고급 편집기를 클릭하면 지금껏 작업한 모든 것이 기록되어 있다는 것을 확인할 수 있습니다. 파워쿼리 에디터는 M 코드를 몰라도 에디터 리본에서 제공하는 버튼만으로 데이터 전처리가 가능하도록 만든 프로그램이라 M 코드를 모른다고 해서 큰 문제가 될 것은 없습니다. 하지만 때로는 M 코드를 수정하거나 직접 명령어를 입력하는 것이 필요할 때가 있기 때문에 이..

파워쿼리 에디터의 구성

먼저 데이터 전처리를 시작하기 전 파워쿼리 에디터의 구성에 대해서 잠시 살펴보겠습니다. 엑셀과 비슷하게 생겼지만, 완전히 다른 구조를 가졌으므로 머릿속에서 엑셀에 대한 생각을 지워야 보다 쉽게 다가갈 수 있습니다. 파워쿼리 에디터는 아래와 같이 5개의 영역으로 나눌 수 있습니다. 쿼리 에디터 리본 (Query Editor Ribbon) - 데이터 수정 작업을 실행하는 명령 버튼 (복잡한 프로그래밍 언어를 간단히 버튼 클릭으로 수행할 수 있도록 도와줍니다) 쿼리 창 - 현재 쿼리 에디터에 있는 쿼리 리스트 작업 창 - 진행된 작업의 결과물을 보여주는 창 쿼리 설정 - 현재 작업 중인 쿼리 이름과 적용된 단계를 보여주는 창 상태 바 - 셀에 있는 내용을 보여주는 창 작업 창과 적용된 단계에 대해 잠시 말씀드..

데이터 전처리의 첫번째 단계 - 파워쿼리 에디터에 데이터 가지고 오기

파워비아이에는 기본적으로 파워쿼리 에디터 (Power Query Editor)가 내장되어 있습니다. 파워비아이의 메뉴바에서 데이터 변환 버튼을 누르면 파워쿼리 에디터로 들어가 가지고 온 데이터를 수정할 수 있습니다. 이를 수행하기 위해 선행되어야 하는 것이 데이터 가져오기입니다. 데이터를 불러오는 방법은 아주 간단한데, 메뉴바에서 데이터 가져오기를 누르면 가지고 올 수 있는 데이터의 리스트가 나오고, 여기서 가장 아래에 있는 자세히를 눌러주면 새로운 창이 나오며 가져올 수 있는 모든 데이터 목록이 나옵니다. 파일은 기본이고 데이터 서버도 연결이 가능하며, 파이썬이나 R로 이루어진 코딩도 지원하니 거의 불러오지 못할 데이터가 없다고 해도 과언이 아닐 정도인데요. 얼마 전 보지 못했던 옆에 베타라고 되어있는..