먼저 데이터 전처리를 시작하기 전 파워쿼리 에디터의 구성에 대해서 잠시 살펴보겠습니다. 엑셀과 비슷하게 생겼지만, 완전히 다른 구조를 가졌으므로 머릿속에서 엑셀에 대한 생각을 지워야 보다 쉽게 다가갈 수 있습니다.

파워쿼리 에디터는 아래와 같이 5개의 영역으로 나눌 수 있습니다.

  1. 쿼리 에디터 리본 (Query Editor Ribbon) - 데이터 수정 작업을 실행하는 명령 버튼 (복잡한 프로그래밍 언어를 간단히 버튼 클릭으로 수행할 수 있도록 도와줍니다) 
  2. 쿼리 창 - 현재 쿼리 에디터에 있는 쿼리 리스트
  3. 작업 창 - 진행된 작업의 결과물을 보여주는 창
  4. 쿼리 설정 - 현재 작업 중인 쿼리 이름과 적용된 단계를 보여주는 창
  5. 상태 바 - 셀에 있는 내용을 보여주는 창

 

작업 창과 적용된 단계에 대해 잠시 말씀드리겠습니다.


작업 창

작업 창은 지금까지 진행된 결과물을 시각화시킨 창으로 사용자가 보다 편하게 결과물을 확인해가며 데이터 변환을 할 수 있도록 도와주는 창으로, 결과물이 친숙한 엑셀 형태로 보여주니 좀 더 직관적으로 작업을 진행할 수 있습니다.

파이썬 (Python)의 경우도 데이터 변환을 수행할 때 Jupyter Notebook을 많이 사용하는데, 이것도 마찬가지로 코딩한 결과물을 파워쿼리 에디터의 작업 창처럼 테이블이나 차트로 바로 보여주는 기능을 가지고 있기 때문에 데이터 전처리 과정에서 많이 사용되는데, 실행한 명령의 결과를 바로 확인하며 작업할 수 있는 환경을 제공한다는 것은 사용자 입장에서는 만점에 가까운 기능이라 할 수 있습니다.


적용된 단계 창

적용된 단계를 보여주는 창은 가장 중요한 부분이라 생각하는데, 지금껏 데이터 변환을 위해 입력한 명령을 단계별로 저장해 어떤 단계를 거쳐 지금의 결과물을 가지고 왔는지 일목요연하게 리스트로 보여줍니다. 적용된 단계는 M-Code (M 언어라고도 합니다)로 구성된 명령어를 수식 창에 보여주며, 이에 대한 결과물은 바로 작업 창에 보여주는 형태입니다. 아주 편한 점은 지금껏 작업한 단계가 그대로 기록이 되기 때문에 원하는 단계로 이동이 가능하다는 것입니다.

위의 이미지와 같이 “탐색’을 선택하면 “탐색” 명령에 사용된  M-Code가 수식 창에 나타나며, “탐색” 명령이 실행된 뒤의 결과물을 동시에 작업 창에 보여줍니다. 이곳에 다른 명령을 추가하고 싶으면 추가도 가능하고, 필요 없는 부분은 삭제도 가능하며, 수정도 가능합니다.


쿼리의 적용된 단계를 설명하자면 글이 너무 길어질 것 같으니 다음번에 자세히 다루도록 하겠습니다.

 

이렇게 구성된 쿼리 에디터를 이용해 데이터 전처리를 진행하여 일반 데이터를 파워비아이가 원하는 데이터로 형태를 바꾸면 파워비아이의 보고서 창에서 데이터 시각화에 사용이 가능하게 됩니다.

 

파워비아이에서 데이터를 분석해 시각화하기 위해서 가장 선행이 되어야 할 것은 외부의 데이터를 파워비아이로 가지고 오는 것입니다.

외부의 데이터가 엑셀이건 엑세스건 웹상에 있는 테이블이건 파워비아이 에서는 아주 다양한 소스의 데이터를 파워비아이로 가지고 올 수 있죠.

이렇게 가지고 온 데이터는 가장 먼저 파워쿼리 에디터라는 툴을 거치게 됩니다.

파워 쿼리 에디터는 엑셀의 형태를 하고 있지만 약간은 다른 형태의 스프레드시트입니다.

엑셀에서도 파워 쿼리를 기본으로 내장하고 있어 복잡한 데이터를 엑셀로 가져와 파워쿼리 내에서 작업을 끝낸 뒤 다시 엑셀로 결과물을 보내어 엑셀 작업을 원활하게 합니다.

파워비아이 에서도 똑같은 절차를 거쳐 복잡한 데이터를 좀 더 간소화한 뒤 파워비아이로 보내서 수식 작업을 원활하게 할 수 있도록 도와줍니다.

데이터를 Import 했다면 아래와 같은 테이블이 보입니다.

사진 설명을 입력하세요.

나중에 천천히 설명을 드리겠지만 위쪽에는 입력 도구로 이루어져 있으며, 아래의 왼쪽은 엑셀의 아래에 있는 탭과 비슷한 것으로 현재의 쿼리를 보여주고, 가운데는 엑셀과 비슷한 형태를 가진 필드이고, 오른쪽은 쿼리의 진행 단계를 보여주는 창으로 구성되어있습니다.

파워쿼리는 엑셀이나 DAX의 수식과는 다른 M-Code 또는 M-Language라는 언어를 사용하고 있으며, 이를 이용하면 수식을 좀 더 유연하고 다채롭게 만들 수 있습니다.

하지만 위쪽에 나열된 입력 도구를 이용하여 데이터를 변환하면, M-Code를 모른다고 해도 큰 무리 없이 데이터를 원하는 방향으로 만들 수 있습니다.

M-Code는 한마디로 정형화된 형태 이외에 약간은 다른 형태를 원하거나, 과정을 좀 더 간소화시키고 싶거나 한 경우에 사용이 되므로 몰라도 큰 불편은 없지만 알아둔다면 많은 도움이 될 수 있습니다.

이처럼 파워쿼리 에디터를 통해 데이터를 최대한 정리한 다음 (피벗, 언피벗 같은...) 이를 다시 파워비아이에 적용을 시켜 본격적인 파워비아이 작업을 하게 되는 것이죠.

여기서 가장 먼저 생각할 것은 데이터를 M-Code를 이용해 변환하는 것이 좋을지, 아니면 업로드를 시킨 뒤 파워비아이의 DAX를 이용해 수식을 사용하는 것이 좋을지를 결정한 뒤 데이터 변환작업을 진행하는 것이 좋습니다.

때로는 M-Code가 때로는 DAX가 더 적합하기 때문이죠.

정답은 없지만, 데이터 분석하기 전 꼭 선행되어야 할 부분이 아닐까 합니다.

다음에는 파워쿼리의 사용 방법과 M-Code에 관련된 사항에 대해서도 글을 올리겠습니다.

'파워쿼리 > 파워쿼리' 카테고리의 다른 글

파워쿼리와 엑셀의 가장 큰 차이점  (4) 2021.03.27

+ Recent posts