파워비아이 쿼리 에디터로 데이터를 가져오면 가장 먼저 해야 할 것이 열 이름을 지정하는 것입니다.

 

쿼리는 열 이름을 사용하여 모든 명령을 실행하기 때문에 이를 지정하는 것이 쿼리 에디터에서 데이터 분석을 시작하는 첫걸음입니다.


파워비아이에서 엑셀 파일로부터 데이터를 가져올 때 아래와 같은 경우가 많습니다.

때로는 자동으로 인식해서 열 이름을 알아서 지정하는 때도 있지만 아래의 경우를 볼 수 있습니다.

 

최상의 행이 열 이름으로 지정되며, 보시는 것과 같이 회색 바탕을 두고 있습니다.

현재 열 이름은 Column1, Column2와 같은 형태로 되어있으며, 엄연하게 열 이름을 가지고 있으니 현재 상태로도 Column1, Column2를 열 이름으로 하여 수식을 만들거나 편집하는 데는 아무 문제가 없습니다.

별문제가 없어 보이지만, 마지막 5, 6번째 열에서 숫자와 문자가 섞여 있으므로 작업을 진행할 때 100% 오류가 나올 수 있는 형태의 데이터 테이블입니다.

보기의 열 분포를 선택하면 다른 열과는 다르게 아무것도 표시하지 않는 것을 볼 수 있는데요, 이는 열 구성이 뭔가 이상하다는 것을 단편적으로 보여주는 것이기도 합니다.


여기서 오류가 없는 테이블을 만들려면 2가지 방법이 있는데요, 하나는 첫 번째 열을 지우거나, 다른 하나는 첫 번째 열을 열 이름으로 만드는 것입니다.

변환 > 첫 행을 머리글로 사용 버튼을 이용하면 되는데요.

사용하는 법은 아주 간단한데, 변환 > 첫 행을 머리글로 사용을 누르면 첫 행을 머리글로 사용, 머리글을 첫 행으로 사용 두 가지 옵션이 나오는데요, 둘은 서로 정반대의 명령입니다.

첫 행을 머리글로 사용을 누르면 첫 행이 머리글로 올라와 새로운 열 이름이 지정되고, 보기의 열 분포로 가면 아까와는 다르게 열의 속성을 보여줍니다.


이제 드디어 쿼리 에디터에서 데이터 전처리 작업을 시작할 준비가 완벽하게 되었습니다.

가져온 데이터를 본격적으로 파워비아에서 사용할 수 있는 형태로 변환하기 위한 여러 가지 명령에 대해서도 알아보겠습니다.

 

파워 비아이에서 파워쿼리 에디터로 데이터를 가지고 온 뒤 가장 먼저 확인해야 할 것이 있습니다.

  • 데이터에 오류가 있는지 확인 (셀에 Error로 표시됩니다)
  • 데이터에 결측치가 있는지 확인 (여기서 결측치란 데이터가 누락되거나 계산상의 오류로 인식을 못 하는 경우를 말합니다 - 파워쿼리 에디터에서는 “비어있음”, “NaN”, “빈 문자열”로 표시됩니다)

 

데이터 오류 확인 방법은 아래의 두 가지만 확인하시면 됩니다.

  • 열 품질 확인 (데이터에 오류나 결측치가 있는지 확인)
  • 열 프로필 확인 (좀 더 자세히 열의 정보를 확인)

 

위에서 말씀드린 열 품질 및 열 프로필을 확인하려면 아래와 같이 메뉴에서 보기를 선택하고 데이터 미리 보기 리본에서 열 품질을 선택하면 행이 추가되고, 열 프로필을 선택하면 작업 창 아래에 새로운 창이 추가됩니다.

 

데이터를 수정하는 방법은 다음과 같습니다.

오류 제거

  • 확인
  1. 열 품질 행에서 확인 가능하며, 아래와 같이 Price 열에 오류가 있음을 표시하며 세 번째 행에 Error로 표시가 됩니다. 
  2. Error를 클릭하면 세부정보가 나오는데 여기서는 속성이 숫자인 열에 “A”라는 문자가 입력되어 발생한 오류라고 알려줍니다.

  • 수정
  1. 원 데이터 파일을 열어 A 대신 제대로 된 값을 입력한 뒤 미리 보기 새로 고침을 클릭합니다.
  2. Price 열에서 오른쪽 클릭을 한 뒤 드롭다운 메뉴가 나오면 오류 제거를 선택합니다.

 

결측치 제거

  • 확인
  1. 열 품질 행에서 유효가 100%인지 확인하고, 100%가 아니고 아래에 비어있음이 0%가 아닌 행을 찾습니다.
  2. 해당 열을 선택하면 아래에 열 프로필 창에서 자세히 확인 가능합니다.

 

  • 수정
  1. 원 데이터 파일에서 데이터를 입력한 뒤  미리 보기 새로 고침을 클릭합니다.
  2. 해당 열의 오른쪽에 있는 화살표를 클릭한 뒤 "Null"을 없애줍니다.

 

이런 과정을 거쳐 데이터를 정리한 뒤 전처리 과정으로 들어가셔야 전처리 과정에서 오류도 줄일 수 있으며 양질의 결과를 얻을 수 있으니 반드시 확인하는 습관을 지니시길 바랍니다.

 

+ Recent posts