파워 비아이에서 파워쿼리 에디터로 데이터를 가지고 온 뒤 가장 먼저 확인해야 할 것이 있습니다.
- 데이터에 오류가 있는지 확인 (셀에 Error로 표시됩니다)
- 데이터에 결측치가 있는지 확인 (여기서 결측치란 데이터가 누락되거나 계산상의 오류로 인식을 못 하는 경우를 말합니다 - 파워쿼리 에디터에서는 “비어있음”, “NaN”, “빈 문자열”로 표시됩니다)
데이터 오류 확인 방법은 아래의 두 가지만 확인하시면 됩니다.
- 열 품질 확인 (데이터에 오류나 결측치가 있는지 확인)
- 열 프로필 확인 (좀 더 자세히 열의 정보를 확인)
위에서 말씀드린 열 품질 및 열 프로필을 확인하려면 아래와 같이 메뉴에서 보기를 선택하고 데이터 미리 보기 리본에서 열 품질을 선택하면 행이 추가되고, 열 프로필을 선택하면 작업 창 아래에 새로운 창이 추가됩니다.
데이터를 수정하는 방법은 다음과 같습니다.
오류 제거
- 확인
- 열 품질 행에서 확인 가능하며, 아래와 같이 Price 열에 오류가 있음을 표시하며 세 번째 행에 Error로 표시가 됩니다.
- Error를 클릭하면 세부정보가 나오는데 여기서는 속성이 숫자인 열에 “A”라는 문자가 입력되어 발생한 오류라고 알려줍니다.
- 수정
- 원 데이터 파일을 열어 A 대신 제대로 된 값을 입력한 뒤 미리 보기 새로 고침을 클릭합니다.
- Price 열에서 오른쪽 클릭을 한 뒤 드롭다운 메뉴가 나오면 오류 제거를 선택합니다.
결측치 제거
- 확인
- 열 품질 행에서 유효가 100%인지 확인하고, 100%가 아니고 아래에 비어있음이 0%가 아닌 행을 찾습니다.
- 해당 열을 선택하면 아래에 열 프로필 창에서 자세히 확인 가능합니다.
- 수정
- 원 데이터 파일에서 데이터를 입력한 뒤 미리 보기 새로 고침을 클릭합니다.
- 해당 열의 오른쪽에 있는 화살표를 클릭한 뒤 "Null"을 없애줍니다.
이런 과정을 거쳐 데이터를 정리한 뒤 전처리 과정으로 들어가셔야 전처리 과정에서 오류도 줄일 수 있으며 양질의 결과를 얻을 수 있으니 반드시 확인하는 습관을 지니시길 바랍니다.
'파워쿼리 > 데이터 전처리와 파워쿼리' 카테고리의 다른 글
데이터 분석의 시작 - 첫 행을 머리글로 올려 열 이름 지정하기 (0) | 2023.03.04 |
---|---|
데이터 전처리 입력 도구 - 파워쿼리 에디터 리본과 데이터 보기의 DAX (0) | 2023.03.03 |
파워쿼리 에디터 - 적용된 단계 창에서 알아 두어야 할것 (0) | 2021.12.20 |
파워쿼리 에디터의 구성 (0) | 2021.12.16 |
데이터 전처리의 첫번째 단계 - 파워쿼리 에디터에 데이터 가지고 오기 (0) | 2021.12.13 |