“우리 회사의 이번 달 총 매출은 얼마일까요?”
“어떤 금융 상품이 사용자들에게 가장 인기가 많을까요?”
경영진은 이러한 질문에 답하기 위해, 매일 아침 ‘BI(Business Intelligence)’ 대시보드를 봅니다.
만약 이 대시보드에 표시되는 숫자가 틀렸다면, 회사는 완전히 잘못된 비즈니스 의사결정을 내릴 수 있습니다.
이 데이터의 최종 신뢰성을 보증하는 것이 바로 ‘데이터 웨어하우스 및 BI 테스트’입니다.

이 글에서 다루는 것
- 데이터 웨어하우스(DW)와 BI의 개념
- ETL 테스트의 중요성
- 데이터 검증을 위한 QA의 역할
- BI 리포트/대시보드 테스트 체크리스트
‘데이터 웨어하우스(DW)’, 정확히 무엇인가요?
‘데이터 웨어하우스’는 올바른 의사결정을 돕기 위해, 회사의 여러 운영 시스템(거래 DB, 고객 DB 등)에서 데이터를 모아, 주제별로 통합하고 저장하는 ‘중앙 데이터 저장소’입니다.
- 비유:
- ‘도서관’과 같습니다.
- 여러 출판사(운영 시스템)에서 나온 책(데이터)들을, 주제별(역사, 과학, 문학)로 잘 정리하여 보관합니다.
- 이를 통해 독자(분석가, 경영진)가 필요한 정보를 쉽게 찾아보고, 깊이 있는 통찰(인사이트)을 얻을 수 있도록 만든 공간입니다.
데이터는 어떻게 웨어하우스로 들어오나요? (ETL 프로세스)
데이터는 보통 ‘ETL’이라는 과정을 거쳐 데이터 웨어하우스로 들어옵니다.
QA는 이 과정 전체를 꼼꼼하게 테스트해야 합니다.
- ETL 이란?
- Extract (추출):
- 여러 운영 DB에서 필요한 데이터를 가져오는 단계입니다.
- Transform (변환):
- 가져온 데이터를 분석하기 좋은 형태로 가공하고 통합하는 단계입니다.
- 예: ‘M’/’F’를 ‘남성’/’여성’으로 변환, 여러 테이블의 데이터를 합치는(JOIN) 작업 등
- Load (적재):
- 최종적으로 변환된 데이터를 데이터 웨어하우스에 저장하는 단계입니다.
- Extract (추출):
‘ETL 테스트’는 이 과정에서 데이터가 유실되거나, 잘못 변환되거나, 중복으로 저장되지 않았는지 검증하는 핵심 품질 활동입니다.
QA는 ETL 과정을 어떻게 테스트하나요?
‘ETL 테스트’는 UI가 없는 순수한 데이터 검증 작업입니다.
QA는 주로 SQL 쿼리를 사용하여, 원본 데이터와 최종 결과 데이터를 직접 비교합니다.
- 주요 검증 항목:
- 데이터 완전성 검증 (Completeness):
- 원본 시스템의 데이터 건수와, 최종적으로 데이터 웨어하우스에 적재된 데이터의 건수가 정확히 일치하는가?
- (예:
SELECT COUNT(*)쿼리로 두 시스템의 총 row 수를 비교)
- 데이터 변환 검증 (Transformation):
- 데이터가 정해진 비즈니스 규칙에 따라 정확하게 변환되었는가?
- 예: 원본의 ‘USD’ 통화 금액이, 그날의 환율을 정확히 적용하여 ‘KRW’ 금액으로 잘 변환되었는가?
- 데이터 중복 검증 (Uniqueness):
- 중복되어서는 안 되는 고유한 데이터(예: 주문 ID)가, ETL 과정에서 중복으로 적재되지는 않았는가?
- 데이터 정확성 검증 (Accuracy):
- 원본 데이터와 최종 데이터를 무작위로 샘플링하여, 각 컬럼의 값이 1:1로 정확하게 일치하는지 비교 검증합니다.
- 데이터 완전성 검증 (Completeness):
‘BI 리포트/대시보드’는 어떻게 테스트하나요?
최종 사용자인 경영진이나 데이터 분석가가 보는 화면을 테스트합니다.
- 주요 검증 항목:
- 데이터 정확성:
- 대시보드에 표시되는 핵심 숫자(총 매출, 일일 사용자 수 등)가, 데이터 웨어하우스를 직접 조회(SQL)한 결과와 정확히 일치하는가?
- 시각화 검증:
- 차트, 그래프 등이 깨지거나, 축의 이름이 잘못 표시되거나, 사용자가 오해를 불러일으키는 방식으로 표시되지는 않는가?
- 필터 및 드릴다운 기능:
- ‘최근 한 달’과 같이 날짜 필터를 적용하거나, 특정 조건을 필터링했을 때, 데이터가 올바르게 동적으로 변경되는가?
- 성능:
- 대시보드를 처음 로딩하거나 필터를 적용하는 데 너무 오랜 시간이 걸리지는 않는가?
- 데이터 정확성:
결론: 올바른 의사결정을 위한 신뢰 보증
‘데이터 웨어하우스’와 ‘BI 테스트’는 서비스의 ‘과거와 현재’를 분석하여 ‘미래’를 결정하는, 회사의 두뇌와 눈을 검증하는 일입니다.
이 영역에서 QA의 역할은 단순히 버그를 찾는 것을 넘어섭니다.
회사가 데이터를 기반으로 ‘올바른 의사결정’을 내릴 수 있도록, 데이터의 신뢰성 자체를 보증하는 것입니다.
데이터의 정확성을 책임지는 QA는, 비즈니스의 성장에 직접적으로 기여하는 핵심적인 전략가입니다.
부록: DW/BI 테스트 미니 체크리스트 ✅
- ETL 작업이 실패했을 때, 알림 및 재처리 프로세스가 존재하는가?
- 원본 데이터베이스와 데이터 웨어하우스 간의 데이터 정합성(건수, 총합 등)이 맞는가?
- BI 대시보드에 표시되는 숫자와, DW의 원본 데이터를 직접 조회한 결과가 일치하는가?
- 리포트의 모든 필터, 정렬, 드릴다운 기능이 올바르게 동작하는가?
- 데이터 접근 권한이 사용자 역할별로 올바르게 통제되는가?
참고 자료 (References)
- 우아한형제들 기술블로그 – 우아한 데이터 이야기 (국내 데이터 플랫폼 구축 사례):
https://techblog.woowahan.com/2646