본문 바로가기
[스파르타코딩클럽]데이터분석 과정/LEARN

[데이터 시각화] Tableau 기초 강의 공부 (1)

by doo_ 2024. 2. 21.

1. 비즈니스 인텔리전스( BI : Business Intelligence)란?

더보기

[비즈니스 인텔리전스( BI : Business Intelligence)란?]

- 조직이 좀 더 데이터 기반의 의사 결정을 빠르게 할 수 있도록 서포트하는 비즈니스 분석, 데이터 마이닝, 데이터 시각화, 데이터 도구를 말한다.

> 다양한 BI툴

- Google Looker Studio / - Microsoft PowerBI / Redash / Apache Superset / MicroStrategy(MSTR)

> 프로덕트 대시보드 툴

- Google Analytics 4 / Amplitude / Mixpanel

> 데이터 분석가에게 실무 요청 업무 예시

- 대시보드 지표 변화 체크, 대시보드 구축 프로젝트

- 데이터 분석 레포트 리뷰

- 주간 월간 분기별 KPI 대시보드
- 데일리 KPI 지표들을 직관적으로 시각화하기
- 엑셀 시트에 있는 대시보드를 하나의 BI 대시보드로 자동화 요청
- 이번 UI 테스트 실험 A/B 테스트 결과를 모니터링

> 배운 용어정리

- ad-hoc : 라틴어로 "for this particular purpose"라는 뜻이다. 즉 특정한 상황 속에서만 해결책이 되고 일반화될 수 없는 해답을 말한다.

- 데이터 인프라

a. 데이터 레이크: 모든 Raw data(정형 데이터, 로그 데이터, 테이블 등) 저장할 수 있는 스토리지
b. 데이터 웨어하우스(DW): 데이터를 장기적인 보존용으로 통합, 정제, 분석하여 정리한 저장소
예) AWS Redshift, Snowflake, Google Bigquery
c. 데이터 마트(DM): 부서별, 목적별 분석용으로 만든 데이터 웨어하우스의 데이터 일부분

 

2. Tableau 다뤄보기

> 실습환경 세팅 및 기본 구성 이해하는 시간

 

3. 데이터 시각화

> 시각화 치트시트

더보기

치트 시트 출처 : Tableau

[그래프 표현 방식 종류]

> 텍스트 테이블 / 히트맵 / 맵 차트 / 파이 차트 / 막대 차트 / 트리맵 / 라인 차트 / 영역 차트 / 분산형 차트 / 박스 플랏

> 다양한 그래프 시각화 그려보기 + 대시보드 활용

4. 계산식 활용하기

> 텍스트 테이블

- wide format table : 상관관계를 볼 때 유용

- long format table : 시간의 따른 변화를 볼 때 유용

> 태블로에 다양한 종류의 필터, 작동 순서가 다르기 때문에 유의!

더보기

추출 - 데이터 원본 - 컨텍스트 - 차원 - 측정값 - 테이블 계산 순

출처 : Tableau

> 계산과 필터의 작동 순서(작업할 때 유의)

> 계층과 드릴 다운

> 퀵테이블 구성 : 빠르게 계산을 가

> 태블로 함수

- 공식문처 참고

 

> LOD식 활용하기

- LOD(세부 수준)식이란? 현재 화면에 영향을 받지 않고 원하는 세부 수준에서 값을 계산하는 것을 말한다

- INCLUDE, EXCLUDE, FIXED 크게 3가지로 나뉜다. 실무에서는 FIXED를 많이 사용

{ [FIXED | INCLUDE | EXCLUDE] [차원1], [차원2] : AVG([측정값]) }

더보기
include

5. 대시보드 구축

> 구축 프로세스

더보기

1. 대시보드 뷰어 및 목적 선정

> 누가 보는 대시보드인가? 누가 보는지에 따라 지표가 많이 다름

2. 문제 정의

- 어떤 목적으로 쓰는 대시보드인가? 프로덕트? KPI? 등 목적을 확실히 설정

3. 필요한 데이터 선정 및 데이터 마트 구축

4. 지표 선정

5. 스케치

6. 시각화

7. 대시보드 완성

8. 대시보드에서 이끌어내는 액션

9. 완성된 대시보드 게시 또는 대시보드팀 뷰어 권한 부여

> 비즈니스별 지표 선정

- 지표는 다양한 산업(이커머스 모빌리티 등)에서 활용되고 있다. 산업과 주요 비즈니스 모델에 따라 자주 발생하는 문제와 핵심 지표가 달라진다.

> input metric을 통해 output metric으로 이어지는 구조

ex. spotify

input(bring users back more often & increase time spent pere session) -> ouput(Time spent listening to music)

 

> 메트릭 하이라키

- 연습문제

더보기

[연습 문제] 

Superstore 데이터를 활용해서 2023년 매출을 증대를 목표로 하는 상황으로 가정해봅시다. 가장 중요한 지표 3가지를 선정해주세요

> 대시보드 기능 : 바둑판식 기능과 부동 기능

+ 피그마와 부동 기능을 활용해 조금 더 전문적이고 깔끔한 대시보드 레이아웃을 만들 수 있다.

> 데시보드 설계

1) 대시보드 구조화

- 계층 구조화

- Z패턴

2) 데시보드 스케치(초안)

더보기
예시

> 전주의적 속성 : 직관적인 시각화 속성

> 컬러는 직관적으로 볼 수 있게 조합할 것

+ 컬러조합사이트 : Canva  / color-bex / colormind / colorate