(강의 : 데이터 리터러시 KDT 실무형 데이터 분석가 양성과정)
목차 : 데이터 리터리시 - 문제 정의 - 데이터 유형 - 지표 - 결론 도출
[데이터 리터러시]
1. 데이터 리터러시란?
- 데이터를 읽고 이해하고 비판적으로 분석하는 능력
- 그다음 결과를 의사소통에 활용할 수 있는 능력
> 이를 위해 필요한 것
- 데이터 수집과 데이터 원천을 이해 / 데이터에 대한 활용법을 이해 / 데이터를 통한 핵심지표를 이해
> 왜 데이터 리터리시를 길러야 하는가?
데이터 리터러시는 올바른 질문을 던질 수 있도록 만들어 준다. 뚜렷한 목적의식을 갖도록 해준다.
> 데이터 분석 접근법
< 문제 및 가설 정의(생각) -> 데이터 분석(작업) -> 결과 해석 및 액션 도출(생각) >
! 데이터 작업 전 알고 싶은 것을 생각해보는 목적 사고적 방식을 갖는 것이 중요 !
> 데이터 분석에 대한 착각
- 데이터를 잘 분석하면 문제, 목적, 결론이 나올 것이라고 생각
- 데이터를 잘 가공하면 유용한 정보를 얻을 수 있을 거란 착각
- 분석에 실패하면 방법론, 스킬이 부족한 것이라 생각 but 아니다. 대부분 실패 이유는 문제 및 가설 설정 혹은 결론 부분에서 발생한다.
2. 분석할 때 주의할 점
> 심슨의 역설 (Simpson's Paradox)
- 부분에서 성립한 대소 관계가 그 부분들을 종합한 전체에 대해서는 성립하지 않는 모순적인 경우를 말한다.
- 전체에 대한 결론이 언제나 개별 집단에 그대로 적용되는 것이 아니다
- 데이터에 기반한 결론이라고 해서 이를 맹목적으로 받아들여서는 안 된다.
> 시각화를 활용한 왜곡
- 자료 표현 방법에 따라 해석의 오류 여지가 존재
> 샘플링 편향 (Sampling Bias)
- 전체를 대표하지 못하는 편향된 샘플 선정으로인해 오류가 발생.
ex. 여론조사 -> 대규모 여론조사로 240만 명의 응답 -> 분석 결과과 실제 결과랑 다름.
> 상관관계와 인과관계 유의
[문제 정의] _ 풀고자 하는 문제를 명확하게 정의하는 단계
1. 문제 정의란
- 분석하려는 특정 상황이나 현상에 대한 명확하고 구체적인 전술
- 목표를 설정하고 분석하는 방향을 정한다. 초석을 다지는 단계
- ' 어떤 문제를 풀고자 하는가?'를 정의
! "문제를 올바르게 정의하였는가?"를 항상 유의할 것 !
2. 문제 정의의 핵심
> So what?
- 과제의 핵심을 추출하는 작업
> Why so?
- 왜 그렇게 말할 수 있는지, 앞 부분의 타당성을 검증
> tip
- 누구에게 보여주기 위함인지 대상이 누군지 정의
- 결과를 통해 원하는 변화 생각하기
- 경영자의 입장에서 봐보기
- 많은 사람들과 의견을 나눠보는 것도 방법
- 오래 고민해보는 시간을 가져볼 것
2. 문제 정의 방법론
1) MECE : Mutually Exclusive, Collectively Exhaustive
- 문제 해결과 분석에서 널리 사용되는 접근 방식
- 문제를 상호 배타적( Mutually Exclusive )이면서 전체적으로 포괄적인( Collectively Exhaustive )구성요소로 나누는 것을 말한다.
- 복잡한 문제를 체계적으로 분해하고 구조화된 방식으로 분석해보는 접근 방식
2) 로직 트리 Logic Tree
- mece원칙을 기반으로 복잡한 문제를 더 간단하게
> 로직트리 cheat sheet : nescafe의 로직트리
[ 데이터 유형 ]
1. 정성적 vs 정량적
1) 정성적 데이터 (Quality Data)
- 텍스트, 비디오, 오디오 형태이며 감정, 태도와 같은 주관적 요소
- 그래서 정형되지 않고 구조화 되어있지 않다. (구조화가 어려움)
- 새로운 현상이나 개념에 대한 이해를 심화하는데 사용함.
2) 정량적 데이터 (Quantitative Data)
- 수치적으로 표현되는 정보인 객관적 요소
- 통계, 지표 분석 등에 용이
> 두 가지 데이터를 적절하게 활용해야 한다.
[ 지표 설정 ]
1. 지표란?
- 목표나 성과를 측정하기 위한 구체적이고 측정 가능한 기준
- 목표 달성도를 평가하고 전략적 결정에 필요한 핵심 정보 제공
- 정의한 문제 파악을 위해 필요
- '어떤 결과를 기대하는가?'에 대한 정량화된 기준
2. 자주 사용되는 주요 지표
1) 활성유저( Active User )
- 서비스마다 정의가 다 다르다. 그래서 정의에 따라 전략과 방향이 달라진다.
- '이탈 유저'로 정의가 되기도 한다.
- 서비스 지표에 중요한 역할
ex. 전체 / 서비스별 / DAU / WAU / MAU / 이탈율
2) 재방문율(Retention Ratio)
- 몇 %유저가 우리 서비스를 다시 아용하는지 보는 지표
- 앱 서비스 성장에 있어 중요
- 서비스의 특성에 따라 '활성'의 기준을 다르게 정의할 수 있다.
- 일반적인 리텐션은 시간이 지남에 따라 자연스럽게 감소 (Product B)
- 기울기가 점점 완만해지며 안정화 되는 그래프를 가지고 있다면 시장에 적합한 서비스 (Product A)
a. N-Day 리텐션
- 최초 사용일로부터 N일 후에 재방문한 Active User의 비율
- 일반적으로 사용한느 리텐션 지표는 N-Day리텐션
- 습관적으로 사용하거나 반복적으로 행동을 유도하는 제품에 적합
- 사용자가 매일 접속하는 서비스에 사용하는 지표
ex. 카카오톡, 게임, 인스타그램 등
- but 서비스 사용 주기가 긴 경우 실제보다 더 과소평가하는 한계가 존재.
- 사용 주기가 긴 서비스에 적용할 경우 불필요한 할인, 푸쉬 메시지 발송 등 잘못된 액션을 할 가능성이 존재
b. Unbounded 리텐션
- 특정 날짜를 포함하여 그 이후에 재방문한 유저의 비율
- 특정일을 포함하여 그 이후에 한 번이라도 재방문한 유저의 비율
- 정기적으로 반복해서 방문하는 서비스가 아닐 경우 적합
ex. 채용 사이트, 쇼핑몰, 부동산 매물 서비스 등 사용주기가 긴 서비스
- 이탈율의 반대개념
- 한계로는, 계속 접속하지 않던 유저가 접속할 경우, 이 전의 리텐션 값들이 전부 변동되는 상황이 발생한다.
- 절대적인 수치보다는 지표가 어떻게 변화하는 지에 대해 트렌드를 보는 용도로 활용하는 것을 권장한다.
c. Bracket 리텐션
- 설정한 특정 기간을 기반으로 재방문율을 측정
- N-Day리텐션을 확장한 개념으로 일/주/월 단위가 아닌 지정한 구간으로 나눈다.
- 활성유저가 특정한 활동을 위해 각 Bracket 내 서비스에 재방문시 잔존 유저로 해석
- 서비스 사용주기가 길거나 주기적인 경우 적합한 지표
ex. 식료품 배달 서비스, 세차 서비
> 리텐션에 대한 이해
리텐션이 높은 세그먼트 발굴하는 작업이 필요
서비스 사용 주기에 따라 리텐션 조회 기간을 늘려야 한다.
사후 분석 시에 용이
3) 퍼널( Funnel)
- 유저들이 어디서 이탈하는가? 즉 각 단계 전환율을 측정한다.
- 퍼널은 잠재고객을 유입시키고 최종적인 목표 액션을 달성할 때까지의 과정
> AARRR
- 디지털 마케팅시 활용하는 프레임워크로 단계별 전환율을 지표화하여 서비스 보완 지점을 찾는다.
Acquisition : 유입
Activation : 활성화
Retention : 재방문
Revenue : 수익
Referral : 추천
4) 고객평생가치 (LTV : Life time Value)
- 해당 유저가 우리에게 생애 주기 동안 얼마만큼의 이익을 주는지 정량적으로 지표화 한 것
- LTV가 높다는 것은 고객과 서비스 간 관계가 좋으며 충성 고객이 많다는 것을 알 수 있다.
- 서비스마다 관점이 다르기 때문에 정해진 공식은 없다. 그래서 자사 서비스에 따라 사용 주기, 변수, 객단가 등 다각도로 고려할 필요가 있다.
- LTV는 가정을 베이스로 하는 지표이기 떄문에 꾸준한 모니터링이 필요!
5) 북극성 지표
- 제품/서비스의 '성공'을 정의
- 즉 사업 목표이자 선행지표로 무엇에 집중해야 할지 방향을 잡아준다.
- 제품/서비스가 유저에게 주는 Core Value를 잘 나타낸 것
> 좋은 북극성 지표를 위한 체크리스트
v 유저가 목적을 달성하는 때가 언제인가? (직접 가치를 느낄 수 있는 지표인가)
v 모든 유저가 해당되나? (유저의 전체 여정을 반영하는가
v 측정 가능한 지표인가?
v 측정 주기가 적절한가?
v 외부 요인으로부터 영향을 많이 받진 않는가? (많이 받지 않는 지표여야 한다)
v 북극성지표의 성장이 사업의 성장과 함께하는가?
v AARRR 퍼널 전 과정이 북극성 지표에 영향을 주는가?
v 북극성 지표의 변화가 적어도 매주 관찰가능한가?
[ 결론 도출 ]
1. 결과와 결론
> 결과 (What)
- 데이터 분석 후 얻은 구체적인 데이터 출력값
- 계산과 분석을 해서 나온 결과물
> 결론(What so)
- 결과를 바탕으로 이끌어낸 의미나 통찰
- 목적에 대해어떤 의미가 있는지 설명하는 것 (그것이 왜 중요한지)
- > 결론 도출 시 논리적인 스토리텔링 필요 but 주관은 주의
2. 결론을 잘 정리하는 법
> 목적 / 대상 등 문제 정의 단계 명확하게 정의
> 단순하고 쉽게 전달 ( 핵심 지표 위주로) 그리고 액션 아이템 제안이 핵심
> 흥미유발 : 궁금할 내용만 담기 ( 디테일한 문서는 따로 공유)
> 대상자 관점에서의 접근
- 지식의 저주에 빠지지 않고 논지를 뒷받침 해줄 자료들을 함께 첨부
> 대상자의 허들이 낮은 시각화 활용
- 시각화 팁 : 대상이 직관적으로 이해할 수 있도록 구성할 것
< 결론 보고서에 쓰면 좋은 플로우 ex >
1. 전체 내용을 한 문장으로 정리 요약
2. 해당 보고서의 메인 주제
3. 해당 보고서를 쓴 이유와 원하는 변화
4. 문제 정의
5. 핵심 내용 전개
6. 결론 및 액션 아이템
[결론] 결국 데이터 리터러시란?
- 스스로 목적과 문제를 정의해 데이터를 활용하여 결론을 도출하는 것
- 그 족적을 달성하는데 필요한 데이터와 지표를 설정할줄 아는 것
- 데이터를 어떻게 봐야 문제 정보를 효과적으로 얻는 것
'[스파르타코딩클럽]데이터분석 과정 > LEARN' 카테고리의 다른 글
SQLD 공부 (2) 데이터 모델과 SQL (0) | 2024.02.21 |
---|---|
SQLD 공부 (1) 데이터베이스 모델링 / 엔터티 / 속성 (0) | 2024.02.20 |
데이터 분석가 채용공고를 읽고 역량 키워드 정리하기 (0) | 2024.01.23 |
국내 여행과 관련해 트렌드 조사 (0) | 2024.01.14 |
[용어공부] 고객 생애 가치(LTV) (0) | 2024.01.01 |