본문 바로가기
[스파르타코딩클럽]데이터분석 과정/LEARN

데이터 리터러시 중요성

by doo_ 2024. 1. 3.

(강의 : 데이터 리터러시 KDT 실무형 데이터 분석가 양성과정)

목차 : 데이터 리터리시 - 문제 정의 - 데이터 유형 - 지표 - 결론 도출

[데이터 리터러시]

1. 데이터 리터러시란?

- 데이터를 읽고 이해하고 비판적으로 분석하는 능력

- 그다음 결과를 의사소통에 활용할 수 있는 능력

> 이를 위해 필요한 것

- 데이터 수집과 데이터 원천을 이해 / 데이터에 대한 활용법을 이해 / 데이터를 통한 핵심지표를 이해

> 왜 데이터 리터리시를 길러야 하는가?

데이터 리터러시는 올바른 질문을 던질 수 있도록 만들어 준다. 뚜렷한 목적의식을 갖도록 해준다.

> 데이터 분석 접근법

< 문제 및 가설 정의(생각) -> 데이터 분석(작업) -> 결과 해석 및 액션 도출(생각) >

! 데이터 작업 전 알고 싶은 것을 생각해보는 목적 사고적 방식을 갖는 것이 중요 !

> 데이터 분석에 대한 착각

- 데이터를 잘 분석하면 문제, 목적, 결론이 나올 것이라고 생각

- 데이터를 잘 가공하면 유용한 정보를 얻을 수 있을 거란 착각

- 분석에 실패하면 방법론, 스킬이 부족한 것이라 생각 but 아니다. 대부분 실패 이유는 문제 및 가설 설정 혹은 결론 부분에서 발생한다.

 

2. 분석할 때 주의할 점

> 심슨의 역설 (Simpson's Paradox)

- 부분에서 성립한 대소 관계가 그 부분들을 종합한 전체에 대해서는 성립하지 않는 모순적인 경우를 말한다.

-  전체에 대한 결론이 언제나 개별 집단에 그대로 적용되는 것이 아니다

-  데이터에 기반한 결론이라고 해서 이를 맹목적으로 받아들여서는 안 된다.

> 시각화를 활용한 왜곡

- 자료 표현 방법에 따라 해석의 오류 여지가 존재

> 샘플링 편향 (Sampling Bias)

- 전체를 대표하지 못하는 편향된 샘플 선정으로인해 오류가 발생.  

ex. 여론조사 -> 대규모 여론조사로 240만 명의 응답 -> 분석 결과과 실제 결과랑 다름.

> 상관관계와 인과관계 유의

 

[문제 정의] _ 풀고자 하는 문제를 명확하게 정의하는 단계

1. 문제 정의란

- 분석하려는 특정 상황이나 현상에 대한 명확하고 구체적인 전술

- 목표를 설정하고 분석하는 방향을 정한다. 초석을 다지는 단계

- ' 어떤 문제를 풀고자 하는가?'를 정의

! "문제를 올바르게 정의하였는가?"를 항상 유의할 것 !

2. 문제 정의의 핵심 

> So what?

- 과제의 핵심을 추출하는 작업

> Why so?

- 왜 그렇게 말할 수 있는지, 앞 부분의 타당성을 검증

> tip

- 누구에게 보여주기 위함인지 대상이 누군지 정의

- 결과를 통해 원하는 변화 생각하기

- 경영자의 입장에서 봐보기

- 많은 사람들과 의견을 나눠보는 것도 방법

- 오래 고민해보는 시간을 가져볼 것

 

2. 문제 정의 방법론

1) MECE : Mutually Exclusive, Collectively Exhaustive

- 문제 해결과 분석에서 널리 사용되는 접근 방식

- 문제를 상호 배타적( Mutually Exclusive )이면서 전체적으로 포괄적인( Collectively Exhaustive )구성요소로 나누는 것을 말한다. 

- 복잡한 문제를 체계적으로 분해하고 구조화된 방식으로 분석해보는 접근 방식

2) 로직 트리 Logic Tree

- mece원칙을 기반으로 복잡한 문제를 더 간단하게

> 로직트리 cheat sheet : nescafe의 로직트리

 

[ 데이터 유형 ]

1. 정성적 vs 정량적

1) 정성적 데이터 (Quality Data)

- 텍스트, 비디오, 오디오 형태이며 감정, 태도와 같은 주관적 요소

- 그래서 정형되지 않고 구조화 되어있지 않다. (구조화가 어려움)

- 새로운 현상이나 개념에 대한 이해를 심화하는데 사용함.

2) 정량적 데이터 (Quantitative Data)

- 수치적으로 표현되는 정보인 객관적 요소

- 통계, 지표 분석 등에 용이

> 두 가지 데이터를 적절하게 활용해야 한다. 

 

[ 지표 설정 ]

1. 지표란?

- 목표나 성과를 측정하기 위한 구체적이고 측정 가능한 기준

- 목표 달성도를 평가하고 전략적 결정에 필요한 핵심 정보 제공

- 정의한 문제 파악을 위해 필요

- '어떤 결과를 기대하는가?'에 대한 정량화된 기준

 

2. 자주 사용되는 주요 지표

1) 활성유저( Active User )

- 서비스마다 정의가 다 다르다. 그래서 정의에 따라 전략과 방향이 달라진다.

-  '이탈 유저'로 정의가 되기도 한다.

- 서비스 지표에 중요한 역할

ex. 전체 / 서비스별 / DAU / WAU / MAU / 이탈율

 

2) 재방문율(Retention Ratio) 

- 몇 %유저가 우리 서비스를 다시 아용하는지 보는 지표

- 앱 서비스 성장에 있어 중요

- 서비스의 특성에 따라 '활성'의 기준을 다르게 정의할 수 있다.

- 일반적인 리텐션은 시간이 지남에 따라 자연스럽게 감소 (Product B)

- 기울기가 점점 완만해지며 안정화 되는 그래프를 가지고 있다면 시장에 적합한 서비스 (Product A)

a. N-Day 리텐션

- 최초 사용일로부터 N일 후에 재방문한 Active User의 비율

- 일반적으로 사용한느 리텐션 지표는 N-Day리텐션

- 습관적으로 사용하거나 반복적으로 행동을 유도하는 제품에 적합

- 사용자가 매일 접속하는 서비스에 사용하는 지표

ex. 카카오톡, 게임, 인스타그램 등

- but 서비스 사용 주기가 긴 경우 실제보다 더 과소평가하는 한계가 존재.

- 사용 주기가 긴 서비스에 적용할 경우 불필요한 할인, 푸쉬 메시지 발송 등 잘못된 액션을 할 가능성이 존재

b. Unbounded 리텐션

- 특정 날짜를 포함하여 그 이후에 재방문한 유저의 비율

- 특정일을 포함하여 그 이후에 한 번이라도 재방문한 유저의 비율

- 정기적으로 반복해서 방문하는 서비스가 아닐 경우 적합

ex. 채용 사이트, 쇼핑몰, 부동산 매물 서비스 등 사용주기가 긴 서비스

- 이탈율의 반대개념

- 한계로는, 계속 접속하지 않던 유저가 접속할 경우, 이 전의 리텐션 값들이 전부 변동되는 상황이 발생한다.

- 절대적인 수치보다는 지표가 어떻게 변화하는 지에 대해 트렌드를 보는 용도로 활용하는 것을 권장한다. 

c. Bracket 리텐션

- 설정한 특정 기간을 기반으로 재방문율을 측정

- N-Day리텐션을 확장한 개념으로 일/주/월 단위가 아닌 지정한 구간으로 나눈다.

- 활성유저가 특정한 활동을 위해 각 Bracket 내 서비스에 재방문시 잔존 유저로 해석

- 서비스 사용주기가 길거나 주기적인 경우 적합한 지표

ex. 식료품 배달 서비스, 세차 서비

> 리텐션에 대한 이해

리텐션이 높은 세그먼트 발굴하는 작업이 필요

서비스 사용 주기에 따라 리텐션 조회 기간을 늘려야 한다.

사후 분석 시에 용이 

 

3) 퍼널( Funnel)

- 유저들이 어디서 이탈하는가? 즉 각 단계 전환율을 측정한다.

- 퍼널은 잠재고객을 유입시키고 최종적인 목표 액션을 달성할 때까지의 과정 

> AARRR

- 디지털 마케팅시 활용하는 프레임워크로 단계별 전환율을 지표화하여 서비스 보완 지점을 찾는다.

Acquisition : 유입

Activation : 활성화
Retention : 재방문

Revenue : 수익

Referral : 추천

 

4) 고객평생가치 (LTV : Life time Value)

- 해당 유저가 우리에게 생애 주기 동안 얼마만큼의 이익을 주는지 정량적으로 지표화 한 것

- LTV가 높다는 것은 고객과 서비스 간 관계가 좋으며 충성 고객이 많다는 것을 알 수 있다.

- 서비스마다 관점이 다르기 때문에 정해진 공식은 없다. 그래서 자사 서비스에 따라 사용 주기, 변수, 객단가 등 다각도로 고려할 필요가 있다.

- LTV는 가정을 베이스로 하는 지표이기 떄문에 꾸준한 모니터링이 필요!

 

5) 북극성 지표

- 제품/서비스의 '성공'을 정의

- 즉 사업 목표이자 선행지표로 무엇에 집중해야 할지 방향을 잡아준다.

- 제품/서비스가 유저에게 주는 Core Value를 잘 나타낸 것

> 좋은 북극성 지표를 위한 체크리스트

v 유저가 목적을 달성하는 때가 언제인가? (직접 가치를 느낄 수 있는 지표인가)

v 모든 유저가 해당되나? (유저의 전체 여정을 반영하는가

v 측정 가능한 지표인가?

v 측정 주기가 적절한가?

v 외부 요인으로부터 영향을 많이 받진 않는가? (많이 받지 않는 지표여야 한다)

v 북극성지표의 성장이 사업의 성장과 함께하는가?

v AARRR 퍼널 전 과정이 북극성 지표에 영향을 주는가?

v 북극성 지표의 변화가 적어도 매주 관찰가능한가?

 

[ 결론 도출 ] 

1. 결과와 결론

> 결과 (What)

- 데이터 분석 후 얻은 구체적인 데이터 출력값

- 계산과 분석을 해서 나온 결과물

> 결론(What so)

- 결과를 바탕으로 이끌어낸 의미나 통찰

- 목적에 대해어떤 의미가 있는지 설명하는 것 (그것이 왜 중요한지)

   - > 결론 도출 시 논리적인 스토리텔링 필요 but 주관은 주의

 

2. 결론을 잘 정리하는 법

> 목적 / 대상 등 문제 정의 단계 명확하게 정의

> 단순하고 쉽게 전달 ( 핵심 지표 위주로) 그리고 액션 아이템 제안이 핵심

> 흥미유발 : 궁금할 내용만 담기 ( 디테일한 문서는 따로 공유)

> 대상자 관점에서의 접근

- 지식의 저주에 빠지지 않고 논지를 뒷받침 해줄 자료들을 함께 첨부

> 대상자의 허들이 낮은 시각화 활용

- 시각화 팁 : 대상이 직관적으로 이해할 수 있도록 구성할 것

 

< 결론 보고서에 쓰면 좋은 플로우 ex >

1. 전체 내용을 한 문장으로 정리 요약

2. 해당 보고서의 메인 주제

3. 해당 보고서를 쓴 이유와 원하는 변화

4. 문제 정의

5. 핵심 내용 전개

6. 결론 및 액션 아이템

 

[결론] 결국 데이터 리터러시란?

- 스스로 목적과 문제를 정의해 데이터를 활용하여 결론을 도출하는 것

- 그 족적을 달성하는데 필요한 데이터와 지표를 설정할줄 아는 것

- 데이터를 어떻게 봐야 문제 정보를 효과적으로 얻는 것