데이터 리터리시
- 데이터를 효과적으로 이해, 분석 및 해석하여 의사결정에 활용하는 능력
- 이는 데이터를 읽고, 이해하며, 데이터에 기반하여 의사결정을 내릴 수 있는 역량
데이터(ex. 고객 설문조사의 응답, 판매 기록)
- 관찰, 측정 또는 질문을 통해 수집된 사실이나 수치의 집합
- 가장 기본적인 형태로, 데이터는 현실 세계에 대한 원시 정보를 제공한다.
- 분석되지 않은 상태에서는 종종 의미를 갖지 않는다.
DATA > INFORMATION > KNOWLEDGE
- DATA : 원시적 형태의 사실과 수치, 데이터는 구조화되지 않았거나 분석되지 않았기 때문에 그 자체로 큰 의미 X
- INFORMATION : 데이터를 처리하고 조직화하여 얻은 결과물, 웹사이트 방문자 데이터를 일별, 주별, 월별 방문자 수로 정리하는 것
- KNOWLEDGE : 정보를 분석하고 해석하여 얻은 이해, 정보를 바탕으로 패턴이나 경향을 식별하고, 원인과 결과를 이해하는 데 도움을 준다.
- IINSIGHT : 지식을 바탕으로 더 깊은 이해를 얻어내고, 미래를 예측하거나 행동을 지시할 수 있는 귀중한 결론
데이터 활용 예시
(1) 현상 이해와 패턴 발견
ex. 온라인 쇼핑몰의 판매 데이터를 분석했더니, 겨울 의류와 선물 용품의 판매가 크게 증가하는 패턴을 발견했다.
(2) 서비스의 핵심 지표 정의 및 성장성 평가
ex. 방문자 대비 구매 전환율을 측정하여 가장 전환율이 높은 상품 카테고리를 확인했다.
(3) 매출과 비용 관리
ex. 광고 캠페인별 ROI를 분석한 결과, 일부 캠페인에 더 많은 예산을 할당했다.
(4) 데이터 기반 의사결정
ex. 고객 설문조사 데이터를 분석하여 고객들이 무료 배송 서비스를 원한다는 것을 알았다.
(5) 업무 자동화
ex. 매일 반복되는 재고 관리 작업을 자동화하여, 재고 부족으로 인한 판매 기회 손실을 줄였다.
데이터 의사 결정
(1) 직관 기반 의사 결정 : 개인의 경험, 직감, 감정 기반하여 의사 결정
- 데이터를 주관적으로 해석할 수 있으며, 데이터 자체에도 편향이 존재할 수 있다.
- 또한, 지표를 조작하여 원하는 결과를 얻으려는 시도를 할 수도 있다.
(2) 데이터 기반 의사 결정 : 수집된 데이터와 분석 결과에 기반하여 의사 결정을 내리는 것
- 그러나 직관은 개인의 경험에 근거하기 때문에 다양한 편향에 빠질 위험이 있다.
→ 직관과 데이터를 모두 활용하는 것은 중요하다.
→ 데이터는 의사결정의 근거를 제공하고, 직관은 데이터만으로 해결할 수 없는 부분 보완
데이터 활용 과정
(1) 문제 및 목적 정의와 가설 구축
(2) 데이터 분석
(3) 결론 도출 및 해석 추출
문제해결 프로세스
문제 → 원인 → 해결방법
성과를 이끌어 내는 데이터 문해력
(A) 겉으로 드러난 현상(B) 목적 및 문제를 정의(C) 지표를 결정(D) 현재 상태를 파악(E) 평가(F) 원인을 분석(G) 해결 방안을 모색
데이터 활용 프로세스
(1) 문제 인식(목적정의)
(2) 전단계
1. 문제 정의(목적정의)2. 데이터 수집(데이터 수집 계획, 데이터 수집)3. 데이터전처리(지표 개발)4. 데이터분석과 시각화(분석 및 해석)
(3) Action item 도출(분석 및 해석)
목적과 문제를 정의하는 것
나는 무엇을 알고 싶은가?
나는 무엇을 해결하고자 하는가?
[1] 문제 정의(Problem Definition)
: 일련의 질문들을 통해 문제의 모호성을 해소하고, 초기 질문/핵심 질문을 산출하는 것
(1) 분석 목적 확립하기
(2) 문제의 원인 파악하기
[2] 문제를 정의하는 방법
(1) 명확하게 하기
(2) 상위 질문 파악하기
(3) 질문 정의하기
[실습]
우리의 경쟁사를 분석해 오세요.
[test]
- 경쟁사는 '에듀테크 시장'인가? 아니면 '유사 서비스 업계 시장'인가?
- 현재 시기의 기준으로 질문을 한 것인가?
- 경쟁사의 범위가 다양한가? (ex. 스타트업, 중소기업, 중견기업, 대기업 다양한 분포)
- 경쟁사의 어떤 점에 집중해야 하는가? (ex. 마케팅, 서비스, 대상 등)
[answer]
(1) 문제 정의
우리 = 밀크티 초등
경쟁사 = 엘리하이
분석 = 신규 기능 기획
(2) 상위
신학기 대비를 위한 기능 기획
데이터의 종류
(1) 데이터의 형태에 따른 분류
- 정형 데이터 : 데이터베이스나 스프레드시트에 잘맞도록 조직된 데이터(행, 열의 형태)
- 반정형 데이터 : 정형 데이터만큼 조직적이지 않지만 일정 수준의 조직성을 가지고 있어 비정형보다 처리하기 쉬움
- 비정형 데이터 : 사전에 정의된 데이터 모델이 없거나 사저넹 정의된 방식으로 조직되지 않은 정보, 분석이 복잡함
(2) 데이터 원천의 따른 분류
- 내부데이터 : 조직 내부에서 수집한 정보(ex. 판매기록, 고객 상세 정보)
- 외부데이터 : 조직 외부에서 수집한 정보(ex. 시장 동향, 업계 보고서, 소셜 미디어 지표 )
(3) 데이터 수집과 목적
- 데이터 수집은 관찰, 측정, 기록을 통해 정보를 모으는 과정
- 현상을 이해하고,문제를 식별하며, 결정을 내리기 위한 근거를 마련하는 데 있다.
(4) 이슈 상황
내가 해결하고자 하는 문제는 확인하였는데, 문제 상황이라는 것을 판단할 수 있는 데이터가 없을 수 있다!
- 어떤 종류의 데이터가 필요한지
- 왜 필요한지에 대해 수집하는 파트에 명확한 정보를 전달할 필요가 있다는 점
지표(Key Performance Indicator)
- 특정 목표나 성과를 측정할 수 있는 기준
- 방향이나 목적, 기준 따위를 나타내는 일종의 표지
- 추상적인 개념과 관련되는 지수로, 지표는 곧 측정하고 싶은 것을 숫자로 표현한 것
데이터 수집 : 지표를 정의하고 측정하기 위한 원시 자료를 제공하는 과정
↔지표 : 이렇게 수집된 데이터를 분석하고 해석하여 의미 있는 정보로 전환하는 과정
좋은 지표란?
(1) 업무의 목적과 직접적으로 관련된 지표
(2) 구체적이고 측정 가능한 지표
(3) 누구나 이해할 수 있는 지표
(4) 행동 지향적인 지표
(5) 정의를 명확하게 한 지표
(6) 다양한 관점으로 해석되지 않는 지
잘못된 지표의 효과?
1단계 : 잘못된 초점
2단계 : 부적절한 자원 배분
3단계 : 팀 내 혼란과 동기 부족
4단계 : 시장과의 괴리
5단계 : 신뢰도와 명성 손상
[실습]
교과서, 학원 및 공부방 사업 지표
(1) 교과서
1. 초/중/고 점유율
2. 교재의 완성
(2) 학원 및 공부방
1. 신규 계약 유치 수
2. 재계약율
3. 학생 등록율
(1) 로그설계
- 현황 파악 및 문제정의
- 피처 설계
- 과제의 성과를 판단할 지표 정의
- 로그 상세 설계
- 개발자 로그 설계 미팅
- 데이터분석가분들과 설계 내역 접수
- 최종 로그 확정, 로그 관리 내역 반영
(2) 로그개발
- 로그 개발
- 베타 배포
(3) 로그 QA
- 베타 QA
(4) 배포
- 운영 배포
(5) 지표 확인
- 운영 검수 & 성과 지표 확인
(6) 로그 운영 검수 이슈 수성 → 로그개발
KPI
1. key(핵심)
- 가고자 하는 방향을 의미하며, 무엇이 제일 중요한가를 나타낸다.
- 회사의 비전과 가고자 하는 방향에 맞는지 알아야 한다.
2. Performance(성과)
- 무엇이 성과를 대변하는가를 나타낸다.
- ex. DAU, 매출 등
3. Indicator(지표)
- 어떻게 수치화할 수 있는가를 나타낸다.
핵심 지표 카테고리
- 참여(Engagement) : 핵심 작업의 빈도와 주기
- 수익(Revenue) : 발생 수익
- 전환(Conversion) : 구매 유도, 가입, 폼 채우기 등
- 리텐션(Retention) : 재방문
- 활동(Activation) : 유저의 첫 번째 가치 있는 활동 순간
- 활성 유저(Active usage) : 일/주/달/년간 활성 유저
- NPS(NPS) : 고객 만족
MRR(Monthly Recurring Revenue, 월간 반복 수익)
- 정기 구독이나 서비스 계약을 통해 매월 정기적으로 발생하는 수익
- 구독 기반 서비스에서 특히 중요한 지표
- 비지니스의 수익성과 성장 추세를 이해하는데 중요하다.
- 이를 수익의 안정성을 평가할 수 있으며, 잠재적인 성장 기회를 식별할 수 있다.
CAC(Customer Acquisition Cost, 고객 확보 비용)
- 새로운 고객을 확보하기 위해 지출한 비용의 총액을 해당 고객 수로 나눈 값
- 마케팅과 광고 비용, 판매 인센티브, 직원 급여 등 고객을 유치하기 위한 모든 비용이 포함한다.
- 비즈니스가 새로운 고객을 얻기 위해 얼마나 효율적으로 자원을 사용하는지를 보여준다.
- 낮은 CAC는 마케팅과 판매 노력의 효율성을 나타내며, 수익성 있는 성장을 위한 기반이 된다.
CLTV / LTV(Customer Lifetime Value, 고객 생애 가치)
- 고객이 비즈니스와의 관계 동안 생성할 것으로 예상되는 총 수익의 현재 가치
- 이 지표는 고객이 처음 구매하는 순간부터 이탈할 때까지 전체 기간 동안 비즈니스에 가져다주는 평균적인 가치를 평가한다.
- 고객 관계의 장기적 가치를 이해하는데 중요하다.
- 높은 CLTV는 고객 충성도가 높고, 장기적으로 더 많은 수익을 창출할 수 있는 고객 기반을 가지고 있음을 의미한다.
- CAC와 CLTV의 비율은 비즈니스 모델의 지속 가능성을 평가하는 데 중요한 지표로, 이 비율이 높을수록 비즈니스는 더 건강하고 지속 가능한 성장을 기대할 수 있다.
DAU(Daily Active Users), WAU, MAU
- 각각 일간, 주간, 월간 활성 사용자 수를 나타낸다.
- 얼마나 많은 유저가 활성화되어 있는지 보여주는 지표
- 초기 단계에는 매우 유의미할 수 있으나, 성장함에 따라 리텐션(Retention) 같은 다른 지표를 함께 보는 것이 중요하다.
- 대략적인 규모와 성장 잠재력을 보여주는 데 사용된다.
- 다만 "Active"의 정의는 사전에 명확히 해야한다. (ex. 방문 DAU, 거래 DAU 등)
- 이 수치는 일시적인 마케팅 활동에 의해 수치가 변동될 수 있다.
PV(Page Views) & VU(Unique Views)
- PV : 특정 페이지가 조회된 횟수
- VU : 특정 페이지를 본 고유 방문자 수
- 사용자의 관심도와 콘텐츠의 인기도를 측정할 수 있으며, 사이트 내 사용자의 활동을 파악하는 데 유용하다.
이탈률(Bounce Rate)
- 유저가 웹 사이트나 앱을 방문했다 바로 떠나는 비율을 측정하는 지표
- 유저의 행동을 추적할 수 있고, 제품을 최적화하여 이탈률을 줄이고 유저의 관심을 높이는 방법을 이해
고객 잔존율(CRR - Customer Retention Rate)
- 특정 기간 동안 유지된 고객의 비율
- 기간 시작 시점에 이미 고객이었던 사람들 중에서, 기간이 끝날 때까지 여전히 고객으로 남아있는 비율을 측정한다.
- 비즈니스가 고객을 얼마나 잘 유지하고 있는지를 나타내는 중요한 지표
- 높은 잔존율은 고객 만족도가 높고, 장기적인 고객의 관계을 구축하고 있다.
고객 이탈률(Churn Rate)
- 특정 기간동안 서비스를 떠난 고객의 비율
- 시작 고객 수 대비 이탈한 고객 수로 계산된다.
- 이탈률은 비즈니스의 고객 유지 전략이 얼마나 효과적인지 평가하는데 사용된다.
- 높은 이탈률은 제품이나 서비스에 문제가 있거나, 고객의 요구를 파악하고 충족시키는데 고민할 수 있다.
Duration Time(체류시간) & Session
- 사용자가 특정 페이지나 앱에서 보낸 시간
- 정의된 시간동안 사용자가 앱이나 웹에서 활동하는 시간의 묶음
- 관심과 참여도를 파악하는데 유용하다.
유저 당 세션 수(Number of session per User)
- 특정 기간 동안 각 사용자가 생성한 세션의 평균 수
- 사용자가 얼마나 자주 제품이나 서비스를 사용하는지도 보여준다,
- 사용자가 참여도와 제품에 대한 관심도를 반영하며, 사용자가 서비스를 정기적으로 사용하는지 여부를 파악하는데 유용하다.
세션 당 유저의 활동 수(No. of user actions per session)
- 사용자가 한 세션 동안 수행한 평균 활동 수
- 이 지표는 사용자가 세션 동안 얼마나 활동적인지를 나타낸다.
- 높은 활동 수는 사용자가 높은 참여도와 서비스에 대한 깊은 관심을 의미한다.
- 이를 통해 사용자 경험의 질을 평가하고, 서비스 개선을 위한 인사이트를 얻을 수 있다.
CVR(Conversion Rate, 전환율)
- 특정 행동을 완료한 사용자의 비율
- 광고 또는 제품의 성공을 측정하는 데 사용되며, CTP과 함께 분석하여 컨텐츠 효과를 평가한다,
- 전환의 정의도 명확해야 한다.
CTR(Click Through Rate, 클릭률)
- 특정 광고나 링크를 본 후 클릭한 비율
- 사용자의 관심도와 광고의 효과를 측정한다.
- CTR은 마케팅 캠페인의 성공 여부를 판단하는 초기 지표로 활용된다.
지표의 설정
- 메인 지표
- 성공 지표
- 보조 지표
- 가드레일 지표
데이터 시각화란?
: 복잡한 정보를 알기 쉽고 이해하기 쉬운 형태로 표현하는 기술
- 막대그래프
- 히스토그램
- 선 그래프
- 박스 플롯
- 스캐터 플롯
데이터 시각화 핵심
- 의도한 메세지를 정확하게 전달하는 것
- 시간 시각화, 분포 시각화, 관계 시각화, 비교 시각화, 공간 시각화
우리가 말하고자 하는 것을 어떻게 쉽고 빠르게 그리고 왜곡 없이 전달할 수 있을까?
(시각화 목적, 시각화 방법)
커스터마이징
- 읽는 사람 중심으로 예상 독자가 어떠한 활용을 할 것인가?
- 목적, 독자에 맞는 글의 구조 잡기
- 목적과 근거를 명료하게 → 짧을수록 좋은 → 의사결정에 드는 시간을 아끼기 위해서
- 명확하게 구조화된 카테고리
- 핵심 먼저 두괄(ex. 근거1, 근거2, 근거3 → 주장)
의사결정에 주의해야 할 점
(1) 확증 편향(Confirmation Bias)
- 옳다고 여기는 정보만 받아들이고 신념과 일치하지 않는 정보는 무시
- 사용자에게 던지는 질문을 내가 옳다고 생각하는 바를 유도
- 지표가 편향되어 설정될 수도, 여러 지표 중 긍정적인 지표만 사용
1. 편향을 가지고 있다는 사실을 늘 인식한다.
2. 유도 질문을 철저하게 피한다.
3. 여러 이해관계자로부터 균형된 피드백을 받는다.
(2) 매몰비용 오류 편향(Sunk-cost Fallacy Bias)
- 이미 투자한 시간, 노력, 비용 때문에 미래의 불확실한 결과를 예상함에도 투자와 작업을 지속하고자 하는 편향
- 손실 회피(Loss Aversion) 경향이 이런 편향을 만들어낸다.
1. 근본적인 지표가 될 수 있는 질문에 답변할 수 있는지 스스로 물어본다.
2. 만약 전사가 목숨을 걸어야 하는 상황에도 동일한 결정을 할 것인가?
3. 기존 코드가 모두 날아가서 없어졌음에도 같은 방법으로 코드를 유지보수 할 것이다.
4. 동료 프로젝트에서 어떻게 대처할 것인가?
(3) 이케아 효과/편향(IKEA Effect/Bias)
- 본인이 직접 만든 제품에 대해 실제보다 더 큰 가치를 부여하는 편향
- 내가 노력을 기울였다고 해서, 투자를 했다고 해서 꼭 그 제품/서비스가 성공하지는 않는다.
(4) 오류 합의 편향(False-Consensus Bias)
의사결정의 전략적 Tips!
- 모든 결정은 단순히 결과를 예측하는 베팅
- 에너지 레벨 고려하여 결정
- 실패에서 배우며, 빠르게 개선
- 작은 결정부터 시작
- 의사 결정 옵션의 다양성 제공
데이터를 분석하고 활용한다는 것은...
- Domain Experise
- Math & Statistical knowledge
- Data science
- Computing skills
'천재교육' 카테고리의 다른 글
에듀테크 PM 프로덕트 매니저(10) (0) | 2024.02.23 |
---|---|
에듀테크 PM 프로덕트 매니저(9) (0) | 2024.02.22 |
에듀테크 PM 프로덕트 매니저(7) (0) | 2024.01.29 |
에듀테크 PM 프로덕트 매니저(6) (1) | 2024.01.25 |
에듀테크 PM 프로덕트 매니저(5) (0) | 2024.01.03 |