목차
4강 데이터
1) 데이터의 종류
- 업무 데이터 = 업무에 필요한 데이터, 서비스와 시스템을 운용하기 위한 목적으로 구축된 데이터베이스에 존재하는 데이터, 대부분 갱신형 데이터
- 트랜잭션 데이터
- 마스터 데이터
카테고리 마스터, 상품 마스터처럼 서비스와 시스템이 정의하고 있는 데이터
- 로그 데이터
= 업무에 직접적으로 필요하지는 않지만 분석을 위해 추출해야 하는 데이터
통계 또는 분석을 주 용도로 설계된 데이터, 특정 태그를 포함해서 전송된 데이터, 특정 행동을 서버 측에 출력한 데이터
누적형 데이터! = 출력 시점의 정보를 축적해두는 것. 로그 출력 이후 가격 변경되거나 사용자 정보 변경되어도 기존 데이터 수정 안함.
2) 업무 데이터
- 업무 데이터의 특징
- 데이터의 정밀도가 높다.
- 갱신형 데이터
- 다뤄야 하는 테이블의 수가 많다.
- 업무 데이터 축적 방법
- 모든 데이터 변경하기
- 모든 레코드의 스냅샷을 날짜별로 저장하기
- 어제와의 변경 사항만 누적하기
- 업무 데이터 다루기
- 매출액, 사용자 수처럼 정확한 값을 요구할 경우 활용하기
- 서비스의 방문 횟수, 페이지뷰, 사용자 유도 등의 데이터 분석에는 사용할 수 없음.
- 데이터 변경이 발생할 수 있으므로 추출 시점에 따라 결과가 변화할 수 있음.
3) 로그 데이터
- 로그 데이터 특징
- 시간, 사용자 엔드포인트, IP, URL, 레퍼러, Cookie 등의 정보 저장하기
- 추출 방법에 따라 데이터의 정밀도가 달라짐
- 계속 기록을 추가하는 것뿐이므로 과거 데이터가 변경되지는 않음
- 로그 데이터 축적방법
- 태그, SDK를 통해 사용자 장치에서 데이터를 전송하고 출력하기(비컨형태)
- 서버에서 데이터를 추출하고 출력하기(서버형태)
- 로그 데이터 다루기
- 사이트 방문횟수, 페이지뷰, 사용자 유도 상황을 집계하고 분석할 때 주로 사용
- 최신 상태를 고려한 분석에는 적합하지 않음
- 계속 기록을 누적하는 형태이므로 추출 결과가 변할 가능성이 적음
- 데이터의 정확도는 업무 데이터에 비해 낮음
4) 두 데이터를 사용해서 생성되는 가치
- 업무 데이터와 로그 데이터의 가치
- 업무 데이터
- 로그 데이터
- 두 데이터를 사용했을 때 발생하는 새로운 가치
로그 데이터 → 웹사이트에서 행동을 기록할 때.
업무 데이터 → 웹사이트, 오프라인 데이터 사용가능.
⇒ 웹사이트의 행동이 오프라인의 행동에 어떠한 영향 미치는지 조사 가능.
ex) 특정 미디어 또는 광고로 유입된 사용자가 오프라인에서 계약할 가능성이 더 높다면, 해당 미디어와 광고를 더 활용할 수 있음.
'SQL' 카테고리의 다른 글
[데이터 분석을 위한 SQL 레시피] 9강 - 시계열 기반으로 데이터 집계하기 (0) | 2023.12.26 |
---|---|
[데이터 분석을 위한 SQL 레시피] 8강 - 여러 개의 테이블 조작하기 (0) | 2023.12.26 |
[데이터 분석을 위한 SQL 레시피] 7강 -하나의 테이블에 대한 조작 (0) | 2023.12.26 |
[데이터 분석을 위한 SQL 레시피] 6강 - 여러 개의 값에 대한 조작 (1) | 2023.12.26 |
[데이터 분석을 위한 SQL 레시피] 5강 - 하나의 값 조작하기 (1) | 2023.12.26 |