목차 1) 데이터 분산 계산하기 2) 크롤러 제외하기 3) 데이터 타당성 확인하기 4) 특정 IP 주소에서의 접근 제외하기 18강 이상값 검출하기 1) 데이터 분산 계산하기 로그 데이터에서 이상값을 검출하는 가장 기본적인 방법은 데이터의 분산을 계산하고, 그러한 분산에서 많이 벗어난 값을 찾는 것. 세션별로 페이지 열람 수 랭킹 비율 구하기 세션별로 조회 수를 계산한 뒤 조회 수가 많은 상위 n%의 데이터를 확인 **PERCENT_RANK 함수 = 랭킹을 비율로 구하는 함수 → (rank - 1) / ( - 1) 인수로 지정한 값의 그룹내의 위치를 나타내는 백분위 순위를 반환한다 PERCENT_RANK에 의해 반환되는 값의 범위는 0~1이다 #18-1 세션별로 페이지 열람 수 랭킹 비율을 구하는 쿼리 W..
목차 1) 오류율 집계하기 2) 입력 ~ 확인 ~ 완료까지의 이동률 집계하기 3) 입력 양식 직귀율 집계하기 4) 오류가 발생하는 항목과 내용 집계하기 16강 입력 양식 최적화하기 엔트리폼 =자료 청구 양식과 구매 양식 입력양식 최적화(EFO, Entry Form Optimization) 입력 양식의 항목이 너무 많아 이탈하는 것을 막고, 성과를 높이고자 입력 양식을 최적화 하는것. 필수 입력과 선택 입력을 명확하게 구분해서 입력 수를 줄인다. 필수 입력 항목을 위로 올려 배치 오류 발생 빈도를 줄인다. 입력 예를 보여준다. 제대로 입력하지 않았다고 실시간으로 알려준다. 쉽게 입력할 수 있게 만든다. 입력 항목을 줄인다. 우편번호와 주소등의 자동완성기능을 사용한다. 이탈할 만한 요소를 제거한다. 불필요한..