전체 글 299

[기초통계] A/B 테스트

A/B 테스트 A/B 테스팅 과학 분야에서 무작위 대조군 실험 (Randomized Controlled Trials) • 주로 웹 서비스 등의 분야에서 A/B 테스팅이라는 명칭을 사용 • 고객들에게 서로 다른 웹 페이지나 광고를 보여주고 목표 지표(예: 전환율)를 측정 • https://goodui.org/leaks/ Leaks | GoodUI goodui.org 예시: 중고거래 키워드 알림 등록 UI 근거 기반 의학에서 근거의 수준 • Level I : 무작위 대조군 실험에서 얻어진 근거 ▲ 가장 강한 근거로 보는 것 (A/B testing) • Level II-1 : 대조군 실험에서 얻어진 근거(무작위 할당이 아님) • Level II-2 : 동일 집단 연구 등 • Level II-3 : 대조군이 없..

기초통계 2022.08.18

[기초통계] 통계적 가설 검정

통계적 가설 검정 Karl Pearson, Ronald Fisher 등 통계학의 초기 인물들이 개발한 절차 • 반증주의 철학에 기반하고 있어 일반적인 과학적 가설 검정과 다르며, 많은 비판이 있었으나, 오랫동안 쓰여왔기 때문에 여전히 널리 쓰임. 통계적 가설 검정의 절차 귀무가설 수립 → 유의수준(α) 결정 → p-값 계산 → p값과 유의수준 비교 (1) 귀무가설 수립 • 귀무가설 null hypothesis : 기각하고자 하는 가설 • 대립가설 alternative hypothesis : 주장하고자 하는 가설 (2) 유의수준 결정 • 유의 수준 (α) significance level : (100% - 신뢰수준) (3) p-값 계산 • p-값 : 귀무가설이 참일 때 검정통계량 이상이 나올..

기초통계 2022.08.18

[MySQL] 리뷰 분석 : 여성 의류 전자상거래 리뷰

리뷰 분석 1. 데이터 import 하기 - 데이터명(출처링크) : Women's E-Commerce Clothing Review - 컬럼 정의 : 더보기 2. 테이블 정의 DESCRIBE mydata.dataset2; 3. 분석 항목 I. 부서별 평점 분포 II. 주요 Complain III. 연령별 평점 worst 부서 IV. SIZE Complain V. 상품별 특정 문제에 대한 리뷰 I. 부서별 평점 분포 Q 1 . 어느 부서의 상품이 좋은 평가 혹은 나쁜 평가를 받았을까 ? 1 - 부서별 평균 평점 계산 (DIVISION NAME 기준) SELECT `Division Name`, AVG(rating) AVG_RATE FROM mydata.dataset2 GROUP BY 1 ORDER BY 2 D..

Data analysis/SQL + 2022.08.17

[MySQL] Null과 COALESCE() 함수

Null 과 COALESCE() COALESCE() 인수를 순서대로 평가하고 처음으로 NULL이 아닌 첫 번째 식의 현재 값을 반환한다. 구문 COALESCE ( expression [ ,...n ] ) 인수 expression = 모든 형식의 식 반환형식 데이터 형식 우선 순위가 가장 높은 식의 데이터 형식을 반환한다. 모든 식에서 Null을 허용하지 않으면, 결과가 Null을 허용하지 않는 형식으로 처리됨. 예시) COALESCE(NULL, NULL, 'third_value', 'fourth_value'); 세 번째 값이 Null이 아닌 첫 값이기 때문에 세 번째 값을 반환한다. 연습 SELECT purchase_id ,amount ,coupon ,amount - coupon AS discount_a..

Database/SQL 2022.08.17

확률과 통계 II : 모집단, 표본 그리고 표집

확률과 통계 II 모집단과 표본 • 모집단 population : 연구의 관심이 되는 집단 전체 • 표본 sample : 특정 연구에서 선택된 모집단의 부분 집합 • 표집 sampling : 모집단에서 표본을 추출하는 절차. "표본 추출"이라고도 함 대부분의 경우 집단 전체를 전수조사하기는 어려우므로 무작위로 표본을 추출하여 모집단에 대해 추론한다. 모수 population parameter 파라미터 parameter : 어떤 시스템의 특성을 나타내는 값 모수 : 모집단 population의 파라미터 → 모집단의 특성을 나타내는 값 예시: • 모집단의 평균 (모평균) • 모집단의 분산 (모분산) 주의. "표본의 크기"를 "모수"라고 하는 경우도 있으나 이는 잘못된 표현 모수를 구하기 위해서는 전수조사가 ..

기초통계 2022.08.16

확률과 통계 I

확률과 통계 I 사례와 변수 • 사례 case 데이터 수집의 단위 (예: 고객, 제품, …) • 변수 variable 사례에 따라 달라지는 값 (예: 나이, 가격, …) 데이터를 표로 정리해보면, • 행(row) : 표에서 가로 방향 한 줄/ 하나의 사례 • 열(column) :표에서 세로 방향 한 줄 / 하나의 변수 변수 변수 ? 범주형 변수 종류, 이름 등에 해당한다. • 숫자로 표시하더라도 양적인 개념이 아니며, 덧셈 등 대부분의 연산이 의미가 없음 즉, 범주형 변수는 평균을 내면 안된다. • 순서가 있을 수도 있으나, 간격이 일정하지 않음 예: 주거 형태, 고향, 학력, 출석 연속형 변수 연속적인 형태 정수나 실수로 표현할 수 있는 것 • 간격이 일정하고 덧셈, 뺄셈 등의 계산이 의미가 있음 예:..

기초통계 2022.08.16