분산분석 2

[실습] 집단분석 : Depression.xlsx 데이터

집단분석 [1단계] 데이터 불러오기 # 데이터셋 불러오기 import pandas as pd dp = pd.read_excel('c:\\data\\depression.xlsx') dp.head() dp.head() dp.info() y : 치료효과 [2단계] 집단의 등분산성 비교하기 levene 검정 · 귀무가설 : 분산이 같다. import pingouin as pg pg.homoscedasticity(dv='y', group='TRT', data=dp) > 결과 : pval가 0.000416 으로 0.05 보다 작다. 분산이 같다는 귀무가설을 기각하고, 등분산성을 만족하지 않는 것으로 보고 진행한다. 집단 분석에서 등분산성을 만족하지 않을 때 > welch_anova [3단계] 분산분석 · 귀무가설 ..

기초통계 2022.08.25

[기초통계] 집단 비교 : 독립표본 t검정, 검정력, 효과크기, 분산분석, 분할표

집단비교 A/B 테스트와 MVP를 만들어 실험을 했다. 그럼 통계적으로는 어떻게 분석해야 할까? Multi - Armed Bandit 솔루션 딜레마를 해결하기 위해 대규모 서비스 같은 경우에는 이 솔루션을 사와서 실험 추이를 보며 리소스 통제 계획을 정한다. 예) optimizely 집단 비교 통계 처리 순서도 '종속변수'의 예 - A와 B군중 어디가 매출이 더 잘 나오는가? > 매출은 연속된 값 > 연속형 - 가입을 하느냐, 탈퇴를 하느냐? > 가입 아니면 탈퇴 > 범주형 독립표본 t-검정 두 집단의 평균 차이 𝑋1: 대조군 평균 𝑋2: 실험군 평균 • 두 집단의 모집단이 모두 정규분포를 따르거나, 또는 각 집단의 크기가 충분히 큰 경우 (𝑛 > 30) t-분포를 이용해서(𝑋1 − 𝑋2)의 신뢰구간을 ..

기초통계 2022.08.18