전체 글 299

[Python] 문자열 포맷팅

String Formatting format() 과 자리표시자 {} f-string 방법1) format() 메서드 와 자리표시자 {} format() 메서드로 문자열 부분 선택하여 포맷하기 선택 부분은 자리 표시자 > {} 를 사용하고 format() 메서드로 자리에 값을 넣어준다. price = 45 wallet = "The price is {} dollars" print(wallet.format(price)) · 파라미터로 변환방법 바꾸기 각 자리표시자 {} 안에 파라미터를 추가해서 변환 방법을 지정할 수 있다. price = 45 wallet = "The price is {:.1f} dollars" # 소수점 첫째자리까지 표시 print(wallet.format(price)) 정수로 변환하려는 경..

Python 2022.08.21

[Python] 한 줄로 코딩하기 : List comprehension

LIST COMPREHENSION List comprehension은 기존에 있는 리스트 요소를 가지고 새로운 리스트를 생성하고 싶을 때 사용할 수 있다. 연습 Q. 리스트 fruits 에 철자 'a'가 들어가는 과일만 리스트로 추출하기 1) for문으로 기존 fruits 리스트에 for문에 if문을 사용해서 'a'가 들어가는 요소만 리스트 newlist로 뽑아내기 fruits = ["apple", "banana","melon","grape","cherry", "kiwi", "mango"] newlist = [] for x in fruits: if "a" in x: newlist.append(x) print(newlist) 2) List comprehension 으로 한 줄 코드로 뽑아내기 fruits ..

Python 2022.08.21

[Python] 클래스(Class)와 객체(Object)

클래스(Class)와 객체(Object) Keyword 클래스의 정의 클래스(Class) 와 객체(Object) 객체(Object)와 인스턴스(instance) 메서드(method) self 생성자(Constructor) 클래스의 정의 '클래스란 무엇인가? 파이썬은 객체 지향 언어(object-Oriented programming, OPP) 언어 클래스는 객체지향 프로그래밍의 기본 구성요소이다. 클래스는 연관있는 데이터와 기능을 묶은 객체를 만들기 위한 설계도 → 같은 형태의 무언가를 만들어내기 위한 틀 🪔 객체 지향 프로그래밍이란? 더보기 객체 지향 프로그래밍은 컴퓨터 프로그래밍의 패러다임 중 하나. 객체 지향 프로그래밍은 컴퓨터 프로그램을 명령어의 목록으로 보는 시각에서 벗어나 여러 개의 독립적인 단..

Python 2022.08.20

[Hacker Rank] The Blunder

📢 본 포스팅에 활용되는 기본 문제 및 자료 출처는 HackerRank 임을 밝힙니다. https://www.hackerrank.com ■ 문제 https://www.hackerrank.com/challenges/the-blunder/problem?isFullScreen=true The Blunder | HackerRank Query the amount of error in Sam's result, rounded up to the next integer. www.hackerrank.com Samantha was tasked with calculating the average monthly salaries for all employees in the EMPLOYEES table, but did not re..

[기초통계] 상관과 회귀 : 상관분석, 상관계수, 상관과 인과

상관과 회귀 : 상관분석 KEYWORD 상관계수 기울기 공분산 피어슨 적률 상관계수 스피어만 상관계수 켄달 상관계수 상관과 인과 • 제3 변인의 존재 • 이질적인 집단들의 합 (심슨의 역설) • 극단치(outliers) 상관계수 두 변수의 연관성을 -1 ~ +1 범위의 수치로 나타낸 것 • 두 변수의 연관성을 파악하기 위해 사용 • 어휘력과 독해력의 관계 • 주가와 금 가격의 관계 • 엔진 성능과 고객만족도의 관계 상관계수의 해석 부호와 크기 • 부호: - + : 두 변수가 같은 방향으로 변화(하나가 증가하면 다른 하나도 증가) - - : 두 변수가 반대 방향으로 변화(하나가 증가하면 다른 하나는 감소) • 크기: - 0 : 두 변수가 독립, 한 변수의 변화로 다른 변수의 변화를 예측하지 못함 - 1 :..

기초통계 2022.08.20

[기초통계] 집단 비교 : 분산분석 - 다중비교, 사후검정, 카이제곱검정

분산분석 다중비교 multiple comparison • 분산 분석은 한 번에 여러 집단 비교 가능 • 독립표본 t-검정은 한 번에 두 집단만 비교 가능 • 집단이 여러 개 있을 경우 독립표본 t-검정은 집단 간의 모든 짝을 비교해야 함. - 집단이 k개일 경우 필요한 비교 횟수 = k(k-1) / 2 FWER Familywise Error Rate 다중 비교를 할 경우 적어도 한 번 1종 오류가 발생할 확률 • 세 집단이 모집단에서 평균이 모두 같은 경우 유의수준 5%인 비교를 3번해서, 3번 모두 1종 오류를 피할 확률(독립적이라고 가정할 경우): 95% × 95% × 95 % ≈ 86% • 바꿔 말하면 적어도 한 번 1종 오류가 발생할 확률(FWER)은 14% • 비교를 많이 할 수록 FWER은 증..

기초통계 2022.08.19

[기초통계] 집단 비교 : 독립표본 t검정, 검정력, 효과크기, 분산분석, 분할표

집단비교 A/B 테스트와 MVP를 만들어 실험을 했다. 그럼 통계적으로는 어떻게 분석해야 할까? Multi - Armed Bandit 솔루션 딜레마를 해결하기 위해 대규모 서비스 같은 경우에는 이 솔루션을 사와서 실험 추이를 보며 리소스 통제 계획을 정한다. 예) optimizely 집단 비교 통계 처리 순서도 '종속변수'의 예 - A와 B군중 어디가 매출이 더 잘 나오는가? > 매출은 연속된 값 > 연속형 - 가입을 하느냐, 탈퇴를 하느냐? > 가입 아니면 탈퇴 > 범주형 독립표본 t-검정 두 집단의 평균 차이 𝑋1: 대조군 평균 𝑋2: 실험군 평균 • 두 집단의 모집단이 모두 정규분포를 따르거나, 또는 각 집단의 크기가 충분히 큰 경우 (𝑛 > 30) t-분포를 이용해서(𝑋1 − 𝑋2)의 신뢰구간을 ..

기초통계 2022.08.18