분류 전체보기 299

[프로그래머스] 성분으로 구분한 아이스크림 총 주문량

📢 본 포스팅에 활용되는 기본 문제 및 자료 출처는 프로그래머스 코딩테스트 연습, https://school.programmers.co.kr/learn/challenges?page=1&languages=mysql%2Coracle임을 밝힙니다. ■ 문제 문제 설명 다음은 아이스크림 가게의 상반기 주문 정보를 담은 FIRST_HALF 테이블과 아이스크림 성분에 대한 정보를 담은 ICECREAM_INFO 테이블입니다. FIRST_HALF 테이블 구조는 다음과 같으며, SHIPMENT_ID, FLAVOR, TOTAL_ORDER 는 각각 아이스크림 공장에서 아이스크림 가게까지의 출하 번호, 아이스크림 맛, 상반기 아이스크림 총주문량을 나타냅니다. FIRST_HALF 테이블의 기본 키는 FLAVOR입니다. NAME..

[프로그래머스] 가격이 제일 비싼 식품의 정보 출력하기

📢 본 포스팅에 활용되는 기본 문제 및 자료 출처는 프로그래머스 코딩테스트 연습, https://school.programmers.co.kr/learn/challenges?page=1&languages=mysql%2Coracle임을 밝힙니다. ■ 문제 문제 설명 다음은 식품의 정보를 담은 FOOD_PRODUCT 테이블입니다. FOOD_PRODUCT 테이블은 다음과 같으며 PRODUCT _ID, PRODUCT_NAME, PRODUCT_CD, CATEGORY, PRICE는 식품 ID, 식품 이름, 식품 코드, 식품분류, 식품 가격을 의미합니다. Column name Type Nullable PRODUCT_ID VARCHAR(10) FALSE PRODUCT_NAME VARCHAR(50) FALSE PRODUC..

[프로그래머스] 경기도에 위치한 식품창고 목록 출력하기

📢 본 포스팅에 활용되는 기본 문제 및 자료 출처는 프로그래머스 코딩테스트 연습, https://school.programmers.co.kr/learn/challenges?page=1&languages=mysql%2Coracle임을 밝힙니다. ■ 문제 https://school.programmers.co.kr/learn/courses/30/lessons/131114 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 문제 설명 다음은 식품창고의 정보를 담은 FOOD_WAREHOUSE 테이블입니다. FOOD_WAREHOUSE 테이블은 다음과 같으며 WAREHOU..

[Pandas] 컬럼명 변경하기/ 순서바꾸기

> 컬럼명 변경 데이터프레임명.columns = [] 데이터프레임명 = 데이터프레임명.rename(columns = {'변경전':'변경후'}) > 컬럼명 순서 데이터프레임명[['컬럼2','컬럼1','컬럼3']] 데이터프레임명.reindex(columns=['컬럼1','컬럼2','컬럼3']) 데이터프레임 컬럼명 변경하기 ■ 기본 데이터프레임 생성 import pandas as pd kiosk = pd.DataFrame({'coffee': ['americano', 'latte', 'juice'], 'option': ['yes', 'no', 'yes'], 'price': [1500, 3500, 4500]}) display(kiosk) 컬럼명 변경하기 방법1) 변경할 컬럼명을 기존 column 순서에 맞게 li..

Python 2022.10.22

[텍스트 분석] 희소행렬

희소행렬 Sparse matrix 희소행렬 Sparse matrix 문서 단어 행렬에서 대부분의 값은 0 이다. 이러한 행렬을 희소(sparse) 행렬이라 함 ↔ 조밀(dense) > 행렬 형식으로 저장하면 용량을 많이 차지하므로 용량을 아끼기 위해 0을 빼고 저장하는 압축 방법을 사용. 압축방식 · Coordinate list · Compressed Sparse Row Coordinate list Compressed Sparse Row 0이 아닌 값을 (행, 열, 값) 형식으로 저장 예: [(0, 0, 10), (0, 1, 20),(1, 1, 30), (1, 2, 40), (2, 3, 50)] • 값과 열번호를 별도로 저장. • 행번호 대신, 값에서 각 행의 시작과 끝 인덱스를 저장하여 행번호를 압축...

기초통계 2022.10.11

[텍스트 분석] 자연어 : 문서 단어 행렬

텍스트 분석 : 자연어 KEYWORD 자연어 문서단어행렬 자연어 Natural Language 자연어 natural language : 한국어, 영어 등 자연스럽게 생겨난 언어 인공어 constructed language - 에스페란토(1887): 자멘호프가 국제적 의사소통을 위해 개발 - 나비 : 영화 아바타의 외계인 언어로 사용하기 위해 개발 통제 자연어 controlled natural language 형식어 formal language : 수식, 프로그래밍 언어 등 자연어 특징 • 규칙이 복잡하고, 예외가 많음 • 음운론, 통사론, 의미론 등 다양한 수준으로 이뤄져 있음 종 류 설 명 예 음소 phoneme - 언어에서 소리의 가장 작은 단위, 그 자체로는 의미없음 형태소 morpheme - 의미..

기초통계 2022.10.04

[차원축소와 군집분석] 군집분석 : Clustering

군집분석 군집분석 Clustering • 비슷한 사례들을 '군집'으로 묶음 예: 비슷한 성향의 고객들을 묶어 군집별로 프로모션/상품 추천 등 • K-means, 위계적 군집분석, 가우시안 혼합 모형 등의 방법 군집분석의 필요성 보통 고객을 성별, 연령 등 인구학적 변수에 따라 그룹화하는 것이 흔함. 그러나, 고객들은 그렇게 단순하게 나눠지지 않으며, 정확성도 떨어짐 ∴ 데이터에 기반해서 고객들을 그룹화할 필요가 있음 → '군집 분석' 필요 분류분석과 군집분석의 차이 로지스틱 회귀분석과 같은 분류분석에서는 각 사례의 범주가 관찰변수 군집분석에서는 각 사례의 범주가 직접 관찰되지 않은 잠재변수 K-Means 가장 널리 사용되는 클러스터링 방법 > 군집의 평균(중심점)을 구해서, 사례를 중심점이 가장 가까운 ..

기초통계 2022.10.04