[빅데이터분석기사 실기] 제3유형: 통계적 가설검정제3유형 예상 문제¶모평균 검정: 검정통계량, p-value값, 귀무가설 판단(채택/기각)모집단 1개: 단일 표본모집단 2개: 대응 표본(쌍체), 독립 표본모집단 3개: ANOVA(분산분석) - F검정(일원분산분석)카이제곱검정: 기댓값, 검정통계량, p-value값, 귀무가설 판단(채택/기각)적합성 검정독립성 검정상관분석: 상관계수, 검정통계량, p-value값, 귀무가설 판단(채택/기각)피어슨 상관계수회귀분석: Rsq, odds, ratio, 회귀계수, p-value값다중선형회귀로지스틱회귀가설 검정 순서¶① 가설설정(귀무가설/대립가설)② 유의수준(α) 설정: 일반적으로 5%, 0.05③ 귀무가설 하에 검정통계량 계산④ 검정통계량으로 p-value 계산⑤..
실기
[빅데이터분석기사 실기] 제2유형: 데이터 분석빅데이터 분석 과정¶필요 패키지 임포트(import)데이터 불러오기데이터 살펴보기데이터 전처리분석 데이터셋 준비데이터 분석 수행성능평가 및 시각화(8. 예측 및 예측 결과 저장)지도학습, 비지도학습의 대표적인 분석기법지도학습 - 분류: 의사결정나무(분류), KNN, 서포트벡터머신(SVM), 로지스틱회귀분석, 랜덤포래스트, 인공신경망지도학습 - 회귀: 선형회귀분석, 다중회귀분석, 의사결정나무(회귀)비지도학습: 군집분석(Clustering), 연관분석(Association Analysis), 인공신경망(Neural Networks)분류 (Classification)¶예제) Iris 데이터셋을 이용하여 붓꽃의 종류(species) 구별하기1. 필요 패키지 임포트¶..
[빅데이터분석기사 실기] 제1유형: 데이터 전처리1. 데이터 탐색¶1) 데이터 불러오기In [1]: import numpy as np # 넘파이 패키지 임포트import pandas as pd # 판다스 패키지 임포트import matplotlib.pyplot as plt # matplotlib 패키지 임포트# 깃허브에 있는 csv 파일 읽어와서 데이터프레임 df로 넣기 - 타이타닉 데이터셋df = pd.read_csv("https://raw.githubusercontent.com/suetudy/BigDataAnalysisEngineer_Certification/main/Titanic.csv") In [2]: # 데이터프레임 전체 출력df Out[2..