빅데이터분석기사 실기 1, 2, 3 유형을 모두 정리한 주피터파일을 깃허브에 올려두었다. 깃허브에서 다운로드 받아 코랩에서 실행 해 보며 연습하는 것을 추천한다. 참고로 2유형은 csv 파일도 다운받아 설정한 경로에 넣어주어야 한다. https://github.com/suetudy/BigDataAnalysisEngineer_Certification GitHub - suetudy/BigDataAnalysisEngineer_CertificationContribute to suetudy/BigDataAnalysisEngineer_Certification development by creating an account on GitHub.github.com
데이터 전처리
[빅데이터분석기사 실기] 제1유형: 데이터 전처리1. 데이터 탐색¶1) 데이터 불러오기In [1]: import numpy as np # 넘파이 패키지 임포트import pandas as pd # 판다스 패키지 임포트import matplotlib.pyplot as plt # matplotlib 패키지 임포트# 깃허브에 있는 csv 파일 읽어와서 데이터프레임 df로 넣기 - 타이타닉 데이터셋df = pd.read_csv("https://raw.githubusercontent.com/suetudy/BigDataAnalysisEngineer_Certification/main/Titanic.csv") In [2]: # 데이터프레임 전체 출력df Out[2..
프로젝트 소개 및 도메인 이해 차량 공유란? 자동차의 소유권을 가지고 있는 주체가 서비스에 가입된 회원에게 시간단위로 차량의 이용권한을 제공하는 것이다. 전 세계적으로 공유차량 보유대수가 가파른 성장세를 보이며, 2040년까지 16% 증가할 것으로 보인다. 만족도 조사 결과 사용자 입장에서는 편리한 차량 대여와 차량 관리를 중요하게 생각는 것을 알 수 있다. 차량 공유 사용 절차 차량 공유 업체에서는 차량 상태 확인을 위한 외관촬영 검수를 한다. 고객이 전송한 외관 찰영 사진은 일평균 7~8만장으로, 최대 11만장의 차량 외관 이미지를 검수하기도 한다. 차량공유업체에서는 차량 사진을 일일히 수작업을 통해 파손된 차량을 식별하고 차량 정비를 맡기는 업무가 가장 많은 시간과 인력 등의 비용을 소비한다. 이러..