데이터 전처리

빅데이터분석기사 실기 1, 2, 3 유형을 모두 정리한 주피터파일을 깃허브에 올려두었다. 깃허브에서 다운로드 받아 코랩에서 실행 해 보며 연습하는 것을 추천한다.  참고로 2유형은 csv 파일도 다운받아 설정한 경로에 넣어주어야 한다.   https://github.com/suetudy/BigDataAnalysisEngineer_Certification GitHub - suetudy/BigDataAnalysisEngineer_CertificationContribute to suetudy/BigDataAnalysisEngineer_Certification development by creating an account on GitHub.github.com
[빅데이터분석기사 실기] 제1유형: 데이터 전처리1. 데이터 탐색¶1) 데이터 불러오기In [1]: import numpy as np # 넘파이 패키지 임포트import pandas as pd # 판다스 패키지 임포트import matplotlib.pyplot as plt # matplotlib 패키지 임포트# 깃허브에 있는 csv 파일 읽어와서 데이터프레임 df로 넣기 - 타이타닉 데이터셋df = pd.read_csv("https://raw.githubusercontent.com/suetudy/BigDataAnalysisEngineer_Certification/main/Titanic.csv") In [2]: # 데이터프레임 전체 출력df Out[2..
· 프로젝트
프로젝트 소개 및 도메인 이해 차량 공유란? 자동차의 소유권을 가지고 있는 주체가 서비스에 가입된 회원에게 시간단위로 차량의 이용권한을 제공하는 것이다. 전 세계적으로 공유차량 보유대수가 가파른 성장세를 보이며, 2040년까지 16% 증가할 것으로 보인다. 만족도 조사 결과 사용자 입장에서는 편리한 차량 대여와 차량 관리를 중요하게 생각는 것을 알 수 있다. 차량 공유 사용 절차 차량 공유 업체에서는 차량 상태 확인을 위한 외관촬영 검수를 한다. 고객이 전송한 외관 찰영 사진은 일평균 7~8만장으로, 최대 11만장의 차량 외관 이미지를 검수하기도 한다. 차량공유업체에서는 차량 사진을 일일히 수작업을 통해 파손된 차량을 식별하고 차량 정비를 맡기는 업무가 가장 많은 시간과 인력 등의 비용을 소비한다. 이러..
슈01
'데이터 전처리' 태그의 글 목록