Machine Learning
[Machine Learning] Colab사용 OpenCV 실습
Colab 바로가기 Google Colaboratory colab.research.google.com Colab에서 단축키 사용 방법 : ctrl +m + 파이썬의 단축키 OpenCV 개요 이미지를 처리하기 위한 라이브러리 OpenCV : Gray Bradsky에 의해 1996년 인텔에서 시작된 프로제토로 컴퓨터 비전, 머신러닝과 관련된 다양한 알고리즘을 지원하고 있으며 C++, Python, Java 등의 언어를 지원하고 CUDA(Compute Unified Device Architecture), OpenCL (Open Computing Language)에 기반한 인터페이스를 지원 OpenCV + Python : OpenCV의 파이썬 API로 C/C++로 된 OpenCV 라이브러리들을 파이썬 래퍼로 감..
[Machine Learning] 손글씨데이터 활용 분류 실습
목표 - 손글씨(0-9)를 분류하는 모델을 만들어보자 - 여러모델을 사용해보자 - 이미지 데이터 다루는 방법을 알아보자 도구불러오기 import numpy as np import pandas as pd import matplotlib.pyplot as plt 데이터 불러오기 # train - 학습시킬 때 # test -> 예측할 때 digit_data = pd.read_csv('./digit_train.csv') digit_data .info() - 크기확인 .shape - 결측치 확인 - datatype 확인 digit_data.info() # 42000 행, 785 컬럼 # label to pixel783 # dtypes : int64(785) # 컬러가 흑과 백만 있는 데이터 EDA 데이터를 이미지..
[Machine Learning] 타이타닉 데이터 활용하여 생존/사망 분류 실습02
특성공학 : 새로운 컬럼을 추가해보자 - Parch, Sibsp 를 더하면 가족의 수가 됨 -> 가족의 수라는 새 컬럼 추가 - train에 추가하면 test도 동일하기 추가해야 함 - 나 자신을 더해줘야 하기 때문에 +1 # train train['Family_Size'] = train['Parch'] + train['SibSp'] + 1 # test test['Family_Size'] = test['Parch'] + test['SibSp'] + 1 test.info() train.info() Family_Size를 이용해 데이터 시각화 sns.countplot(data = train, x = 'Family_Size', hue = 'Survived') # 1일때는 사망율이 높고, 2~4명일때는 생존율이..
[Machine Learning] 타이타닉 데이터 활용하여 생존/사망 분류 실습01
머신러닝 과정 1. 문제정의 : 프로젝트 목적, 어떤 모델을 만들지?, 지도학습 vs 비지도학습 2. 데이터 수집 3. 데이터 전처리 : 분석 전에 깔끔하게 만들어 줌(이상치 제거, 결측치 처리...) 4. 탐색적 데이터 분석 : 컬럼(변수)간의 관계 확인, 기술통계량 5. 모델 선택 및 학습 6. 모델 예측 및 평가 7. 모델을 가지고 서비스화(웹,앱) 목표 생존자/사망자 예측하는 모델을 만들어보자 머신러닝 모델 종류는 여러가지지만 tree모델 사용해보자 머신러닝 전체 과정을체험해보자 kaggle 경진대회에 참여해서 순위를 확인해보자 데이터 수집 - kaggle 사이트로부터 train, test, submission 다운로드 - train : 학습 시키기 위한 데이터 - test : 학습이 잘 됐는지 ..
[Machine Learning] Pandas와 Matplotlib을 사용해서 카카오톡 대화 전처리 실습
머신러닝을 위해 pandas와 matplotlib의 개념을 정립해보자 - 우리반의 대답봇이자 분위기 메이커를 알아보자 - 6월 27일부터 7월 1일까지 카톡 빈도수 추이 확인해보자 - 문자열 전처리를 해보자 import pandas as pd # 1,2차원의 테이블 형식 데이터를 다루는 모듈 import matplotlib.pyplot as plt # 시각화 도와주는 모듈 # 한국어 처리 - 글꼴 설정 from matplotlib import rc rc('font',family = 'Malgun Gothic') ai_class = pd.DataFrame([['2022-06-27','[원표] Zoom 회의 참가https://us02web.zoom.us/j/8318135592?pwd=L0RJaTA4NFlJZ..