머신러닝
-
[Scikit-learn] 사이킷런 | 머신러닝 라이브러리__Data Analysis/__Machine Learning 2021. 6. 17. 13:23
사이킷런 : 대표적인 파이썬 머신러닝 라이브러리 사이킷런 라이브러리 설치 pip install scikit-learn 사이킷런 주요 모듈 분류 모듈명 설명 참고 예제 데이터셋 sklearn.datasets 사이킷런에 내장된 예제 데이터셋 피쳐 처리 sklearn.preprocessing 데이터 전처리 가공에 필요한 기능 제공 (인코딩, 정규화, 스케일링 등) sklearn.feature_selection 영향력이 큰 피쳐를 우선순위대로 피쳐 선택하거나 차원 축소하는 기능 제공 sklearn.feature_extraction 텍스트 또는 이미지 데이터에서 피쳐 추출 sklearn.decomposition 차원 축소 기능 제공(PCA 등) 성능 평가 sklearn.metrics 분류, 회귀, 클러스터링 등에..
-
[ML] [Kaggle] House Prices - Advanced Regression Techniques__Data Analysis/__Kaggle 2021. 4. 21. 00:40
수업 중 개별 프로젝트(과제) url : www.kaggle.com/c/house-prices-advanced-regression-techniques/data?select=data_description.txt 제공 데이터 : - data_description.txt - sample_submission.csv - test.csv - train.csv 요약 : - 데이터 : 1460 row X 81 columns - Goal : predict the sales price for each house.(the value of the SalePrice variable.) - Metric : Submissions are evaluated on Root-Mean-Squared-Error (RMSE) between t..
-
[ML] sklearn / iris dataset__Data Analysis/__Machine Learning 2021. 4. 14. 00:19
-결측치가 없다. -데이터가 깔끔하다. -별다른 전처리를 하지 않고, 점수를 내봄. 1. 모듈 불러오기 import numpy as np import pandas as pd from sklearn.datasets import load_iris # 데이터셋 호출 from sklearn.tree import DecisionTreeClassifier from sklearn.ensemble import RandomForestClassifier from sklearn.linear_model import LogisticRegression from sklearn.neighbors import KNeighborsClassifier from sklearn.model_selection import train_test_sp..