1st level. Titanic: Machine Learning from Disaster 타이타닉 튜토리얼 1 - Exploratory data analysis, visualization, machine learning EDA To Prediction(DieTanic) Titanic Top 4% with ensemble modeling Introduction to Ensembling/Stacking in Python 2nd level. Porto Seguro’s Safe Driver Prediction Data Preparation & Exploration Interactive Porto Insights - A Plot.ly Tutorial XGBoost CV (LB .284) Porto Seguro ..
Python/2️⃣ 데이터 처리
개발자L 주 제 : 차원 축소(Dimension Reduction) 작성일 : 2022.02.06 1. 차원 축소(Dimension Reduction) 차원축소란 매우 많은 피처로 구성된 다차원 데이터의 차원을 축소하여 새로운 차원의 데이터를 생성하는 것으로 의미합니다. 일반적으로 수많은 피처로 구성된 데이터셋은 상대적으로 적은 차원에 학습된 모델보다 예측 신뢰도가 떨어지게됩니다. 또한, 피처가 필요이상으로 많은 경우, 피처간의 상관관계가 높아져 모델의 예측 성능이 저하됩니다. ※ 선형회귀에서는 입력변수간의 상관관계를 확인하기위해 다중 공선성(VIF)를 확인하며, 통상 10을 기준점으로 판단함 차원축소는 피처 선택(Feature Selection)과 피처 추출(Feature Extraction)으로 나눌..
개발자L 주제 : 머신러닝과 딥러닝의 전반적인 이해 4차 산업에서 중요한 것 바로 데이터(Data)입니다. 최근 데이터에 중요성이 강조되면서 데이터 분석가, 머신러닝 및 인공지능 업종에 대한 수요도 지속적으로 늘어나고 있습니다. 그렇다면 데이터 분석이란 무엇이며, 머신러닝과 딥러닝은 무엇인지 한번 알아보도록 하겠습니다. 1. 데이터분석(Data Analytics) 데이터 분석과 관련해서 검색을 하다 보면, 데이터마이닝이라는 표현을 들어본 적이 있으실 겁니다.사실상 데이터 분석과 데이터마이닝은 유사한 표현입니다. 단지 해당 분야에 따라서 일컫는 방식이 다를 뿐이죠. 통계냐? 머신러닝이냐? 그렇다면 데이터 분석이란 무엇일까요? 데이터 분석이란 데이터의 특징을 확인하는 것이라고 할 수 있습니다. 여기서 데이..