📂 Engineering
싸이킷런 스케일링, Scikit-learn Scailing
Gondev Lab - 꼰데랩
2020. 7. 18. 17:39
728x90
스케일링 하는 이유
너무 작거나 너무 크면 영향력(가중치, 회귀계수 등)이 제대로 표현 안 됨 -> over fitting
오버피팅의 가능성이 높아짐
Min-Max Scaling
from sklearn.preprocessing import MinMaxScaler
mMscaler = MinMaxScaler()
#
mMscaler.fit(data)
# 이러면 데이터의 범위가 0~1로 됨
mMsacled_data = mMscaler.fit_transform(data)
Standard Scailing
# Standard Scailing
from sklearn.preprocessing import StandardScaler
# 모델 생성
stdscaler = StandardScaler()
# 특징 찾기
stdscaler.fit(data)
# 데이터 변환
stdscaled_data = stdscaler.transform(data)
평균은 0, 표준편차는 1.
728x90