싸이킷런 스케일링, Scikit-learn Scailing

📂 Engineering

싸이킷런 스케일링, Scikit-learn Scailing

Gondev Lab - 꼰데랩 2020. 7. 18. 17:39

728x90

스케일링 하는 이유

너무 작거나 너무 크면 영향력(가중치, 회귀계수 등)이 제대로 표현 안 됨 -> over fitting

오버피팅의 가능성이 높아짐

Min-Max Scaling

from sklearn.preprocessing import MinMaxScaler

mMscaler = MinMaxScaler()

#
mMscaler.fit(data)

# 이러면 데이터의 범위가 0~1로 됨
mMsacled_data = mMscaler.fit_transform(data)

Standard Scailing

# Standard Scailing

from sklearn.preprocessing import StandardScaler

# 모델 생성
stdscaler = StandardScaler()

# 특징 찾기
stdscaler.fit(data)

# 데이터 변환
stdscaled_data = stdscaler.transform(data)

평균은 0, 표준편차는 1.

728x90