본문 바로가기

🚩 3. Projects & Retrospect/BIG리더 AI 아카데미 2기64

[데이터 청년 캠퍼스] 경남대학교 빅리더 AI 아카데미 - Day 13 (마이크로소프트 이소영 이사님, 빅리더 2기 3기 선배님들) 오전 마이크로소프트의 이소영 이사님의 멋진 강의를 들었습니다. 이사님께서 책을 얼마 안 들고 오셔서 2권밖에 없었는데, 제가 질문을 하고 책에 사인까지 받았습니다. ^^ 개꿀쓰 세바시 강의에서 들은 내용도 일부 있었지만 그 외의 이야기도 많이 해주셔서 좋았습니다. 앞으로 어떤 사람이 되어야할지, 지금 내가 갖고 있던 고민들을 해결할 수 있었습니다. 앞으로도 제가 배운 것들을 더 많은 사람들에게 알려주려고 노력해야겠습니다. 이번 빅리더 아카데미동안 열심히 해서 프로그램이 끝나면 유튜브로 강의를 시작해야겠습니다. ^^ 그 뒤에는 빅리더 2,3기 선배님들과 토크콘서트를 진행했는데 굉장히 유익한 시간이었습니다. 그분들은 저희보다 2년~3년 더 일찍 시작하셨는데, 아직도 배울 게 더 많다고 노력하시는 분들이었습니.. 2020. 7. 19.
[데이터 청년 캠퍼스] 경남대학교 빅리더 AI 아카데미 - Day 12 오전 머신러닝시간입니다. 선형회귀의 뒷부분을 배웠는데요, Scikit-learn의 데이터(아이리스, boston 집값)를 회귀분석하고 시각화해보았습니다. random_state = x #(랜덤 seed를 지정해서 똑같은 무작위성을 갖게 합니다.) from sklearn.linear_model import Linear Regression model = LinearRegression(fit_intercept=True) model.fit(X,y) model.coef_ # 회귀계수 model.intercept_ # y절편 - 사이킷런의 지표평가 기준은 높은 지표값일 수록 좋은 모델이라 MSE값에 -1을 곱해서 반환하므로 반환 값에 -1을 다시 곱해야 원래의 양의 값인 MSE값이 됨 - 여기에 sqrt를 해서 R.. 2020. 7. 18.
[데이터 청년 캠퍼스] 경남대학교 빅리더 AI 아카데미 - Day 11 오전 - 자연어처리(NLP) 용어 DTM: 문서 행렬 (Documnet Term Matrirx) tf: 현재 문서에 출현한 단어의 빈도(횟수) (Term Frequency) idf : 역문서 빈도, 전제 문서의 수를 해당 단어가 나오는 문서수로 나눈 것(Inverse Document Frequency) td-idf : 단어빈도 * 역문서 빈도 문서행렬은 문서에 나타나는 어휘를 모아 one-hot 인코딩으로 표현한 벡터다. 모든 어휘들이 columns가 되는데 columns에서 저빈도 어휘들은 빼고 고빈도 어휘들로 채운다. 고빈도 어휘들 중에서도 불용어(을/를, 은/는 ....)는 제외한다. 이때 빈도는 tf나 tf-idf가 될 수 있다. tf가 단순히 출현 횟수만을 카운트한다. if-idf는 특정 문서들.. 2020. 7. 17.
[데이터 청년 캠퍼스] 경남대학교 빅리더 AI 아카데미 - Day 10 오전 머신러닝 시간이었습니다. 예측 모델 성능평가에 대해 배웠습니다. - Holdout - K-fold cross validation - Stratified sampling - Bootstrap ----------------- -Confusuin Matrix - Accuracy - Precision - Recall - F-Measure - ROC Curve - RMSE 등의 개념을 배웠습니다. 오후 오늘은 형태소 분석 후 빈도분석, 감성분석을 하는 시간이었습니다. 하지만 많이 졸아서 자습이 많이 필요합니다. 죄송하지만 어제 공부를 안 해서 여기서 마치겠습니다. 나중에 추가하겠습니다. 2020. 7. 16.