본문 바로가기

📂 Engineering/🔹 Data & AI25

[강화학습] MDP를 알 때의 플래닝 모델을 알고 있을 때 == 모든 정보를 알고 있을 때 == MDP를 알고 있을 때 이때 사용하는 방법이 크게 3가지가 있다. 1. Policy evaluation 2. Policy iterative 3. Value iterative 1. Policy evaluation 모든 상태의 값을 임의의 값으로 초기화한다. 하나의 상태에 대해 벨만 기대방정식으로 값을 업데이트 한다. 다른 모든 상태에 대해서도 값을 업데이트한다. 수렴할 때 까지 2,3을 계속 반복한다. 이렇게 하면 임의의 값만 있었는데도 실제 값(reward)이 조금씩 섞여 들어가면서 결과적으로는 우리가 찾으려는 목표에 수렴한다. 정책이 고정된 상황에서의 문제 해결 방법이다. 2. Policy iteration 1은 정책을 평가했다 == 벨만 기대.. 2021. 10. 3.
아나콘다 가상환경 명령어 모음 가상환경 생성, 활성화, 비활성화, 삭제 필요없는 파일 제거(용량 확보) # 모든 가상환경의 목록 출력 conda info --envs # 가상환경 만들기 conda create -n 가상환경이름 python=파이썬버전 # 가상환경 활성화 conda activate 가상환경이름 # 가상환경 비활성화 conda deactivate # 가상환경 지우기 conda remove -n 가상환경이름 --all # 필요없는 파일 제거 conda clean --all 2021. 7. 19.
파이썬으로 배우는 알고리즘 트레이딩 No module named 에러 해결 https://wikidocs.net/book/110 위키독스 온라인 책을 제작 공유하는 플랫폼 서비스 wikidocs.net 위 교재를 따라하던 중 에러가 발생했다. No module named PyQt5.sip No module named PyQt5.sip --------- 또는 ----------- No module named PyQt5.QAxContainer 나는 다음과 같이 해결했다. 1. Anaconda Prompt 실행하기 2. 가상환경 생성하기 conda prompt창에서 다음 명령어를 입력한다. set CONDA_FORCE_32BIT=1 conda create -n trading python=3.7 https://g0n1.tistory.com/65 Python -아나콘다 가상환경 만드는 .. 2021. 7. 19.
빅데이터분석기사 실기 준비 - 분류 모델 11개 비교 import pandas as pd import numpy as np import time from sklearn.model_selection import StratifiedKFold as SKF from sklearn.metrics import roc_auc_score,f1_score,precision_score,accuracy_score X_train = pd.read_csv('X_train.csv',encoding='cp949') y_train = pd.read_csv('y_train.csv',encoding='cp949') X_train = X_train.drop('cust_id',1).fillna(0) y_train = y_train['gender'] X_train = pd.concat([X_t.. 2021. 6. 16.