본문 바로가기

분류 전체보기218

[강화학습] MDP를 알 때의 플래닝 모델을 알고 있을 때 == 모든 정보를 알고 있을 때 == MDP를 알고 있을 때 이때 사용하는 방법이 크게 3가지가 있다. 1. Policy evaluation 2. Policy iterative 3. Value iterative 1. Policy evaluation 모든 상태의 값을 임의의 값으로 초기화한다. 하나의 상태에 대해 벨만 기대방정식으로 값을 업데이트 한다. 다른 모든 상태에 대해서도 값을 업데이트한다. 수렴할 때 까지 2,3을 계속 반복한다. 이렇게 하면 임의의 값만 있었는데도 실제 값(reward)이 조금씩 섞여 들어가면서 결과적으로는 우리가 찾으려는 목표에 수렴한다. 정책이 고정된 상황에서의 문제 해결 방법이다. 2. Policy iteration 1은 정책을 평가했다 == 벨만 기대.. 2021. 10. 3.
[엘리스] Docker, 팀 스터디, 팀 프로젝트 (13주차, 방학) 이번 포스팅 내용은 9월 13~17일, 20~24일의 내용입니다. (9/16) Docker 강의 짝짝짝~ 드디어 제가 듣고 싶었던 Docker 강의를 수강하였습니다. 제가 Docker 강의를 듣고 싶었던 이유 중 가장 큰 이유는, 옛날에 모두를 위한 딥러닝 시즌2 Pytorch 강의를 듣고 싶었는데 Docker를 어떻게 하는지 모르겠고 귀찮아서 때려쳤었기 때문입니다.... 그날 맺힌 한 때문에 Docker강의를 기다리고 있었습니다. Docker란? docker는 OS와 사용할 앱을 하나의 이미지로 묶어 어떤 환경에서도 돌아갈 수 있도록 제공해줍니다. 이 이미지가 실행된 상태에 있을 때 이를 컨테이너라고 부릅니다. 컨테이너들은 각각 격리되어있고 캡슐화되어있기 때문에 서로에게 영향을 주지 않고 독립적으로 실.. 2021. 9. 26.
[엘리스] 엘리스에서의 첫 프로젝트 안녕하세요~ 고니입니다! 지금까지 블로그를 보시면 아시겠지만, 저는 현재 엘리스라는 교육 기관에서 AI 트랙 2기 레이서로 교육을 받고 있습니다. 그러던 와중에 감사하게도 엘리스 내에서 관련 포스팅을 해줄 레이서 블로거를 모집한다는 공지를 보고 신청 및 합격하여 지금 글을 쓰고 있습니다. 물론 지금도 정성껏 쓰고 있지만 좀 더 정성껏 써보도록 하겠습니다. ㅎㅎ 프로젝트 9주차. 프로젝트 주간 9주차에는 지난 8주간 배운 다음 과목들을 바탕으로 프로젝트를 진행하였습니다. 프로그래밍 기초(CLI, Git, 자료구조, 알고리즘, HTML, CSS, JS) 백엔드(Flask, MySQL, MongoDB) 프론트엔드(React) 모던 웹 애플리케이션(비동기, ...) 프로젝트 주제 프로젝트 주제는 총 세가지가 있.. 2021. 9. 11.
[CSS] flexbox 속성들 flexbox flexbox는 총 두가지로 되어있다. 가장 작은 유닛인 item과 item들을 담는 container. 각각 적용 가능한 속성은 다음과 같다. container 속성 display: flex;플렉스박스 쓰려명 ㅇ당연 flex-direction: row, row-reverse, columns, column-reverse flex-wrap:wrap: 줄바꿈, wrap-reverse, nowrap:안 바꿈 /* flex-flow에는 direction과 wrap을 한번에 쓸 수 있다 */ flex-flow: [direction, wrap] 아이템 배치 /* 중심축 배치 */ justify-content: [flex-start, flex-end, center, space-around] 어디에 붙일.. 2021. 8. 27.