안녕하세요, '아메리카노10잔' 강화학습연구소장 정의진입니다! 2차 모임(2018-06-16)에서는 열 분의 멤버들 중 4명밖에 모이지 못했습니다ㅠ 대부분 직장인이시라 그 와중에도 멀게는 대전에서부터(부산도 있습니다!) 오시는것만으로도 대단하신것 같습니다. 그리고 초등학교에서 영어선생님을 맡고 계시는 새로운 분도 오늘 스터디에 참가하셨습니다.
오늘은 1차 모임때, 2차 모임으로 모일 때 까지 공부해오기로 한 MDP, Monte-Carlo, Time-Difference, Sarsa, Q-learning의 개념을 다시 정확히 정리