세미나 일정 12월 29일 (화): CHAPTER 1 강화학습이란? – 지창훈 (페이지수 : 22) 1월 5일 (화): CHAPTER 2 강화학습 문제의 모형화: 마르코프 결정 과정 – 유승범 (페이지수 : 36) 1월 12일 (화): CHAPTER 3 가장 나은 동작의 선택: 심층 Q 신경망(DQN) – 오차영 (페이지수 : 24, 3.1~3.2) 1월 19일 (화): CHAPTER 3 가장 나은 동작의 선택: 심층 Q 신경망(DQN) – 길상현 (페이지수 : 18, 3.3~3.5) 1월 26일 (화): CHAPTER 4 정책 기울기 방법 – 이승훈 (페이지수 : 24) 2월 2일 (화): CHAPTER 5 좀 더 어려운 문제 풀기: 행위자-비평자 모형 – 최요한 (페이지수 : 32) 2월 4일 (목): CHAPTER 6 또 다른 최적화 방법 – 지창훈 (페이지수 : 30) 2월 9일 (화): CHAPTER 7 모든 가능성의 탐색: 분포 심층 Q 신경망 – 유승범 (페이지수 : 28, 7.1~7.4) 2월 16일 (화): CHAPTER 7 모든 가능성의 탐색: 분포 심층 Q 신경망 – 오차영 (페이지수 : 20, 7.5~7.7) 2월 18일 (목): CHAPTER 8 호기심 주도 탐험 – 길상현 (페이지수 : 38) 2월 23일 (화): CHAPTER 9 다중 에이전트 강화학습 – 이승훈 (페이지수 : 21, 9.1~9.3) 2월 25일 (목): CHAPTER 9 다중 에이전트 강화학습 – 최요한 (페이지수 : 27, 9.4~9.5) 3월 2일 (화): CHAPTER 10 해석 가능한 강화학습: 주의 모형과 관계 모형 – 자창훈 (페이지수 : 31, 10.1~10.3) 3월 4일 (목): CHAPTER 10 해석 가능한 강화학습: 주의 모형과 관계 모형 – 유승범 (페이지수 : 23, 10.4~10.6)