Skip to content

Commit

Permalink
format
Browse files Browse the repository at this point in the history
  • Loading branch information
johnjim0816 committed Aug 15, 2023
1 parent d8024ee commit 3f36b49
Show file tree
Hide file tree
Showing 3 changed files with 4 additions and 0 deletions.
2 changes: 2 additions & 0 deletions docs/ch6/main.md
Original file line number Diff line number Diff line change
@@ -1,5 +1,7 @@
# 深度学习基础

$\qquad$ 在前面章节中我们主要介绍了传统强化学习的内容,这些内容涵盖了基础的问题核心和解决方法。但是对应的算法并不能解决高维度的复杂问题,因此现在普遍流行将深度学习和强化学习结合起来,利用深度学习网络强大的拟合能力通过将状态、动作等作为输入,来估计对应的状态价值和动作价值等等。

前面章节中都属于基础的强化学习内容,在后面的章节中我们主要讲解深度强化学习,在此之前会为读者介绍强化学习中涉及到的一些深度学习基础,以便有一个过渡。

## 线性模型
Expand Down
2 changes: 2 additions & 0 deletions docs/ch8/main.md
Original file line number Diff line number Diff line change
@@ -1,5 +1,7 @@
# DQN 算法进阶

$\qquad$ 本章将介绍一些基于 $\text{DQN}$ 改进的一些算法。这些算法改进的角度各有不同,例如 $\text{Double DQN}$ 以及 $\text{Dueling DQN}$ 等算法主要从网络模型层面改进,而 $\text{PER DQN}$ 则从经验回放的角度来改进

本章开始介绍一些基于 $\text{DQN}$ 改进的一些算法,由于本章的算法都是网络模型、经验回放等层面的改进,整体的训练模式跟 $\text{DQN}$ 算法是一模一样的,因此出于简洁考虑,本章算法不再贴出对应的伪代码。另一方面来讲,建议读者在阅读本章之前,牢牢掌握 $\text{DQN}$ 算法的原理。
## Double DQN 算法

Expand Down
Binary file modified words/第5章 免模型控制.docx
Binary file not shown.

0 comments on commit 3f36b49

Please sign in to comment.