From ab5b369b9d8e260617f9ed74f058714a7c818cde Mon Sep 17 00:00:00 2001 From: johnjim0816 <39483938+johnjim0816@users.noreply.github.com> Date: Sat, 29 Jul 2023 15:17:42 +0800 Subject: [PATCH] update --- docs/ch9/main.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/docs/ch9/main.md b/docs/ch9/main.md index 65a9d8d..4e24cd3 100644 --- a/docs/ch9/main.md +++ b/docs/ch9/main.md @@ -252,4 +252,4 @@ $$ \nabla_\theta \log \pi_\theta(s, a)==\frac{\left(a-\phi(s)^T \theta\right) \phi(s)}{\sigma^2} $$ -这个公式虽然看起来很复杂,但实现起来其实很简单,只需要在模型最后一层输出两个值,一个是均值,一个是方差,然后再用这两个值来构建一个高斯分布,然后采样即可。 \ No newline at end of file +这个公式虽然看起来很复杂,但实现起来其实很简单,只需要在模型最后一层输出两个值,一个是均值,一个是方差,然后再用这两个值来构建一个高斯分布,然后采样即可,具体同样在实战中展开。 \ No newline at end of file