Skip to content

Commit

Permalink
format doc
Browse files Browse the repository at this point in the history
  • Loading branch information
johnjim0816 committed Aug 22, 2023
1 parent e8a1818 commit 6906681
Show file tree
Hide file tree
Showing 2 changed files with 14 additions and 2 deletions.
2 changes: 1 addition & 1 deletion docs/ch6/main.md
Original file line number Diff line number Diff line change
Expand Up @@ -9,7 +9,7 @@ $\qquad$ 在过渡到深度强化学习之前,本章将对强化学习中用
$\qquad$ 之前我们讲到了强化学习的问题可以拆分成两类问题,即预测和控制。预测的主要目的是根据环境的状态和动作来预测状态价值和动作价值,而控制的主要目的是根据状态价值和动作价值来选择动作。换句话说,预测主要是告诉我们当前状态下采取什么动作比较好,而控制则是按照某种方式决策。就好比军师与主公的关系,军师提供他认为最佳的策略,而主公则决定是否采纳这个策略。


$\qquad$ 不知道读者们是否看过《超智能足球$\text{GGO}$》这部热血动漫,老实讲它是笔者看过比较好的带有高科技元素的足球动漫,主要讲述的是主角团带领着他们的超智能足球机器人组队打入世界大赛的故事,也是启引笔者选择强化学习的初衷之一。
$\qquad$ 不知道读者们是否看过《超智能足球》这部热血动漫,老实讲它是笔者看过比较好的带有高科技元素的足球动漫,主要讲述的是主角团带领着他们的超智能足球机器人组队打入世界大赛的故事,也是启引笔者选择强化学习的初衷之一。

$\qquad$ 如图 $\text{6-1}$ 所示,其中有一队叫做英国三狮,主要领队是尼尔逊和巴菲斯,巴菲斯是一个超级数据分析专家,他能在各种场景下计算对手传球、射门的概率,也包括我方进球和传球的各种收益,然后尼尔逊会根据他的数据分析结果来决定下一步行动。尼尔逊也是一个非常有头脑的领队,他不会只依靠巴菲斯的计算结果,而是会结合自身的经验和对足球的直觉来做出数据之外的决策。这个数据之外的决策在强化学习中叫做探索,也就是说尼尔逊会根据巴菲斯的计算结果来做出决策,但是他也会根据自己的经验和直觉来做出一些不确定的决策,这样才能保证他的队伍不会被对手轻易的猜到。

Expand Down
14 changes: 13 additions & 1 deletion docs/index.html
Original file line number Diff line number Diff line change
Expand Up @@ -6,7 +6,17 @@
<meta http-equiv="X-UA-Compatible" content="IE=edge,chrome=1" />
<meta name="description" content="Description">
<meta name="viewport" content="width=device-width, initial-scale=1.0, minimum-scale=1.0">
<link rel="stylesheet" href="//cdn.jsdelivr.net/npm/docsify@4/lib/themes/vue.css">
<!-- <link rel="stylesheet" href="//cdn.jsdelivr.net/npm/docsify@4/lib/themes/vue.css"> -->
<!-- Themes (light + dark) -->
<link rel="stylesheet" media="(prefers-color-scheme: dark)" href="https://cdn.jsdelivr.net/npm/docsify-themeable@0/dist/css/theme-simple-dark.css">
<link rel="stylesheet" media="(prefers-color-scheme: light)" href="https://cdn.jsdelivr.net/npm/docsify-themeable@0/dist/css/theme-simple.css">

<!-- Custom Styles -->
<style>
:root {
/* --theme-hue: 325; */
}
</style>
</head>
<body>
<div id="app"></div>
Expand Down Expand Up @@ -53,5 +63,7 @@
<script src="//cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
<!-- docsify-latex plugin -->
<script src="//cdn.jsdelivr.net/npm/docsify-latex@0"></script>
<!-- code copy -->
<script src="//cdn.jsdelivr.net/npm/docsify-copy-code"></script>
</body>
</html>

0 comments on commit 6906681

Please sign in to comment.