基于OpenAI Gym的程序化交易环境模拟器, 旨在为沪深A股基于强化学习的交易算法提供方便使用, 接近真实市场的交易环境
基于tenvs的RL算法baselines repo: tbase
-
自动从tushare下载数据,已经下载的数据不会重复下载(默认目录"/tmp/tenvs")
-
撮合规则:
-
- 基于最高,最低价成交, 对交易量不作限制
-
- 基于
bar open price
成交, 根据余额,限制成交
- 基于
-
-
下单按照A股的规则,买卖按照1手100股为基本交易单位
-
有拆分时,会根据市值对持仓进行相应的倍增, 以保持与真实市场一致
-
step() 比OpenAI gym多返回一个名为rewards的list, 包含每支股票的reward, 以方便Multi-Agent算法实现
支持: MacOS/Linux/Windows, python 3.5+, 推荐使用 python3.8
pip install tenvs
设置 tushare token(Tushare token注册申请):
export TUSHARE_TOKEN=YOUR_TOKEN
场景 | 实现 | action | observation | reward | 使用例子 |
---|---|---|---|---|---|
单支股票, 全仓操作, 每日先卖再买 | simple.py | [scaled_sell_price, scaled_buy_price | 市场信息+部分账户信息 | 可参数选择 | simple_test.py |
多支股票平均分仓, 每日先卖再买 | average.py | [scaled_sell_price, scaled_buy_price] * n | 市场信息+部分账户信息 | 可参数选择 | average_test.py |
多支股票, 支持仓位控制, 每日先卖再买 | multi_vol.py | [scaled_sell_price, scaled_sell_volume, scaled_buy_price, scaled_buy_volume] * n | 市场信息+部分账户信息 | 可参数选择 | multi_vol_test.py |
场景:
- 单支股票, 全仓操作
- 多支股票, 均匀分仓操作
- 多支股票,支持仓位控制
- simple: 盈利=1,否则=-1
- daily_return: 每日的收益率
- daily_return_add_count_rate: 收益率 + 成交统计信息
- daily_return_add_price_bound: 收益率 - 最高最低价与买卖价差MSE
- daily_return_with_chl_penalty: 收益率 - [close,high,low]与买卖价格相应惩罚
- Fork this repo
- Add or change code && Please add tests for changes
- Test:
docker-compose up
- Send pull request
可以参考average.py的写法
- 定义action
- 定义observation
- 定义reward
- action space, observation space信息补充
- 场景增加
- 增加T0场景
- 增加的reward函数(Blog post在不同的算法上的表现性能比较)
- 增加observation中信息(因子挖掘)
- 支持数据粒度:分钟
- render方法实现
线上交流方式
- QQ群: 477860214
参考: