Skip to content

Commit

Permalink
Add files via upload
Browse files Browse the repository at this point in the history
修正了markdown的内容(之前未能随着代码变化而修改)
  • Loading branch information
HaoningChen authored Mar 21, 2023
1 parent a419bc4 commit 65f1a81
Showing 1 changed file with 3 additions and 3 deletions.
6 changes: 3 additions & 3 deletions data_insight.ipynb
Original file line number Diff line number Diff line change
Expand Up @@ -1420,12 +1420,12 @@
"cell_type": "markdown",
"metadata": {},
"source": [
"划分训练集,验证集和测试集; \n",
"划分训练集,验证集和测试集(测试集时间为2019年1月1月-2022年12月28日), 训练集和验证集在剩余数据中按7:3的比例随机拆分; \n",
"分离因子和目标值; \n",
"对因子(和目标值)按截面分别进行RobustZScoreNorm(和ZScoreNorm),并使用三倍标准差法截断异常值; \n",
"对因子(和目标值)按截面分别进行标准化处理(ZScoreNorm),并使用三倍标准差法截断异常值; \n",
"按照股票代码,使用ffill方法填充因子缺失值,并去除剩余缺失值;并使目标值的index与因子相匹配\n",
"\n",
"注: 由于直接对目标值按截面进行标准化可能在回测时引起数据窥探,故对目标值进行标准化时,使用滞后2阶的均值和标准差"
"注: 由于直接对目标值按截面进行标准化可能在回测时引起数据窥探,故对目标值进行标准化时,使用滞后2阶的均值和标准差, 并以年化5$\\%$和年化30$\\%$填充缺失值"
]
},
{
Expand Down

0 comments on commit 65f1a81

Please sign in to comment.