1. 根据btm.csv文件,对每日的btm进行分组,数值最小的20%赋值为1,数值第二小的20%赋值为2,以此类推,数值最大的20%赋值为5。输出一个btmgroup文件;输出示例如下表所示:
股票1 |
股票2 |
股票3 |
股票4 |
股票5 |
|
2007/1/4 |
1 |
1 |
2 |
2 |
2 |
2007/1/5 |
1 |
2 |
3 |
4 |
5 |
… |
… |
… |
… |
… |
… |
2017/12/25 |
4 |
2 |
3 |
2 |
1 |
2. 根据mktv.csv文件,对每日的mktv进行分组,数值最小的20%赋值为1,数值第二小的20%赋值为2,以此类推,数值最大的20%赋值为5,输出一个mktvgroup.csv文件;输出格式如下表所示:
股票1 |
股票2 |
股票3 |
股票4 |
股票5 |
|
2007/1/4 |
2 |
3 |
2 |
1 |
4 |
2007/1/5 |
1 |
2 |
3 |
4 |
5 |
… |
… |
… |
… |
… |
… |
2017/12/25 |
2 |
3 |
5 |
3 |
2 |
3. 根据btm和mktv的分组结果,输出联合分组每组根据市值加权后的每日平均收益。(每只股票的收益率用dlgret.csv的数值),输出一个btmmktvret.csv文件,输出格式如下表所示:
组合11 |
组合12 |
组合13 |
组合14 |
组合15 |
组合21 |
… |
|
2007/1/4 |
… |
||||||
2007/1/5 |
… |
||||||
… |
… |
… |
… |
… |
… |
… |
… |
其中组合AB的意思是btm分组序号为A,mktv分组序号为B的组合的市值加权平均收益
4. 从第121个交易日(2007年7月4日)开始,根据前面120个交易日的平均收益,对股票进行分组,分十组,前120个交易日平均收益最低的10%赋值为1,平均收益第二低的10%赋值为2,以此类推,平均收益最高的10%赋值为10。输出一个momentum.csv文件,输出格式如下:
股票1 |
股票2 |
股票3 |
股票4 |
股票5 |
|
2007/7/4 |
1 |
2 |
3 |
4 |
5 |
2007/7/5 |
6 |
7 |
8 |
9 |
10 |
… |
… |
… |
… |
… |
… |
(第122个交易日股票分组根据第2-第121个交易日的平均收益进行;第123个交易日股票分组根据第3-122个交易日股票分组进行,以此类推)
5. 根据第4步的分组结果,计算每组的每日市值加权平均收益率(根据dlgret.csv的收益率计算),输出momentumret.csv, 输出示例如下:
组合1 |
组合2 |
组合3 |
组合4 |
组合5 |
组合6 |
… |
|
2007/7/4 |
… |
||||||
2007/7/5 |
… |
||||||
… |
… |
… |
… |
… |
… |
… |
… |
6. 根据每只个股的每日beta值,分别计算btm和mktv联合分组(25组)和momentum分组(10组)的市值加权平均beta,分别输出为btmmktvbeta.csv和momentumbeta.csv
输出格式参照第三步和第5步。
数据集已上传至百度云:
链接: https://pan.baidu.com/s/1mimWP2C 密码: 9xkh