华泰证券-华泰人工智能系列之三十七:舆情因子和BERT情感分类模型

2023-08-15 19:05:00
aiadmin
原创
1823

:%,且笼盖率随年华推移逐步上升。因子正在沪深300因素股内阐扬最好,行业市值中性后RankIC均值为6.13%,IC_IR为0.42,分5层测试中TOP组合年化收益率为17.79%,众空组合夏普比率为1.66。因子正在中证500因素股内阐扬次之,正在全A股内则阐扬最差。前沿的NLP模子BERT能。”

1.本文琢磨了基于金融音讯的舆情因子,并测试了BERT文本情绪分类模子跟着邦内量化投资的开展,开掘另华泰证券类数据中的增量讯息逐步受投资者眷注。

3.本文提取Wind金融音讯数据中的情绪正负面标签修筑音讯舆情舆情因子和BERT情绪分类模子因子,因子正在沪深300内阐扬最好。

4.进一步地,本文先容了前沿的自华泰证券然措辞解决(NLP)模子BERT的道理和锻炼要领,并基于Wind的有标注金融音讯数据锻炼金融音讯情绪分类模子,模子正在正负不均衡样本上抵达了很高的预测精度。

6.通过LIT可分解文本中字符看待预测结果的紧急舆情因子和BERT情绪分类模子性并助助理会BERT的研习机制。

7.基于金华泰证券融音讯的舆情因子具有必然选股效益,正在沪深300内阐扬最好本文基于Wind金融音讯数据,提取个中的情绪正负面标签,修筑日频的音讯舆情因子。

8.2017年往后,因子正在沪深300、中证500、全A股的均匀笼盖率分袂为84.41%,76.16%,63.03%,且笼盖率随年华推华泰人工智能系列之三十七移逐步上升。

9.因子正在沪深300因素股内阐扬最好,行业市值中性后RankIC均值为6.13%,IC_IR为0.42舆情因子和BERT情绪分类模子,分5层测试中TOP组合年化收益率为17.79%,众空组合夏普比率为1.66。

11.前沿的NLP模子BERT能完成高精度的金融音讯情绪分类近年来,NLP范畴最前沿的琢磨效率是预锻炼模子BE华泰人工智能系列之三十七RT。

12.模子最初利用大方无监视语料举办措辞模子预锻炼,再利用少量标注语料举办微调来完舆情因子和BERT情绪分类模子成实在职责(如本文的金融音讯情绪分类)。

14.随后,本文基于Wind的有华泰人工智能系列之三十七标注金融音讯数据,利用BERT锻炼金融音讯情绪分类模子。

15.模子正在正负不均衡样本上抵达了很高的预测精度,样本外的正确率为舆情因子和BERT情绪分类模子0.9826,AUC为0.9746,切确率为0.9736,召回率为0.9744。

16.掀开BERT模子的黑箱:模子可注释性器械LIT先容BERT模子机合繁杂且参数目宏壮,本文借助Google揭晓的开源NLP模子可注释性器械LIT华泰证券来掀开BERT的黑箱,理会BERT的“推敲进程”。

17.LIT有华泰人工智能系列之三十七两个紧急模块:(1)SalienceMaps模块,可分解输入文本中每个字符看待模子预测结果的紧急性。

18.例句中的结果显示,正舆情因子和BERT情绪分类模子面情绪音讯中“同比预增”、“中标”等字符紧急性较高,负面情绪音讯中“风控”、“摘牌”、“减持”等字符紧急性较高。

20.(2)Attention模块,可分解贯注力权重,从而助助理会BE华泰人工智能系列之三十七RT的研习机制。

21.危急提示:舆情因子的测试结果是史乘舆情因子和BERT情绪分类模子阐扬的总结,存正在失效的恐怕。

联系我们
联系人: 王先生
电话: 15640228768
微信: 1735252255
地址: 沈阳市铁西区兴华南街58-6号