华泰证券-华泰人工智能系列之三十七:舆情因子和BERT情感分类模型
- 2023-08-15 19:05:00
- aiadmin 原创
- 1825
:%,且笼盖率随年华推移逐步上升。因子正在沪深300因素股内阐扬最好,行业市值中性后RankIC均值为6.13%,IC_IR为0.42,分5层测试中TOP组合年化收益率为17.79%,众空组合夏普比率为1.66。因子正在中证500因素股内阐扬次之,正在全A股内则阐扬最差。前沿的NLP模子BERT能。”
1.本文琢磨了基于金融音讯的舆情因子,并测试了BERT文本情绪分类模子跟着邦内量化投资的开展,开掘另华泰证券类数据中的增量讯息逐步受投资者眷注。
3.本文提取Wind金融音讯数据中的情绪正负面标签修筑音讯舆情舆情因子和BERT情绪分类模子因子,因子正在沪深300内阐扬最好。
4.进一步地,本文先容了前沿的自华泰证券然措辞解决(NLP)模子BERT的道理和锻炼要领,并基于Wind的有标注金融音讯数据锻炼金融音讯情绪分类模子,模子正在正负不均衡样本上抵达了很高的预测精度。
6.通过LIT可分解文本中字符看待预测结果的紧急舆情因子和BERT情绪分类模子性并助助理会BERT的研习机制。
7.基于金华泰证券融音讯的舆情因子具有必然选股效益,正在沪深300内阐扬最好本文基于Wind金融音讯数据,提取个中的情绪正负面标签,修筑日频的音讯舆情因子。
8.2017年往后,因子正在沪深300、中证500、全A股的均匀笼盖率分袂为84.41%,76.16%,63.03%,且笼盖率随年华推华泰人工智能系列之三十七移逐步上升。
9.因子正在沪深300因素股内阐扬最好,行业市值中性后RankIC均值为6.13%,IC_IR为0.42舆情因子和BERT情绪分类模子,分5层测试中TOP组合年化收益率为17.79%,众空组合夏普比率为1.66。
11.前沿的NLP模子BERT能完成高精度的金融音讯情绪分类近年来,NLP范畴最前沿的琢磨效率是预锻炼模子BE华泰人工智能系列之三十七RT。
12.模子最初利用大方无监视语料举办措辞模子预锻炼,再利用少量标注语料举办微调来完舆情因子和BERT情绪分类模子成实在职责(如本文的金融音讯情绪分类)。
14.随后,本文基于Wind的有华泰人工智能系列之三十七标注金融音讯数据,利用BERT锻炼金融音讯情绪分类模子。
15.模子正在正负不均衡样本上抵达了很高的预测精度,样本外的正确率为舆情因子和BERT情绪分类模子0.9826,AUC为0.9746,切确率为0.9736,召回率为0.9744。
16.掀开BERT模子的黑箱:模子可注释性器械LIT先容BERT模子机合繁杂且参数目宏壮,本文借助Google揭晓的开源NLP模子可注释性器械LIT华泰证券来掀开BERT的黑箱,理会BERT的“推敲进程”。
17.LIT有华泰人工智能系列之三十七两个紧急模块:(1)SalienceMaps模块,可分解输入文本中每个字符看待模子预测结果的紧急性。
18.例句中的结果显示,正舆情因子和BERT情绪分类模子面情绪音讯中“同比预增”、“中标”等字符紧急性较高,负面情绪音讯中“风控”、“摘牌”、“减持”等字符紧急性较高。
20.(2)Attention模块,可分解贯注力权重,从而助助理会BE华泰人工智能系列之三十七RT的研习机制。
21.危急提示:舆情因子的测试结果是史乘舆情因子和BERT情绪分类模子阐扬的总结,存正在失效的恐怕。
联系人: | 王先生 |
---|---|
电话: | 15640228768 |
微信: | 1735252255 |
地址: | 沈阳市铁西区兴华南街58-6号 |
-
思陌产品
深度学习系统产品介绍 -
使用帮助
使用手册 -
关于我们
公司简介 -
资讯反馈
交流论坛 -
联系我们
Tel 15640228768 QQ/WX技术支持 1735252255