你的位置:米家app下载并安装步骤 > 新闻动态 > NGAT:用于长期股票预测的节点级图注意网络,准确率提升10%
NGAT:用于长期股票预测的节点级图注意网络,准确率提升10%
发布日期:2025-07-22 10:24 点击次数:93
“NGAT: A Node-level Graph Attention Network for Long-term Stock Prediction”
图神经网络(GNNs)通过消息传递机制在图表示学习中占主导地位,适用于股票预测任务,建模公司间关系。现有研究主要关注单日趋势预测,未充分利用图模型的潜力,且忽视波动性预测。本文提出长期股票预测任务,开发专门针对企业关系图的节点级图注意力网络(NGAT)。实验结果显示现有图比较方法在下游任务性能上的局限性。在两个数据集上的实验结果一致证明了所提任务和模型的有效性。【 扫描文末二维码加入星球获取论文,源码 】摘要
图表示学习方法在金融应用中广泛使用,以增强公司表示并利用企业间关系。当前方法面临三大挑战:1) 下游任务设计限制了关系信息的优势;2) 针对股票预测的现有图模型复杂且泛化能力差;3) 基于经验构建的企业关系图缺乏有效的结构比较。本文提出长期股票预测任务,开发专门针对企业关系图的节点级图注意力网络(NGAT)。实验结果显示现有图比较方法在下游任务性能上的局限性。在两个数据集上的实验结果一致证明了所提任务和模型的有效性。简介图神经网络(GNNs)通过消息传递机制在图表示学习中占主导地位,适用于股票预测任务,建模公司间关系。现有研究主要关注单日趋势预测,未充分利用图模型的潜力,且忽视波动性预测。传统GNN架构(如GCNs和GATs)不适合公司关系图(CRGs),因节点特征分布差异。本文提出节点级图注意力网络(NGAT),为每个公司分配独特的注意力机制,适应CRGs。CRGs构建方法缺乏共识,比较不同图构建下的GNN模型性能,揭示仅依赖下游任务评估图质量的局限性。相关工作股票预测研究发展两个维度:从传统计量经济模型到机器学习,从通用模型到金融特定适应。传统模型包括因子分析、时间序列方法和GARCH变体;机器学习引入混合模型,如GARCH与神经网络结合及LSTM。研究任务从次日预测扩展到排名任务、过夜趋势预测和价格限制预测;提出的长期收益/波动预测任务通过企业关系图联合建模多期溢出和风险因素。替代数据源(特别是文本信息)推动图基方法的发展,使用GCN和GAT建模企业间关系。领域特定适应引入了时序GNN、AD-GAT和层次GNN架构,但增加了复杂性和降低了通用性。NGAT架构通过节点特定注意机制解决了复杂性与通用性之间的权衡,支持可移植部署。问题建模本文提出长期收益均值/波动率预测任务,旨在预测未来T个交易日的股票收益趋势和波动性。收益趋势预测为分类任务,判断未来平均收益是高于还是低于前期,分为四种情景:(LP, N+): 上期正收益,下一期更高,表示“激增”。(LN, N+): 上期负收益,下一期更高,表示“反弹”。(LP, N-): 上期正收益,下一期更低,表示“回调”。(LN, N-): 上期负收益,下一期更低,表示“暴跌”。波动率预测为回归任务,使用实际样本标准差估计波动性。N+情景指市场机会,N-情景指下行风险,帮助投资者制定策略。结合长期趋势预测与波动率预测,增强对市场动态的理解,优化投资策略。模型架构序列嵌入研究者使用RNN编码历史交易数据以捕捉股票运动的时间依赖性,常用LSTM作为序列嵌入模块。对于资产集合S中的股票s,在第d天生成序列嵌入h_sd,输入时间序列特征矩阵X_d^s到LSTM模块。X的维度为R^∆d×F,其中∆d为固定滞后大小,F为特征数量,最后时间步的输出作为序列嵌入。关系嵌入股票趋势受历史交易数据和相关股票影响,通过构建基于新闻/推文的公司共现关系生成关系嵌入。每日新闻中提及的公司集合构建关系边,使用条件关系进行时间加权聚合,优先考虑近期影响。NGAT层通过线性投影和掩蔽注意力机制计算节点间的注意力系数,确保节点特定的计算。采用多头注意力机制稳定学习,输出通过加权矩阵进行处理,生成最终的关系嵌入。输出层输出层实现如下:实验数据使用两个公开的日常数据集:SPNews数据集包含S&P500公司新闻和交易数据,ACL2018数据集包含推文和交易数据。SPNews数据集去除跨天和公司重复的新闻项,确保每条新闻仅记录一次。ACL2018数据集通过共同出现的股票标签(如#AAPL, #GOOG)定义公司间的边,去除推文中重复提及的公司。数值数据包括每日交易信息(开盘价、最高价、最低价、收盘价、调整后收盘价和成交量)。实施三步正则化:开盘价标准化最高、最低、收盘价相对于开盘价的变化率计算调整后收盘价转换为股票收益该过程标准化价格,减少因开盘价与其他变量之间的共线性导致的信息冗余。训练步骤参数选择通过验证性能的网格搜索进行。图构建:特征维度 F ∈ [8, 12];记忆窗口 δ ∈ [1, 2, 3, 5, 7, 10](最优 δ = 5);关系阈值 ∈ [0, 1];预测时间 T ∈ [1, 5, 10, 21](业务天数)。模型架构:注意力头数 ∈ [1, 4, 8];隐藏层大小 F ′ ∈ [16, 32, 64];dropout ∈ [0, 0.2, 0.4, 0.6];固定图层数 = 1。训练:使用 Adam 优化器(学习率 lr = 10^-4,权重衰减 5 × 10^-4),Glorot 初始化。固定估计窗口 ∆ d=21。基线比较NGAT模型与其他模型,包括非图模型和图模型。LSTM:单层长短期记忆网络。GCN:包含一个序列嵌入层和一个卷积层。GAT:包含一个序列嵌入层和自注意力层。LSTM+GCN:将GCN和LSTM的结果拼接用于预测。TGC:时间图卷积网络。AD-GAT:属性驱动图注意力网络,捕捉邻居节点的属性敏感动量溢出,使用原论文实现。评估指标分类模型评估指标:整体准确率(ACC)、马修斯相关系数(MCC)、ROC曲线下面积(AUC)。回归模型评估指标:样本外R²和均方误差(MSE)。在ACL2018和SPNews数据集中,分别有76和268家公司,计算所有公司的平均指标。结果NGAT在ACL2018和SPNews数据集上表现优越,相较于GAT分别提升了4.03%、5.90%、2.07%(T=21)和2.08%、8.12%、1.41%(T=10)。所有模型准确率均超过70%,显著优于传统的50-60%预测基准,验证了长期预测的实用价值。高MCC和AUC值表明模型在各类间表现平衡,预测效果有效。AD-GAT表现不佳,因未使用文本嵌入。在市场场景分析中,NGAT在“激增”和“暴跌”预测上表现突出,适合危机规避和利润捕捉。在SPNews上,NGAT相较于LSTM实现了3.2%的N+准确率,尽管N-有所妥协,展现了强大的模式识别能力。NGAT在波动率预测中优于所有基线模型,尤其在ACL2018数据集中,图模型相较于序列模型表现更佳,强调了关系信息的重要性。在SPNews数据集中,尽管文本衍生图的改进有限,NGAT依然表现稳健,证明其从不完美的关系数据中提取可靠信号的能力。NGAT的节点级注意机制在解读金融关系方面有效,月度波动率预测(T=21)在所有设置中表现最佳,符合金融实用性。除NGAT外,其他图模型在所有预测时间段内未能全面超越单独的LSTM序列模型,因不同预测时间段需捕捉不同的动量溢出效应。随着预测时间段T的增加,收益趋势预测性能略有下降,而波动率预测显著提升,T=21在两者之间提供了平衡。图构建方法比较显示:NGAT在所有图类型中均优于GAT,记忆长度优化(5天窗口)对性能至关重要,且下游评估不足以全面评估图质量。总结本文提出了节点级图注意力网络(NGAT),用于建模企业关系图。该方法可扩展至长期股票收益/波动预测任务。实验验证了NGAT的性能优势及长期预测的实用性。尽管NGAT计算复杂度较高,但在固定资产组合设置下仍可接受。
▌关于我们
我们致力于人工智能、量化交易领域前沿研究,分享前沿论文、模型代码、策略实现。如有相关需求,请私信与我们联系。
▌商务合作
请加微信“LingDuTech163”,或公众号后台私信“联系方式”。
关注【灵度智能】公众号,获取更多AI资讯。
灵度智能欢迎关注灵度智能。我们致力于人工智能、量化交易领域前沿研究,分享前沿论文、模型代码、策略实现。如有相关需求,请私信与我们联系。524篇原创内容 公众号 ,
相关资讯
