
学位论文简介
提升大模型推理与学习的准确性、稳定性与可信性是当前人工智能领域亟待解决的关键问题。因此,本文围绕大模型推理和学习这一核心问题,聚焦如何引入结构因果模型以突破传统仅依赖统计相关性的方法,系统探讨了因果图构建、因果干预及反事实推理在大模型推理和学习中的应用,构建了一种兼具因果推理能力与准确性的大模型推理和学习框架。取得了以下主要创新性研究成果:
(1)为克服大模型在分类任务中仅依赖统计相关性的问题,本文提出了基于神经因果图的大模型推理和学习方法,显式构建变量间的线性因果关系,实现了推理过程的可解释和可干预能力,有效提升了大模型在分类任务中的推理精度。
(2)针对传统线性因果图在捕捉复杂非线性关系时的局限,设计了一种利用大模型自注意力机制端到端学习非线性因果图的方法,有效揭示数据中隐含的复杂非线性因果关系,显著提升了多标签分类任务中的推理准确性和泛化性能。
(3)为应对多模态环境下数据因果偏差问题,本文提出了基于因果干预的大模型推理方法,通过前门准则构建基于上下文检索的多模态推理和学习方法,增强了模型在多模态数据偏差条件下的稳定性和鲁棒性。
(4)为解决大语言模型输出“幻觉”问题,构建了基于因果干预的大语言模型可信推理框架,通过利用前门准则构建知识问答因果图引导推理过程,确保模型遵循因果逻辑进行自我反思,有效提高了推理决策的准确性和可信度。
(5)针对大语言模型在自我优化中的自监督学习瓶颈,提出了基于反事实推理的大语言模型可信学习方法,实现大语言模型在自监督状态下构建和优化反事实推理路径,实现模型的自我评估和自我优化,有效提升了其自我能力和推理准确度。
主要学术成果
[1] Jiawei Wang, Zhanchang Ma, Da Cao, Yuquan Le, Junbin Xiao, Tat-Seng Chua. Deconfounded Multimodal Learning for Spatio-temporal Video Grounding. In Proceedings of the ACM International Conference on Multimedia. ACM, 7521-7529. (CCF-A, 第一作者)
[2] Jiawei Wang, Yuquan Le, Da Cao, Shaofei Lu, Zhe Quan, Meng Wang. Graph Reasoning with Supervised Contrastive Learning for Legal Judgment Prediction. IEEE Transactions on Neural Networks and Learning Systems, 2025, 36(2); 2801-2815 (SCI-1, 第一作者)
[3] Jiawei Wang, Da Cao, Shaofei Lu, Zhanchang Ma, Junbin Xiao, Tat-Seng Chua. Causal-driven Large Language Models with Faithful Reasoning for Knowledge Question Answering. In Proceedings of the ACM International Conference on Multimedia. ACM, 4331-4340. (CCF-A, 第一作者)
[4] Jiawei Wang, Shaofei Lu, Da Cao, Dongyu Wang, Yuquan Le, Zhe Quan, Tat-Seng Chua. Neural Causal Graph for Interpretable and Intervenable Classification. International Conference on Learning Representations. 2025 (第一作者)