
学位论文简介
文本对话情感识别是智能对话系统实现共情交互的关键。现有主流方法多局限于单话语独立分类,忽视了情感演变的因果性与关联性,存在“结构性缺失”的技术瓶颈。为此,本文围绕心理学“情感转移”理论,探索对话情感的动态演变规律,建立了一套涵盖“知识形式化—目标内化—表征重塑—解码优化”的情感转移结构化建模理论与方法体系。主要创新成果如下:
(1) 针对情感转移规律隐蔽难用的问题,构建了情感转移知识图谱,提出融合深度翻译范式的情感转移网络与“情感修正”机制,实现情感演变规律向显式结构化知识的映射,为基线模型提供逻辑自洽的先验增强。
(2) 为突破单一分类目标的局限,提出融合情感预测与转移的双视角协同学习框架及跨视角投影策略。该方法将因果动态规律内化为正则化约束,驱动模型生成兼具判别准确性与逻辑连贯性的情感分布。
(3) 针对现有表征难以捕捉深层拓扑关联的缺陷,首次引入生成式掩码建模,提出掩码情感转移任务及自蒸馏协同训练架构。通过重构情感轨迹,将全局结构性依赖深植于潜在表征,重塑特征空间的表达能力。
(4) 为克服解码易陷局部最优及静态转移假设的瓶颈,提出语境感知的情感转移条件随机场模型与双目标动态加权优化框架。实现了特定语境下转移规律的动态建模,有效保障了标签序列生成的全局最优性。
主要学术成果
[1] Huan Zhao, Xupeng Zha, et al. EmoTransKG: An Innovative Emotion Knowledge Graph to Reveal Emotion Transformation[C]//Findings of the Association for Computational Linguistics. ACL, 2024: 12098-12110. (CCF-A 类会议,导师第一作者,本人第二作者)
[2] Xupeng Zha, Huan Zhao, et al. Dual-View Learning for Conversational Emotion Recognition Through Context and Emotion-Shift Modeling[C]//Proceedings of the AAAI Conference on Artificial Intelligence. 2025, 39(24): 25823-25831. (CCF-A 类会议,第一作者)
[3] Xupeng Zha, Huan Zhao, et al. ESIHGNN: Event-State Interactions Infused Heterogeneous Graph Neural Network for Conversational Emotion Recognition[C]//IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, 2024: 11136-11140. (CCF-B 类会议, 第一作者)
[4] Xupeng Zha, Huan Zhao, et al. Masked Emotion-Transformation Modeling with Self-Distillation for Conversational Emotion Recognition. IEEE Transactions on Affective Computing. (中科院一区, 第一作者, 审稿中)
[5] 赵欢, 查徐鹏. 基于掩码预训练的图像自监督表示学习方法及装置:中国,CN 116894994 B [P]. 2025-05-23. (发明专利,授权,导师第一, 本人第二)
[6] 赵欢, 查徐鹏. 用于图像掩码预训练的知识蒸馏方法及装置:中国,CN 116894995 B[P]. 2025-09-09. (发明专利,授权,导师第一, 本人第二)
[7] 赵欢, 查徐鹏. 一种端到端的图像掩码预训练方法及装置:中国,CN 115114480 B[P]. 2025-09-22. (发明专利,授权,导师第一, 本人第二)