答辩公告
我的位置在: 首页 > 答辩公告 > 正文
陈海蛟博士生预答辩公告
浏览次数:日期:2025-03-25编辑:




学位论文简介

语音情感识别技术作为人机交互系统的核心组件,已在智能客服、情感计算及心理健康监测等领域形成关键技术支撑。然而,模型训练依赖的高价值情感语料获取困难以及隐私安全问题成为实际应用中的主要挑战。联邦学习通过协同训练实现数据不出域的隐私保护,为解决上述问题提供了可行路径。该框架仍面临系统性能、隐私保护与通信开销的平衡难题。本文系统性地开展面向语音情感识别的联邦学习安全与隐私保护理论研究。主要创新工作如下:

  1. 针对共享模型更新暴露敏感信息问题,本文提出一种新颖的隐私增强方法以对抗属性推理攻击。首先,双向递归神经网络负责捕获序列中的潜在表征以去除部分冗余特征。然后,应用特征注意力机制将注意力集中在潜在表征中的显著区域,进一步隐藏与情绪无关的属性信息。

  2. 针对更多模型更新的暴露削弱了差分隐私策略的有效性问题,本文提出一种梯度级分层差分隐私策略对抗属性推理攻击。一方面,通过雇佣归一化函数,更细粒度地区分梯度重要性,近而裁剪重要梯度,过滤掉可能带来隐私泄漏的敏感信息。另一方面,提出了分层梯度扰动机制,通过在反向传播过程中对早期网络层施加差异化随机噪声,实现了精准的隐私保护定位。

  3. 针对预训练语音模型实施部署受限问题,本文提出云--端协同的联邦参数高效微调可行性范式,支持在预训练语音模型的 feed-forward 层嵌入可训练层,通过冻结骨干模型参数,只允许少量可训练参数参与共享,实现轻量化交互,降低通信开销。

  4. 针对潜在的多重攻击与灾难性遗忘问题,本文提出一种基于联邦蒸馏的多重防御方法首先,使用服务器端轻量化生成器来学习全局视图知识,并通过蒸馏指导客户端更新,以减轻灾难性遗忘并提高系统性能。其次,设计一个多路径集成的防御范式对抗潜在的系统攻击,包括基于梯度修改的数据扰动技术、动态加权选择方法和通过捕获判别特征的隐私增强策略。为了最大限度地减少参数泄漏,采用了参数解耦的分层共享机制,大大降低了通信开销。

主要学术成果

  1. Haijiao Chen, Huan Zhao*, Zixing Zhang*, and Keqin Li, Discriminative feature learning-based federated lightweight distillation against multiple attacks,IEEE Internet of Things Journal, pp. 17663-17677, 2024. (中科院SCI一区第一作者)

  2. Haijiao Chen, Huan Zhao*, Zixing Zhang*, and Keqin Li, Federal Parameter-Efficient Fine-Tuning for Speech Emotion Recognition,Expert Systems With Applications, 2025. (中科院SCI一区第一作者,大修修回)

  3. Haijiao Chen, Huan Zhao*, Zixing Zhang*, Gradient-Level Differential Privacy Against Attribute Inference Attack for Speech Emotion Recognition,IEEE Signal Processing Letters, pp. 3124-3128, 2024. (中科院SCI二区,第一作者)

  4. Huan Zhao, Haijiao Chen*, Yufeng Xiao, and Zixing Zhang, Privacy-enhanced federated learning against attribute inference attack for speech emotion recognition,in Proc. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2023, pp. 1-5. (EICCF-B类,导师一作)

  5. Haijiao Chen, Huan Zhao*, Yingxue Gao, Yiming Liu, Zixing Zhang*, Parameter-efficient federal-tuning enhances privacy preserving for speech emotion recognition,in Proc. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2025: 1-5. (EICCF-B类,第一作者)

  6. Huan Zhao, Nianxin Huang, Haijiao Chen*, Knowledge enhancement for speech emotion recognition via multi-level acoustic feature,Connection Science, 2024, 36(1): 2312103. (中科院SCI四区唯一通讯作者)

  7. Huan Zhao, Yingxue Gao*, Haijiao Chen, Bo Li, Guanghui Ye, and Zixing Zhang, Enhanced Multimodal Emotion Recognition in Conversations via Contextual Filtering and Multi-Frequency Graph Propagation,in Proc. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2025: 1-5. (EICCF-B类,第三作者)

  8. Yiming Liu, Huan Zhao*, Yaqian Liu, Haijiao Chen, Bo Li, Guanghui Ye, and Zixing Zhang, DSSM: Dual State Space Model For Human Motions Generation,in Proc. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2025: 1-5. (EICCF-B类,第四作者)

  9. 赵欢, 向小君, 陈海蛟. 基于动态窗口紧凑卷积transformer的跨语料库语音情感识别方法[P]. 湖南省: CN118522311A, 2024-08-20, 发明专利, 已实审.

  10. 赵欢, 黄念鑫, 陈海蛟. 融合多层次声学信息的语音情感识别方法、装置及存储介质[P]. 湖南省: CN116504275A, 2023-07-28, 发明专利, 已实审.