学生培养
我的研究方向是语音情感识别、自然语音处理、多模态数据融合与生成与人工智能。我的研究团队持续追踪本研究领域国内国际学术研究以及创新应用前沿,针对涉及到的基础科学问题和主流关键技术,探索计算机视觉与自然语言处理等学科的深度交叉融合,并在此过程中结合学生个人目标,进行针对性指导与学术能力开发,培养出能独立从事科学研究且具备国际化前沿视野、满足一线互联网企业、高等院校任职的人工智能人才。
A. 本科招生要求
1. 对人工智能领域充满热情,对科学研究感兴趣;
2. 欢迎本科生提前进入课题组参与例会学习与交流。
B. 硕士招生要求
1. 人工智能、计算机科学与技术、软件工程等专业背景;
2. 良好英语写作和数学基础,或较强的软件工程能力;
3. 具备一定的自我约束力、研究兴趣、独立思考能力;
4. 欢迎保研生、统考生提前电话或邮件联系沟通。
C. 博士招生要求
1. 人工智能、语音情感识别、自然语言处理、多模态信息处理等方向;
2. 优秀的英语写作、数学基础、语言组织与表达能力;
3. 强烈的科学研究兴趣和自我驱动力、较强的创新思考力;
4. 掌握或具备独立从事科学研究的能力;
5. 欢迎直博生提前电话或邮件联系沟通。
D. 博后招生要求
1. 语音情感识别、多模态信息处理、自然语言处理、人工智能等方向;
2. 拥有专业的英语写作与数学基础能力、优秀的语言表达能力;
3. 具备优秀的独立从事科学研究能力;
4. 发表过多篇国际高水平论文;
5. 待遇详情请提前电话或邮件沟通。
研究领域
1. 语音信息处理:多模态语音文本图像数据融合,构建深度学习语音识别与联邦学习安全隐私保护框架。
2. 自然语言处理:多模态对话生成学习算法设计,人工评估模型构建。
3. 图像处理:大规模跨模态异构数据信息算法设计。
4. 情感计算:多模态语音情感识别模型,深度大模型语音情感计算框架。
5. 人工智能:结合计算机视觉与自然语言处理构建通用人工智能算法与系统。
主讲课程
研究生课程:数字语音信号处理、计算机系统设计、Computer Architecture & Organization(留学生)
本科生课程:计算机组成与结构(院核心)、计算机系统(院核心)、计算机科学概论(校通识平台)、ARM体系结构与编
程(选修)、计算机系统设计(选修)
科研项目
[1] 面向情感计算的智能语音对话系统响应生成. 国家自然科学基金, 主持. 2021-2024
[2] 新能源汽车制造产业集聚区域网络协同制造集成技术研究与应用示范. 国家重点研发计划, 任务(课题)负责人. 2021-2023
[3] 多源涉诉信访智能处置技术研究. 国家重点研发计划, 课题骨干. 2018-2021
[4] 面向语音环境基于情感计算的动态推荐系统模型研究. 国家自然科学基金, 主持. 2018-2021
[5] 新一代汽车中智能语言处理若干关键技术研究. 国家自然科学基金, 主持. 2012-2015
[6] 互联网中图文与版式文件的涉密信息检测系统研制,长沙市科技计划重点项目,主持,2014-2015
[7] 基于嵌入式平台的自动语音识别系统前端处理关键技术研究. 湖南省自然科学基金重点项目, 主持. 2010-2012
[8] 嵌入式异构多核体系任务调度机制的研究与实现. 湖南省科技计划, 主持. 2009-2010
[9] 基于数据挖掘技术的语音合成方法研究. 湖南省自然科学基金, 主持. 2004-2005
[10] 工业试验台智能测控系统. 湖南省科技计划, 主持. 2003-2005
[11] 语音合成在嵌入式系统中的应用研究. 湖南省科技计划, 主持. 2005-2007
[12] 嵌入式语音处理算法研究及嵌入式语音系统设计. 湖南省财政厅资助项目, 主持. 2006-2008
[13] 基于无线网络的视音频动态迁移系统开发. 湖南省科技计划重点项目, 参与. 2010-2012
[14] 中国网上教育平台试点工程高教子系统开发. 国家发改委重大项目, 参与. 2004-2005
[15] 湖南麓山云数据科技服务有限公司-湖南大学产学研合作项目. 技术服务, 300万元, 负责人. 2017-2019
[16] 计算机系统组成与体系结构. 国家级精品资源共享课程, 负责人. 2013
[17] 计算机系统组成与体系结构. 国家级精品课程, 负责人. 2009
科技成果奖励
[1] 物联网若干关键技术及其行业应用. 湖南省技术发明二等奖, 第四. 2019
[2] 新型嵌入式计算机系统结构及其应用. 湖南省科技进步二等奖, 第五. 2006
[3] WYBT-998无线遥控变频调速控制系统. 湖南省科技厅科技进步二等奖, 第十. 2000
[4] CB-928长沙北站装卸微机综合管理系统. 湖南省科技进步四等奖, 第四. 1994
近年代表性论文
(一) 近期主要期刊论文
[1] Song Wang, Huan Zhao*, Zixing Zhang, Keqin Li. Individual Mapping and Asymmetric Dual Supervision for Discrete Cross-Modal Hashing. Expert Systems With Applications. 2024, 247:123333, JCR Q1,中科院 1 区 TOP.
[2] Haijiao Chen, HuanZhao, Zixing Zhang, Keqin Li. Discriminative Feature Learning-Based FederatedLightweight Distillation Against Multiple Attacks. IEEE Internet of ThingsJournal. 2024, 11(10):17663-17677, JCR Q1,中科院 1 区 TOP.
[3] Song Wang, Huan Zhao*, Keqin Li. Discrete Joint Semantic Alignment Hashing for Cross-Modal Image-Text Search. IEEE Transactions on Circuits and Systems for Video Technology. 2022, 32(11): 8022-8036. JCR Q1,中科院 1 区 TOP.
[4] Song Wang, Huan Zhao*, Yunbo Wang, Jing Huang, Keqin Li. Cross-Modal Image-Text Search via Efficient Discrete Class Alignment Hashing. Information Processing & Management. 2022, 59(3):102886. JCR Q1,中科院 1 区 TOP, 社科类 A1 期刊,SSCI 1 区.
[5] Tingting Li, Huan Zhao, Jing Huang,Keqin Li. Cross-domain image translation with a novel style-guided diversity loss design. Knowledge-Based Systems, 2022, 255:109731, JCR Q1,中科院 1 区 TOP.
[6] Song Wang, Huan Zhao*, Ke Nai. Learning a Maximized Shared Latent Factor for Cross-Modal Hashing. Knowledge-based Systems. 2021, 228:107252. JCR Q1,中科院 1 区 TOP.
[7] Yufeng xiao, Huan zhao, Tingting Li. Learning Class-aligned and Generalized Domain-invariant Representations for Speech Emotion Recognition. IEEE Transactions on Emerging Topics in Computational Intelligence, 2020, 4(4): 480-489, JCR Q2, 中科院 3 区.
[8] Shaofang He, Huan Zhao. Automatic Syllable Segmentation Algorithm of Chinese Speech based on MF-DFA. Speech Communication, 2017,92(9): 42-51, JCR Q2, 中科院 3 区.
[9] Aboubakar Nasser Samatin Njikam, Huan Zhao. A novel activation function for multilayer feed-forward neural networks. Applied Intelligence, 2016, 45(1): 75–82, JCR Q2, 中科院 3 区.
(二) 近期主要会议论文
[1] Huan Zhao, Xupeng Zha, Zixing Zhang. EmoTransKG: An Innovative Emotion Knowledge Graph to Reveal Emotion Transformation, The 62nd Annual Meeting of the Association for Computational Linguistics,2024. (CCF-A类会议,ACL Findings, Accepted)
[2] Yingxue Gao, Huan Zhao*, Zixing Zhang*. Adaptive Speech Emotion Representation Learning Based On Dynamic Graph. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Seoul, Korea, Republic of, 2024, 1116-11120. (CCF-B类会议,语音信号处理顶会)
[3] Xupeng Zha, Huan Zhao*, Zixing Zhang*. Esihgnn: Event-State Interactions Infused Heterogeneous Graph Neural Network for Conversational Emotion Recognition. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Seoul, Korea, Republic of, 2024, 11136-11140. (CCF-B类会议,语音信号处理顶会)
[4] Huan Zhao, Yi Ju, and Yingxue Gao. Bilevel Relational Graph Representation Learning-based Multimodal Emotion Recognition in Conversation. IEEE International Conference on Multimedia and Expo (ICME). (CCF-B类会议, Accepted)
[5] Huan Zhao, Haijiao Chen*, Yufeng Xiao, Zixing Zhang. Privacy-enhanced Federated Learning Against Attribute Inference Attack for Speech Emotion Recognition. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Rhodes Island, Greece, 2023, 1-5. (CCF-B类会议,语音信号处理顶会)
[6] Tingting Li, Huan Zhao, Song Wang, and Jing Huang. Style-Guided Image-to-Image Translation for Multiple Domains. In Proceedings of the 2021 ICMR Workshop on Multi-Modal Pre-Training for Multimedia Understanding (MMPT '21). Association for Computing Machinery, New York, NY, USA, 28–36. CCF B类会议(ICMR)(CCF-B类会议)
[7] Huan Zhao*, Yufeng xiao, Jing Han, Zixing Zhang. Compact Convolutional Recurrent Neural Networks Via Binarization for Speech Emotion Recognition. ICASSP 2019(2019 IEEE International Conference on Acoustics, Speech and Signal Processing), 12-17 May, 2019. Brighton, UK. ICASSP: 6690-6694. (CCF B类会议, 语音信号处理顶会)
发表学术论文完整列表详见主页:
https://www.researchgate.net/profile/Huan-Zhao-42
https://orcid.org/my-orcid?orcid=0000-0001-6286-5868
专利及软件著作权
(一) 发明专利
[1] 赵欢, 王松, 陈佐, 谭彪. 一种融合特征评估和多层感知器的语音情感识别方法, 2017年. 发明专利, 授权, 专利号:201710607479.9.
[2] 赵欢, 李婷婷, 李祎颖. 一种基于主体增强的文本摘要生成方法, 2020年. 发明专利, 实审中.
[3] 赵欢, 李博, 李祎颖. 基于复制机制和变分神经推理的增强性文本摘要生成方法, 2020年. 发明专利, 实审中.
[4] 赵欢, 周晓晓, 肖宇锋, 陈佐. 基于DIS-NV特征的语音情感识别方法, 2017年. 发明专利,实审中.
[5] 赵欢, 张希翔, 谭彪. 基于即时语音内容检测的推荐方法及系统, 2015年. 发明专利, 授权, 专利号ZL 2015 1 0662383.3.
[6] 赵欢, 郑睿, 陈佐, 杨泽英, 张谦. 一种用于移动平台的无线语音控制方法及系统, 2014年. 发明专利, 授权, 专利号ZL 2014 1 0285216.7.
[7] 赵欢, 郑睿, 陈佐, 张希翔, 杨泽英. 一种声音模仿方法及装置, 2013年. 发明专利, 授权, 专利号ZL 2013 1 0423715.3.
[8] 赵欢, 王飞, 陈佐, 干文洁. 具有语音控制和哼唱检索功能的多媒体播放方法及装置, 2013年. 发明专利, 授权, 专利号ZL 2013 1 0298771.9.
(二) 实用新型专利
[1] 赵欢, 王飞, 陈佐, 干文洁. 具有语音控制和哼唱检索功能的多媒体播放装置, 实用新型专利, 授权, 专利号: ZL 2013 2 0422658.2.
[2] 赵欢, 冯璐, 陈佐, 王飞. 具有语音及文本输出选择功能的移动通信装置, 实用新型专利, 授权, 专利号ZL 2013 2 0461679.5.
[3] 赵欢, 陈佐. 面向实时音视频流的字幕叠加系统. 实用新型专利, 授权, 专利号: ZL 2011 2 0558388.9.
[4] 徐成, 李仁发, 刘彦, 秦云川, 罗正钦, 黄春毅, 彭蔓蔓, 吴蓉晖, 赵欢. 无线多媒体实时学习系统与方法, 实用新型专利, 授权(受理号200610032349.9, 公开号CN101155089).
(三) 软件著作权
[1] 赵欢(湖南大学).文本摘要自动生成软件. 计算机软件著作权, 登记号:2020SR0391470.
[2] 赵欢(湖南大学). 基于Seq2Seq 框架的闲聊对话系统,V1.0,2019.12. 计算机软件著作权, 登记号:2019R11L1950501.
[3] 赵欢(湖南大学). 基于微博话题的情感多分类系统V1.0, 2018.11. 计算机软件著作权, 登记号:2019SR0216837.
[4] 赵欢(湖南大学). 基于信任关系的协同过滤推荐系统V1.0, 2018.1. 计算机软件著作权, 登记号:2018SR329655.
[5] 赵欢(湖南大学). 基于语音的人格特征评估系统, 2016.3. 计算机软件著作权, 登记号:2016SR108509.
[6] 彭飞(湖南大学). 互联网中图文与版式文件的涉密信息检测系统,2015.12. 计算机软件著作权, 登记号:2016SR031982.
[7] 赵欢(湖南大学). 支持视音频动态迁移的媒体播放器软件. 2010.9. 计算机软件著作权, 登记号:2011SR007494.