答辩公告
我的位置在: 首页 > 答辩公告 > 正文
李婷婷博士生预答辩公告
浏览次数:日期:2022-10-27编辑:

学位论文简介

作为计算机与现实世界沟通的重要媒介,图像数据的多样性直接影响深度学习算法的效果。本文分别对单域图像生成和跨域图像生成展开多样性增强的方法研究,其中跨域图像生成从双域图像生成、跨多域图像生成和多域图像生成域内多样性多角度展开深入研究。本文的研究工作与贡献总结如下:

  1. 针对单域图像生成任务中生成样本单一化的模式崩溃问题,提出一种编码的多机制生成对抗网络 (EMGAN) 模型。该模型通过融合 GAN VAE 模型从真实图像中提取特征分布,进而增强生成图像质量;采用多分类器监督的多机制生成器增强图像多样性,进而缓解模式崩溃问题。

  2. 针对双域图像生成任务多模态丢失问题,为跨域图像生成设计一种多样性增强损失函数。该损失函数依据模型提取的图像风格特征最大化图像距离,进而增强生成图像的多样性。

  3. 针对跨域图像生成任务跨多个图像域的局限问题提出一个风格引导的多域图像翻译模型 (SG-I2IT)该模型特征提取器和判别器采用对应多个图像域的多分支设计,实现多个图像域之间的相互转换;生成器采用多样性增强损失函数监督增强生成图像的多样性。

  4. 针对多域图像生成任务的域内多样性增强问题,提出了多模态的多域图像翻译模型 (MM-I2I)模型的风格特定多机制生成器采用多个并行的解码网络对应生成多个不同风格的图像;域特定判别器采用对应多个图像域的多分支输出设计,采用最大化信息熵惩罚间接鼓励模型生成的图像分布于多个图像域。

主要学术成果

学术论文:

  1. Tingting Li, Huan Zhao, Jing Huang, Keqin Li.  Cross-domain image translation with a novel style-guided diversity loss design [J]. Knowledge-Based Systems, 2022, 255:109731. (JCR Q1, 中科院一区 TopIF = 8.139,第一作者,已发表)

  2. Huan Zhao, Tingting Li, Yufeng Xiao, Yu Wang. Improving Multi-Agent Generative Adversarial Nets with Variational Latent Representation [J]. Entropy, 2020, 22(9):1055.  (JCR Q2, 中科院三区,IF = 2.738,第二作者,导师一作,已发表)

  3. Tingting Li, Huan Zhao, Song Wang, Jing Huang. Style-Guided Image-to-Image Translation for Multiple Domains [C]. In: Proc of the ICMR 2021 Workshop on Multi-Modal Pre-Training for Multi-media Understanding. Taipei, Taiwan, 2021, 28–36. (EI 收录,第一作者,已发表)

  4. Yufeng Xiao, Huan Zhao, Tingting Li. Learning Class-Aligned and Generalized Domain-Invariant Rep- resentations for Speech Emotion Recognition [J]. IEEE Trans. Emerg. Top. Comput. Intell., 2020, 4(4):480–489  (JCR Q2,第三作者,已发表)

  5. Huan Zhao, Yu Wang., Tingting Li, Yuqing Zhao. An Asymmetric Two-Sided Penalty Term for CT-GAN [C]. The 27th International Conference of MultiMedia Modeling. 2021. (EI 收录,第三作者,已发表)

     

    发明专利:

    赵欢, 李婷婷, 李祎颖. 一种基于主题增强的文本摘要生成方法:中国,202010611844.5. 2020-04-24. 排名第二(导师排名第一)

    赵欢,赵玉青,李婷婷,陈恩思,李博. 一种感知联合空间注意力文本生成图像方法: 中国,申请号或专利号 202210043174.0.  2022-01-04. 排名第三