
学位论文简介
近年来,人工智能技术在司法领域的应用日益广泛,其在提升司法效率与质量方面的潜力备受关注。在政策引导与技术支持的双重驱动下,北京、上海等地法院陆续推出了一系列司法智能辅助系统,旨在提高司法参与者的工作效率与决策质量。其中,案件分类作为司法智能辅助系统的核心任务之一,对于类案检索、法律问答、法律摘要等下游任务具有重要支撑作用。本文针对案件类别长尾分布、不同子任务之间关系建模及案件类别易混淆挑战,系统地开展了面向准确性与可解释性的案件分类方法研究。主要研究内容与贡献如下:
针对现有案件分类模型在长尾类别上的表现不佳问题,本文提出了一种基于双线性注意力网络的案件分类方法。该方法引入了双线性注意力融合模块,有效建模标签特征和案件特征的语义交互,从而在整体准确性和长尾类别准确性上均展现出显著的优势。
针对建模子任务间关系时标签描述信息利用不充分的问题,本文提出了基于任务拓扑增强的多任务案件分类方法,通过设计检索器来建立不同子任务间的拓扑关系,并利用自注意力机制有效捕捉案件文本与前置子任务候选标签描述之间的细粒度语义关系,进而提升后置子任务的预测准确性
针对建模子任务间关系时的错误累积问题以及易混淆案件类别识别的挑战,本文提出了基于标签组合增强的多任务案件分类方法,通过召回阶段引入关于标签组合合理性的细粒度标签,并设计排序阶段提升模型对混淆标签组合的感知能力以及缓解错误累积问题。
针对传统文本生成评价指标在长尾案件类别情况下度量裁判理由生成质量的局限性,本文提出了面向案件类别的文本生成和面向案件类别的性能不均衡程度两类新的评价指标。此外,针对现有裁判理由生成模型在长尾类别的案件表现不佳的问题,本文提出了一种基于标签引导的裁判理由生成框架,有效提升裁判理由生成的类别级平均性能。
主要学术成果
Yuquan Le, Yuming Zhao, Meng Chen, Zhe Quan, Xiaodong He, Kenli Li. Legal Charge Prediction via Bilinear Attention Network. In Proceedings of the 31st ACM International Conference on Information & Knowledge Management, pp. 1024-1033. 2022. (CCF B类, 第一作者)
Yuquan Le, Sheng Xiao, Zheng Xiao, Kenli Li. Topology-aware Multi-task Learning Framework for Civil Case Judgment Prediction [J]. Expert Systems with Applications, vol. 238, pp. 122103, March 2024. (SCI 1区, 第一作者)
Yuquan Le, Zhe Quan, Jiawei Wang, Da Cao, Kenli Li. R^2: A Novel Recall & Ranking Framework for Legal Judgment Prediction [J]. IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol. 32, pp. 1609-1622, February 2024. (SCI 2区, 第一作者)