个人简介
个人简介
女,副教授,硕士生导师。研究领域涉及计算机视觉、人工智能、深度学习等。目前在研项目包括场景文字识别(零售小票识别、面向金融领域的票证识别、古文识别);面向投行的企业财务数据识别和分析;智慧工地智能算法开发和部署;生物特征识别算法(人脸识别、行人重识别)研究等。
联系方式:
Email:hllin@hnu.edu.cn,342897043@qq.com
电话:18692263239
qq:342897043
欢迎电子信息大类、计算机科学、等专业的学生免试推荐或报考。
目前和企业建有联合研究中心,从事计算机视觉、大数据等方面的项目和关键技术研究。
研究方向:
1、基于深度学习的目标识别方法研究;
2、监控场景下的行人重识别方法研究;
3、文字识别方法研究;
4、肺部CT图像中的肺部病变识别方法研究。
5、细粒度图像视觉分析
科研状况
最近五年主持和参与的科研项目
一、横向项目
1、基于深度学习的客流监控关键技术研究一期项目,完成
2、基于鱼眼图像的目标识别项目,在研
3、行人重识别关键技术研究,在研
4、基于深度学习的图像识别关键技术研究,在研
5、文字识别,在研
二、纵向项目
1、国家自然科学基金项目 “基于深度学习的产品创新设计关键技术研究”,在研
2、科技部重大专项“基于医学影像的智能诊断标准及技术研究”,在研
3、国家自然科学基金项目 “基于CT影像的肺结节计算机辅助诊断方法及关键技术研究”(81201151)主持
4、湖南省自然科学基金“高维特征选择算法及其在肺癌计算机辅助诊断中的应用研究”(14JJ3050)主持
5、央高校科研创新扶持基金项目“肺结节医学征象量化方法研究” 主持
6、湖南省自然科学基金项目“基于计算机视觉和高层语义信息的肺癌CAD方法研究”(12JJ6061)
7、湖南省科技计划项目 “肺癌计算机辅助诊断系统研究”(2012SK3185)
三、产学研
和广东电声市场营销股份有限公司,广州量视信息技术公司,广州贝叶斯信息技术公司建立了长期稳定的合作关系。成立了电声湖南大学智能营销研究中心,任中心主任。
学术论文
[1] A Content-Boosted Collaborative
Filtering Algorithm for Personalized Training in the Interpretation of Radiological
Imaging, Journal of Digital Imaging, 2014( SCI 源刊).
[2] A Performance Weighted
Collaborative Filtering Algorithm for Personalized Radiology Education, Journal of Biomedical Informatics,2014 (SCI源刊).
[3] A Pulmonary Nodule View System for the Lung Image Database Consortium (LIDC), Academic radiology,2011(SCI源刊).
[4] 医学图像计算机辅助诊断数据平台研究,中国生物医学工程学学报,2013(校定权威).
[5 ] An Approach to 3D Medical Registration Using Group Search Optimizer, Journal of Convrgence Information Technology, 2013.
[6] Development of a Data Integration and Visualization Software for LIDC, Journal of Software,2013.
[7] QRS Complex Detection Using Combination of Mexican-hat Wavelet and Complex Morlet Wavelet[J]. Journal of Computers, 2013.
[8] 肺癌图像数据库及可视化工具的建立. 生物医学工程学杂志, 2012.
[9] 肺癌数据库的改进及其集成工具的设计实现. 计算机工程, 2011.
[10] DICOM 医学图像显示算法改进与实现, 计算机系统应用,2010.
实验室产品
实验室长期从事计算机视觉和机器学习的前沿基础理论和工程应用的开发,专注于人工智能、计算机视觉算法创新与应用。 实验室以视频分析、智能文档分析基础算法研发为基座,推出了包括目标检测、图像分割、动作识别、文字检测、文字识别、表格识别、信息抽取在内的各种AI算法,赋能各行各业;实验室以AI算法为基础,结合具体应用场景,开发了融合AI算法的软硬件产品,提出了多种解决方案。实验室致力为产业提供丰富的人工智能算法与基建平台,赋能百业完成智能化转型升级。
算法部分
AI视频算法库
实验室在视频图像、人工智能、边缘计算等领域深耕多年,形成了“算法+产品+应用”的核心优势,开发了多种AI算法,可为智慧工地、校园安全、工厂车间、智慧零售等多个行业赋能。所有算法均提供公有云API、私有化部署、软硬一体化部署方式。算法如下表所示。
算法 | 算法介绍 | 应用场景 | 成功案例 |
物料识别 | 识别图像中的钢筋、钢管、方木、圆木、轮扣、方钢并计数 | 应用于建筑工程、建材租赁行业的物料验收、物料判断、物料租借和归还环节 | 中建五局物料验收系统集成 |
货架商品识别 | 识别货架上的多达千种商品(SKU)的品名、货架层数、数量 | 应用于线下零售的货架陈列合规性检查、自助结算、互动营销 | 广州电声市场营销公司货架陈列合规检查、营销数据采集 |
人脸识别 | 人脸识别算法基于人工智能视觉技术,对人脸进行1:N人脸识别,与预置人脸库进行比对,识别人身份信息 | 人脸考勤、vip识别等 | 中建五局早会考勤系统 |
行人重识别 | 行人重识别算法基于人工智能视觉计数,对跨多个摄像头中出现的同一个行人进行识别、比对,识别人的身份信息 | 作为人脸识别的补充,行人重识别算法可在公共安全领域用于监控和预防犯罪;在商业领域用于人流量统计和行为分析,用于营销决策。 | 边缘计算一体机 |
行人属性识别 | 识别出行人的属性,包括年龄、性别、眼镜、帽子、上衣等 | 可应用于公共安全领域用于视频检索,在商业领域用于营销决策等。 | 广州电声市场营销数据采集系统 |
吸烟识别 | 识别视频中的人是否存在吸烟行为 | 各种场景 | 边缘计算一体机 |
打手机识别 | 识别视频中的人是否存在玩手机行为 | 各种场景 | 边缘计算一体机 |
安全帽识别 | 识别视频中的人是否佩戴安全帽 | 各种场景 | 边缘计算一体机 |
反光衣识别 | 识别视频中的人是否穿反光衣 | 各种场景 | 边缘计算一体机 |
脱岗检测识别 | 识别视频中的人是否存在脱离岗位的情况 | 各种场景 | 边缘计算一体机 |
越界识别 | 识别行人是否出现在特定的区域 | 各种场景 | 边缘计算一体机 |
火焰识别 | 识别环境中是否出现火焰 | 各种场景 | 边缘计算一体机 |
烟雾识别 | 识别环境中是否出现烟雾 | 各种场景 | 边缘计算一体机 |
智能文档分析算法库
智能文档分析基于光学字符识别(OCR)、计算机视觉(CV)、自然语言处理(NLP)、机器学习(ML)、深度学习(DL)等人工智能(AI)技术,从各种文档格式中捕获、提取和处理数据,并将其转换为结构化的可用数据,从而为以文档为中心的业务流程提供端到端的自动化。实验室专注智能文档分析技术研发,积累了丰富的算法。所有算法均支持公有云API、离线识别SDK、私有化部署、软硬一体化部署。
算法 | 算法介绍 |
通用文字识别 | 通过领先的深度学习技术,对各种表格,图片,文档、证件、面单等多种通用场景进行快速、精准的检测和识别,支持简体中文/英文/数字/手写数字/手写英文。 |
表格识别 | 支持识别图片/PDF/word格式文档中的表格内容,包括有线表格、无线表格、合并单元格表格,同时支持单张图片内的多个表格内容识别,返回各表格的表头表尾内容、单元格文字内容及其行列位置信息。 |
印章检测识别 | 支持检测并识别多行业合同文件和票据中的印章,结构化返回票据等样本上单个/多个印章上文字,支持红章/黑章,常规印章(圆章/方章等)。 |
办公文档识别 | 可对办公文档的图片版面进行分析,输出图、表、列表、文本、水印、页眉页脚、印章、公式的位置及文字,并输出分版块内容的OCR识别结果,支持手写、印刷体混排多种场景。 |
证件分类 | 支持对18种证件类型识别、分类,包括银行卡、香港身份证、身份证、社保卡、驾驶证、行驶证、户口本、护照、结婚证、离婚证、房产证、不动产证、营业执照、开户许可证、税务登记证等 |
身份证识别 | 支持对身份证正反面的全部字段进行结构化识别,包括姓名、性别、民族、出生日期、地址、身份证号、有效期限、签发机关,同时可返回头像切片位置信息,进行头像检测 |
名片识别 | 支持对各类名片上出现的文字内容识别为结构化文本 |
银行卡识别 | 支持对主流银行卡6个关键字段的高精度结构化识别,包括类型、发卡机构、发卡机构代号、有效期、卡号、持有人,同时可返回图像切边位置信息 |
行驶证识别 | 实现对机动车行驶证正副页中21个关键字段进行结构化高精准识别,包括号牌号码、车辆类型、所有人、车辆识别代码、发证日期、检验有效期等 |
驾驶证识别 | 支持对驾驶证正副页全部字段进行结构化识别,包括姓名、类型、驾驶证证号、性别、国籍、住址、出生日期、初次领证日期、准驾车型、有限期限始(至)、总计有效期限 |
社保卡识别 | 支持对全国各大省市社保卡全部字段结构化识别服务,包括姓名、社会保障号码、卡号、发卡日期、芯片下方号码 |
营业执照识别 | 可快速精准结构化识别企业营业执照(各类版式,支持新旧版本)中的注册号、公司名称、地址、主体类型、法定代表人等14个关键有效字段,同时支持单个或批量上传,可区分是否为副本 |
税务登记证识别 | 支持单个或批量化对税务登记证的全部字段进行结构化识别 |
组织机构代码证识别 | 提供迅速对组织机构代码证中所有关键字段结构化识别服务,包括代码、机构名称、机构类型、法定代表人、地址、有效期、颁发单位、登记号 |
开户许可证识别 | 支持对包括开户许可证的编号、基本存款银行、开户银行、账号、核准号、法定代表人的关键字段快速识别 |
卫生许可证识别 | 支持对卫生许可证扫描件或拍照图像的关键字段结构化识别服务,包括单位名称、法人代表/业主、地址、许可范围、食证号、有效期限 |
事业单位法人证识别 | 支持对事业单位法人证书中包括社会代码、名称、法定代表人、宗旨和业务范围、经费来源、开办资金、住所、承办单位、有效期在内的9个关键字段的识别 |
票据分类 | 支持对20+种票据进行票据类型识别,包括增值税专用发票、机动车销售统一发票、货物运输业增值税专用发票、增值税普通发票、增值税电子普通发票、增值税普通发票等 |
增值税发票识别 | 支持增值税专票、普票、电子发票的所有字段的结构化识别,包括价税合计、发票代码、发票号码、合计税额、合计金额、检验码、开票日期等,关键信息识别准确率行业靠前 |
机动车购车发票识别 | 自动识别机动车发票40个字段,快速输出结构化文本,包括类型、购货单位、厂牌型号、发票代码等 |
产品与解决方案
实验室在AI算法的基础上,形成算法+产品+应用核心优势,结合各领域的需求,形成了一系列的产品和解决方案。
端边云协同的视频智能分析平台
说明见端边云一体化平台.pdf
公文内容提取软件
公文内容提取软件采用OCR、NLP技术,自研的公文内容提取引擎,可对扫描图片、Word、PDF、OFD等格式的公文材料进行识别和元数据提取。可对公文类型进行识别,如命令、决定、公告、请示等公文类型;可自动提取公文的不同要素(元数据),如发文份号、密级和保密期限、紧急程度、发文机关标志、发文字号、签发人、标题、主送机关、正文、附件说明、发文机关署名、成文日期、印章、附注、附件、抄送机关、印发机关和印发日期、页码。
公文内容提取可用于公文归档、公文收发文表单自动回填、公文深度分析(如公文主题识别、公文内容结构化等)等应用场景。
银行流水智能核查解决方案
说明见银行流水智能核验解决方案.pptx