学术报告
我的位置在: 首页 > 学术报告 > 正文
面向云上AI模型高效训练推理的弹性数据缓存系统
浏览次数:日期:2024-07-05编辑:信科院 科研办

  报告人:顾荣,南京大学计算机系特聘研究员/博导

  报告时间:2024年7月8 上午10:00

  报告地点:超算中心1号楼304会议室


  报告摘要:随着大模型技术的兴起,云上AI模型训练推理应用服务需求日益剧增。以Serverless计算、容器及其编排技术为核心的云原生技术已成为云计算主流发展方向,吸引越来越多AI作业和服务运行其上。然而,AI模型训练和推理服务在云原生存算分离架构下面临数据访问低效、模型加载耗时等系列瓶颈问题。本报告将介绍一套面向云上AI模型训练和推理的智能弹性缓存框架,包括缓存空间精准调整,存算资源协同调度,以及模型高效加载分发等核心方法。进一步,将介绍基于上述核心思路研制的Fluid开源项目及其社区发展。Fluid已入选国际云原生计算基金会(CNCF),开源社区用户包括阿里云、腾讯云、百度云、微博、哔哩哔哩、中兴、中国电信、OPPO10多个行业领军型企业,被评为中国信通院OSCAR尖峰开源项目,获中国开源大赛一等奖。


  报告人简介:顾荣,南京大学计算机系特聘研究员/博导,达摩院青橙奖获奖者(2023),主要研究方向为云计算与大数据系统,发表领域研究论文60余篇,包括USENIX ATC, EuroSys, VLDB, KDD, ICDE, WWW, VLDBJ, IEEE TPDS, TKDE, TON等。主持国家自然科学基金面上/青年项目、国家重点研发计划子课题、中国博士后科学基金特别资助项目,以及中国石化、中国中车、中国移动、华为、阿里、腾讯、中兴等企业创新基金项目等10余项,获江苏省科学技术一等奖、IEEE TCSC Early Career Excellence Award、IEEE HPCC会议最佳论文奖、CCF分布式计算与系统专委会青年创新先锋、阿里优秀学术合作项目奖、华为火花奖、腾讯云最具价值专家奖、中兴产学研优秀合作项目奖、“互联网+”大赛全国金奖/银奖、中国信通院尖峰开源人物、南京大学青年五四奖章,并担任云原生计算基金会Fluid开源社区主席。


  邀请人:刘楚波


  联系人:潘锐