学术报告
我的位置在: 首页 > 学术报告 > 正文
Efficiently Running AI Workloads Using Long SIMD Instructions
浏览次数:日期:2024-10-08编辑:科研办

报 告 人:Marc Casas西班牙巴塞罗那超级计算中心 (Barcelona Supercomputing center)首席研究员 (Leading Researcher)

报告时间:20241016 上午10:00-11:00

报告地点:超算中心0号楼202会议室


报告摘要:本报告将探讨在支持SIMD指令的架构上,现有最先进的卷积计算方法在处理长SIMD长度时由于频繁的缓存冲突而导致性能下降的问题。我们将演示这些方法固有的内存访问模式如何导致缓存冲突。为了解决这个问题,我们提出了新的算法技术,以适应微架构所需的计算量,从而减少缓存冲突。此外,我们还重新定义了激活内存布局,以优化内存访问模式。 这些算法创新为矩阵块扩展(MTE)奠定了基础,MTE是一种全新的ISA,它完全解耦了指令集架构与微架构,并与现有的向量ISA无缝交互。MTE的实现开销极小,因为它只需要几个额外的指令和一个64位的控制状态寄存器(CSR)来维护其状态。


报告人简介 Marc Casas是西班牙巴塞罗那超级计算中心(BSC)的首席研究员,同时在加泰罗尼亚理工大学(UPC)的担任教职。他的研究领域涉及计算机体系结构(如内存地址转换、向量架构)和高性能计算(如稀疏线性代数、并行深度学习)。Marc是SONAR(新架构软件研究载体)研究小组的技术负责人,该小组由博士生、工程师和博士后组成。他领导了BSC在多个欧洲项目(Mont-Blanc2020、欧洲处理器计划等)中的研究工作,并与英特尔和IBM等公司进行了研究合作。

Marc自2013年起在BSC任职。他曾在2010年至2013年间担任劳伦斯利弗莫尔国家实验室(LLNL)的博士后研究学者。Marc于2004年获得五年制数学学位,并于2010年从加泰罗尼亚理工大学(UPC)获得计算机科学博士学位。 他分别于2014年和2018年获得玛丽·居里与拉蒙·卡哈尔学者基金

Marc 的研究成果广泛地发表于高性能计算与计算机体系结构领域的重要国际会议与期刊,包括SC、PPoPP、HPCA、MICRO、ISCA、IPDPS、HPDC、ICS、ISC、PACT、TPDS、TC、TACO等,并曾获得SC最佳论文奖提名。他曾担任SC、PPoPP、IPDPS、ICS、ICPP等国际会议的程序委员会成员,以及TACO、TPDS、JPDC等期刊的审稿人。





邀请人:阳王东教授


联系人:熊汉韬 18374814694