报告人:张静怡博士,清华大学统计学研究中心
报告时间:2021年7月14日 下午3:00
报告地点:信息科学与工程学院 624
报告摘要:近年来,随着网络和数据收集技术的发展,越来越大量的数据可被观测并用于各种研究领域。急速增长的数据量对数据科学家提出了新的挑战。在考虑大样本数据分析的问题时,我们不仅需要追求最终分析结果的准确性,同时还需要引入更加快速的算法来降低计算成本。为了减轻计算负担,一个普遍的做法是利用分治法。我们将介绍分治法在大样本数据分析中的应用,并对传统分治法进行推广。我们结合分治法与非参数统计模型,从理论层面解释了该方法的高效性。
With the rapid development of data collection techniques, the growing data volume brings big challenges to data scientists. In large-scale data analysis, we need to consider not only the accuracy, but also the computational cost. The divide-and-conquer approach has been implemented pervasively to alleviate such computational burden. In this talk, we will introduce the application of divide-and-conquer in large-scale data analysis, and extend the classical divide-and-conquer approach to more general cases. We apply the proposed method to statistical non-parametric models, and show the theoretical results.
报告人简介:2011年毕业于武汉大学;2013年于武汉大学获得统计学硕士学位;2020年于美国佐治亚大学获得统计学博士学位,师从钟文瑄教授与马平教授。2020年开始在清华大学统计学研究中心担任助理教授。主要研究方向为大数据分析方法和应用,数据融合,去中心化计算和最优传输理论。
邀请人:陈果
联系人:尹希金