【主 题】 Distributed Sufficient Dimension Reduction For Heterogeneous Massive Data
【报告人】 朱利平, 教授
中国人民大学
【时 间】 2019年11月25日 14:00-15:00
【地 点】 上海财经大学统计与管理学院大楼1312会议室
【摘 要】We suggest distributed sufficient dimension reduction to process massive data characterized by high dimensionality, heterogeneity and huge sample size. By dimension reduction, high dimensional explanatory variables are replaced with a small number of linear combinations related to the response variable. By sufficient dimension reduction, we allow for different dependence structures for massive data scattered at different places. This addresses the heterogeneity issue. By distributed algorithm, we are allowed to process massive data of huge sample size. We propose to perform sufficient dimension reduction on each local compute node, and summarize the results on the central node to yield a final reduction. Sliced inverse regression and cumulative slicing estimation are explicitly discussed. We investigate thoroughly the nonasymptotic error bounds of the resultant reduction. These theoretical results are manifested through simulations and an application to metagenome data in American Gut Project.
【嘉宾简介】朱利平,2006年于华东师范大学取得博士学位。入选教育部新世纪优秀人才计划,并获得国家自然科学基金委“优秀青年基金”等资助。 朱利平博士一直从事复杂数据分析的统计理论、方法及应用研究工作。研究兴趣主要涉及复杂“高维”数据分析以及复杂“非线性相依”数据分析。在复杂“高维”数据分析领域,与合作者提出了一系列不依赖光滑参数的充分降维方法,解决了充分降维领域的一个“公开问题”,与合作者提出了一系列不依赖分布假设的充分降维方法,解决了充分降维领域一个“长期存在的问题”;在复杂“非线性相依”数据分析领域,与合作者提出了一系列非线性相依的度量准则,并将这些度量准则应用于高维数据分析,提出了一系列不依赖模型形式的变量筛选方法。 朱利平博士曾是《The Annals of Statistics》,《Statistica Sinica》等国际重要学术期刊的Associate Editor。目前是《Journal of Multivariate Analysis》, 《Statistics and Its Interface》, 《Statistical Analysis and Data Mining》和 《Journal of Systems Science and Complexity》等SCI期刊的Associate Editor, 《Statistics, Optimization and Computer Science》期刊统计领域Field Chief Editor,以及《系统科学与数学》和《应用概率统计》期刊编委。
【主持人】冯兴东


