分享到:
5月13日,suncitygroup太阳集团第253期高级经济学讲座在中心校区举行。美国明尼苏达大学德鲁斯校区数学与统计学系潘聚明博士为学院师生作题为“A bootstrap approach for high-dimensional model averaging”的学术报告。
首先,报告介绍了多维数据分析方法。近年来,许多统计用户在基因组学、金融学等许多科学学科中经常遇到高维数据集,即预测量p超过样本量n的个数。多维数据分析有许多挑战和困难需要克服。比如说:多重共线性、费用计算和过度拟合等。接着,报告介绍了高维数据分析的主要方法。其一,模型选择。从集合中找出最佳模型,然后进行推理;其二,变量筛选当变量的数目相对于观察次数多,高维变量筛选程序允许研究人员缩小变量的子集。其三,模型平均。选定一个模型进行预测,用适当的权重平均所有候选模型。然后,报告举例说明:根据每个预测器互相影响程度进行排序,将预测器划分为K组,第一个模型的值最高和最后一组值最低。方法a,每组形成一个候选模型。方法b,第一组形成第一个模型,前两组组形成第二个模型,前三个组形成第三个模型,以此类推。据此提出了一种自举模型平均高维数据分析法。该方法充分利用了模型的优点选择和模型平均,从而达到准确和稳定预测。结果显示,仿真结果与实际应用结果表明所提出的方法优于现有的方法。在未来的研究中,我们可能会将目前的工作扩展到其他领域模型设置,进一步完善权重的选择。会后,潘聚明与现场师生进行了交流。
潘聚明博士,美国明尼苏达大学德鲁斯校区数学与统计学系助理教授,美国保龄格林州立大学博士。主要研究方向为模型选择,模型平均,线性混合模型,高维数据分析等。其研究成果发表在Communications in Statistics - Theory and Methods, Journal of Statistical Computation and Simulation, Mathematics in Engineering, Science and Aerospace, Open Journal of Statistics等知名学术期刊。
文/吴奕琪 图/田刘敏