答辩公告
论文题目 |
基于机器学习的时间序列预测关键技术及其应用研究 |
答辩人 |
曾攀 |
指导教师 |
金敏 |
答辩委员会 主席 |
陈浩 |
学科专业 |
软件工程 |
学院 |
信息科学与工程学院 |
答辩地点 |
信科院5楼会议室 |
答辩时间 |
2020年11月25日 上午10:00 |
学位论文简介
时间序列数据能够客观有效的反映客观世界中不同现象和活动的变化过程,其背后蕴含了丰富的演变规律,准确的时间序列数据预测是实现优化资源配置、节能降耗、规避风险、优化决策等目标的基础。随着互联网技术的发展,时间序列数据呈现迸发式增长,提高时间序列预测的预测精度和稳定性成为了一项极具挑战性的任务,也是经济和社会发展的迫切需求。为了提高时间序列预测方法的预测性能,本文针对时间序列预测中的关键性问题进行了深入研究,主要研究内容如下:
突破传统时间序列预测方法在特征数据集构造方面的限制,从多个维度进行候选特征数据集的选取,从大量与预测目标数据具有相关性或者潜在相关性的数据中进行特征筛选,构造溯源特征数据集,旨在深入探寻导致时序数据波动变化的源头并挖掘其变化机理,从而为预测模型提供全面、立体的特征数据支撑。
针对时间序列预测方法中,水平训练数据集不能捕获数据波动跨时段的变化趋势以及垂直训练数据集不能反应时序数据在短期内的波动模式,结合水平数据构造法和垂直数据构造法,提出构建交叉训练集,从水平和垂直两个方向进行训练集的构建,综合反映不同方向的数据波动规律。基于交叉训练集构造交叉多模型,在二次学习的基础上提出二次决策机制,利用决策多模型对预测多模型进行一次决策集成后,对决策多模型的多个输出值进行二次决策集成,有效的提高了预测性能,解决了单决策模型应用范围不广、泛化能力不强的问题。
为了提高时间序列预测方法中多模型预测结果的集成精度,提出自适应权重分配策略对多模型的预测结果进行集成。该方法在去除预测值的几个最值后,利用独立验证集对多模型中的独立模型进行性能测试,据此对它们进行权重自适应分配,以各模型预测结果的加权和作为最终的集成结果。该方法具有对异常值和验证集长度不敏感、预测精度高、稳定性强的优点。
提出基于溯源数据和交叉多模型的时间序列预测方法,特征数据集构造、训练集选取、模型的构建和多模型结果集成四个方面的创新工作构成了该方法的主体框架,基于真实数据集的案例分析显示所提出的方法相对其他先进方法具有更高的预测性能。
主要学术成果
Pan Zeng, Chang Sheng, Min Jin. A learning framework based on weighted knowledge transfer for holiday load forecasting. Journal of Modern Power Systems and Clean Energy, 2019, 7(2):329-339(SCI-2区,第一作者)
Pan Zeng, Min Jin, Md Fazla Elahe. Short-term Power Load Forecasting Based on Cross Multi-model and Second Decision Mechanism. IEEE Access,2020, 8:184061-184072(SCI-2区,第一作者)
Pan Zeng, Min Jin. Peak load forecasting based on multi-source data and day-to-day topological network. IET Generation, Transmission & Distribution, 2018, 12(6):1374-1381(SCI-3区,第一作者)
Pan Zeng, Di Wu, Min Jin. Compress-filtering and transfer-expanding of data set for short-term load forecasting[C]// International Joint Conference on Neural Networks. IEEE, 2017, 1095-1101(CCF-C类会议,第一作者)
Md Fazla Elahe, Min Jin, Pan Zeng. An Adaptive and Parallel Forecasting Strategy for Short-Term Power Load Based on Second Learning of Error Trend. IEEE Access,2020, 8: 201889-201899(SCI-2区,第三作者)
Bin Liu, Min Jin, Pan Zeng. Prioritization of candidate disease genes by combining topological similarity and semantic similarity. Journal of Biomedical Informatics, 2015, 57(C):1-5(SCI-3区,第三作者)