安全公司报告
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111624557.9 (22)申请日 2021.12.2 9 (71)申请人 天津大学 地址 300072 天津市南 开区卫津路9 2号 (72)发明人 丁研 黄宸 李沛霖  (51)Int.Cl. G06Q 10/04(2012.01) G06Q 50/08(2012.01) (54)发明名称 一种用于建筑负荷预测的数据完备性检验 与特征学习方法 (57)摘要 本发明公开了一种用于建筑负荷预测的数 据完备性检验与特征迁移学习方法, 包括以下步 骤: 提出基于扩散核密度估计与最大相关最小冗 余的特征筛选方法, 确定不同负荷预测模型下的 最佳特征集, 通过新特征集与最佳特征集特征间 相关性和特征分布相似性的判定, 建立数据集特 征完备性检验的方法; 建立特征迁移的负荷预测 模型。 本发 明可以解决由于数据特征不完备所造 成的建筑负荷预测精度下降的问题, 在模型的输 入产生微小的变化时仍然能够保持预测结果的 稳定, 同时降低了建筑负荷预测模 型的计算复杂 度。 本发明表现出的效果为大幅提升建筑负荷预 测精度, 增强负荷预测模型的鲁棒性, 减少计算 时长。 权利要求书1页 说明书7页 附图4页 CN 114282730 A 2022.04.05 CN 114282730 A 1.一种用于建筑负荷预测的数据完备性检验与特征迁移学习方法, 其方法在于, 包括 以下步骤: 步骤1): 采用一种基于扩散核密度估计(DKDE)的计算方法, 自动生成合适的带宽, 计算 离散负荷与特征变量间的互信息熵; 引入最大相关最小冗余(mRMR)算法将多变量间互信息 的计算方法转化为最佳特征集的构建方法, 展开增量搜索, 直至新增特征只能提高特征集 的冗余度, 而 无法提供与负荷相关的新的信息, 从而获得与负荷相关性较强的特征变量, 进 而获得最佳 特征集; 步骤2): 在基于步骤1)所获得的最佳特征集的前提下, 针对新获得的数据集, 在进行数 据预处理后, 首先需要参考最佳特征集对数据集的特征完备性进行评估和判定, 来确定使 用该数据集是否能够达到相 应的预测精度。 以新数据集中的特征为基础, 将最佳特征集中 包含的特征与新数据集中的各个特征分别做相关性和分布相似性的计算, 达到阈值即表明 新数据集中包含与最佳特征集中对应的特征, 观 察最佳特征集中的各个特征是否与新数据 集中的特 征均有对应, 若均有对应, 则表明新数据集的特 征是完备的, 否则为 不完备的; 步骤3): 基于步骤2)的完备性判定, 如果判定结果为数据集完备, 则该数据集可以通过 特征工程作为模型 的输入来训练预测模型; 如果判定结果为数据集不完备, 则需要从其它 完备的数据集中进 行特征迁移, 补 全缺失的特征。 采用迁移成分分析法(TCA)为依据从构建 的源域特征集中选取需要迁移的特征, 与目标域特征共同构建出新的数据集, 随后输入到 LSTM模型的输入层训练模 型, 比较迁移后模 型在预测精度、 鲁棒性和CPU占用率上产生的效 果。 2.根据权利要求1所述的一种用于建筑负荷预测的数据完备性检验与特征学习方法, 其特征在于, 所述步骤1)中采用一种基于扩散核密度估计(DKDE)的计算方法, 自动生成合 适的带宽, 计算离散负荷变量间的互信息熵; 采用一种最大相关最小冗余(mRMR)算法将多 变量间互信息的计算方法转化为最佳特征集的构建方法, 展开增 量搜索, 从而获得与负荷 相关性较强的特 征变量, 进 而获得最佳 特征集。 3.根据权利要求1所述的一种用于建筑负荷预测的数据完备性检验与特征学习方法, 其特征在于, 所述步骤2)中, 参考步骤1)所获得的最佳特征集, 通过相关性和分布相似性的 计算, 对数据集的特 征完备性进行评估和判定 。 4.根据权利要求1所述的一种用于建筑负荷预测的数据完备性检验与特征学习方法, 其特征在于, 所述步骤3)中, 根据步骤2)的完备性判定, 若判定结果为数据集不完备, 则采 用迁移成分分析方法(TCA)进 行特征迁移, 从构建的源域特征集中选取需要迁移的特征, 与 目标域特征共同构建出新的数据集, 随后输入到LSTM模型的输入层训练模型, 从而在预测 精度、 鲁棒 性和CPU占用率上表现出 数据完备性检验与特 征迁移学习后产生的有益效果。权 利 要 求 书 1/1 页 2 CN 114282730 A 2一种用于建筑负荷预测的数据完备性检验与特征学习方 法 技术领域 [0001]本发明属于建筑负荷预测与数据挖掘的研究领域, 具体涉及一种用于建筑负荷预 测的数据完备性检验与特 征迁移学习方法。 背景技术 [0002]在公共建筑能耗中, 空调系统能耗占比大约在40%甚至更高, 建筑的空调系统具 有巨大的节能潜力。 为了提高建筑空调系统的能效, 现阶段诸如可再生能源与建筑蓄能的 协同优化、 建筑需求侧响应以及分布式能源系统优化等各种建筑节能技术和能源系统优化 方法层出不穷。 然而, 这些研究中提到的各种控制系统和优化设计的实现均是建立在准确 的负荷预测基础之上的, 因此获得高效、 准确的负荷预测结果 就显得尤为重要。 [0003]在建筑的设计和运行阶段, 均 需要对建筑的负荷进行预测。 从建筑冷负荷预测模 型的结构来看, 是构建输入特征和输出负荷之间的映射关系。 对预测精度起到决定性作用 的因素, 包括数据集本身的质量、 数据处理方法和预测算法的选取三个方面。 由于数据驱动 模型对数据的质量有一定要求, 这在一定程度上限制了该方法在实际工程中的使用。 然而, 对于一些建造完善的建筑能源系统而言, 其负荷相关的数据信息是丰富的, 但如何能将这 部分丰富的建筑能源信息数据应用到信息 匮乏的模型中去, 并结合相应的预测算法, 使这 些数据匮乏的建筑能够在小样本条件下仍然能够达到理想的预测精度, 在推进负荷预测应 用于实际工程的过程中是十分有意 义的。 发明内容 [0004]有鉴于此, 本发明提供一种用于建筑负荷预测的数据完备性检验与特征学习方 法, 在数据匮乏的条件下, 实现从其他建筑的能源信息中挖掘 到可迁移的数据信息作为补 充, 以保证对于数据信息不完备的建筑进 行负荷预测的结果依然能达到满足预测精度要求 的负荷预测结果。 [0005]为实现上述目的, 本发明提出了一种用于建筑负荷预测的数据完备性检验与特征 学习方法, 包括以下步骤: [0006]步骤1: 首先, 采用一种基于扩散核密度估计(DKDE)的计算方法, 自动生成合适 的 带宽。 进一步的, 计算离 散负荷变量间的互信息熵: [0007] [0008] [0009]式中, p(x)和p(y)分别为x和y的概率密度函数(PDF); x和y分别表示X和Y中的任意 变量; p(x, y)为变量X和Y的联合 概率分布。 [0010]通过引入最大相关最小冗余(mRMR)算法将多变量间互信息的计算方法简化为最说 明 书 1/7 页 3 CN 114282730 A 3

.PDF文档 专利 一种用于建筑负荷预测的数据完备性检验与特征学习方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种用于建筑负荷预测的数据完备性检验与特征学习方法 第 1 页 专利 一种用于建筑负荷预测的数据完备性检验与特征学习方法 第 2 页 专利 一种用于建筑负荷预测的数据完备性检验与特征学习方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 20:28:00上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。