(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111668051.8
(22)申请日 2021.12.31
(71)申请人 广东长天思 源环保科技股份有限公
司
地址 528200 广东省佛山市南海区桂城街
道深海路17号瀚天科技城A区8号楼 三
楼302单元
(72)发明人 叶效强 蒋鸿伟 谭成灶 胡晓辉
梁文智 李健森 吴君句 张广昕
骆大清
(74)专利代理 机构 佛山市禾才知识产权代理有
限公司 4 4379
代理人 刘羽波 陈嘉琦
(51)Int.Cl.
G06Q 10/04(2012.01)G06Q 10/06(2012.01)
G06Q 50/06(2012.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G01N 33/18(2006.01)
(54)发明名称
一种基于特征工程的河涌水质预测方法
(57)摘要
一种基于特征工程的河涌水质预测方法, 包
括: 步骤A: 获取影响河涌水质的监测数据; 步骤
B: 对影响河涌水质的监测数据进行预处理; 步骤
C: 构造影 响河涌水质的特征指标; 步骤D: 采用相
关系数法进行特征指标筛选, 包括通过Pearson
相关系数法进行LS TM模型的特征筛选; 步骤E: 模
型结构数据处理, 包括将筛选的特征指标, 进行
LSTM模型结构数据预处理; 步骤F: 模型训练及自
动调参, 包括对LSTM模型进行训练和自动调优
LSTM模型参数, 保存最优模型至服务器上; 步骤
G: 模型预测及结果评估, 包括基于最优模型获取
预测数据, 评估预测数据与真实数据的偏差。 本
发明结合河涌的多因素、 多条件影响因素, 实现
更准确、 更全面反映水质变化的预测情况。
权利要求书2页 说明书7页 附图4页
CN 114330904 A
2022.04.12
CN 114330904 A
1.一种基于特 征工程的河涌水质预测方法, 其特 征在于, 包括如下步骤:
步骤A: 获取影响河涌水质的监测数据;
步骤B: 对影响河涌水质的监测数据进行 预处理;
步骤C: 构造影响河涌水质的特 征指标;
步骤D: 采用相关系数法进行特征指标筛选, 包括通过Pearson相关系数法进行LSTM模
型的特征筛选;
步骤E: 模型 结构数据处 理, 包括将筛 选的特征指标, 进行LSTM模型 结构数据预处 理;
步骤F: 模型训练及自动调参, 包括对LSTM模型进行训练和自动调优LSTM模型参数, 保
存最优模型至服 务器上;
步骤G: 模型预测及结果评估, 包括基于最优模型获取预测数据, 评估预测数据与真实
数据的偏差 。
2.根据权利要求1所述 一种基于特 征工程的河涌水质预测方法, 其特 征在于:
在所述步骤A中, 获取影响河涌水质的监测数据包括获取河涌污染物监测数据、 调水记
录、 曝气设备运行记录以及气象数据。
3.根据权利要求1所述 一种基于特 征工程的河涌水质预测方法, 其特 征在于:
在所述步骤B中, 对影响河涌水质的监测数据进行 预处理包括:
步骤B1: 对监测数据的完整性进行检查, 剔除显著异常值, 包括剔除缺失值、 NULL值、 值
不变和负值;
步骤B2: 剔除监测仪器处于非正常监测时段的数据, 非正常监测时段包括故障期间、 维
修期间、 超期限未 校准时段、 失控时段、 有计划的维护保养时段和校准校验时段;
步骤B3: 基于 MAD法去除异常小和异常大的离群值。
4.根据权利要求1所述 一种基于特 征工程的河涌水质预测方法, 其特 征在于:
在所述步骤C 中, 构造影响河涌水质的特征指标包括构造昼夜变化特征指标、 季节性变
化特征指标、 影响溶解氧、 水温的特 征指标、 降雨特 征指标、 调水 特征指标和曝气特 征指标。
5.根据权利要求 4所述一种基于特 征工程的河涌水质预测方法, 其特 征在于:
构造昼夜变化特 征指标包括:
引入日周期性特征指标参与LSTM模型训练预测, 基于sin和cos将时间转换为清晰的
“一天时间 ”的周期性信号;
转换过程包括:
将监测数据时间转 化为时间戳格式, 依次按照公式一至公式三进行转换;
day=24×60×60‑‑公式一;
Daysin=sin(时间戳 ×(2 π/day) )‑‑公式二;
Daycos=cos(时间戳 ×(2 π/day) )‑‑公式三;
Daysin表示转换后的si n日周期性信号;
Daycos表示 转换后的cos日周期性信号;
构造季节性变化特 征指标包括:
通过使用si n和cos将时间转换为清晰的 “一年时间”的周期性信号;
转换过程包括:
将监测数据时间转 化为时间戳格式, 依次按照公式四至公式七进行转换;权 利 要 求 书 1/2 页
2
CN 114330904 A
2day=24×60×60‑‑公式四;
year=365.2425×day‑‑公式五;
Yearsin=sin(时间戳 ×(2 π/year) )‑‑公式六;
Yearcos=cos(时间戳 ×(2 π/year) )‑‑公式七;
Yearsin表示转换后的si n年周期性信号;
Yearcos表示 转换后的cos年周期性信号;
构造溶解氧、 水温的特征指标包括引入影响溶解氧、 水温的气象因素作为特征指标参
与LSTM模型训练;
构造降雨特征指标包括引入不同范围时间段内的降雨量数据以反映降雨对水质变化
的影响;
构造调水特征指标包括引入不同范围时间段内的调水时长以反映调水对河涌污染物
浓度变化的影响;
构造曝气特征指标包括引入不同范围时间段内的曝气时长以反映曝气对河涌污染物
浓度变化的影响。
6.根据权利要求1所述 一种基于特 征工程的河涌水质预测方法, 其特 征在于:
在步骤D中, 采用相关系数法进行 特征指标筛 选包括:
筛选中等相关性以上的特 征指标参与LSTM模型训练;
若丨P丨>0.3, 则表示特 征指标处于中等相关性以上;
其中, P表示特 征指标与待预测变量的相关系数。
7.根据权利要求1所述 一种基于特 征工程的河涌水质预测方法, 其特 征在于:
在所述步骤E中, 将筛 选的特征指标, 进行LSTM模型 结构数据预处 理包括如下步骤:
步骤E1: 采用mi n‑max对特征指标数据进行 标准化归一至[0,1];
步骤E2: 将训练集和 测试集按照3:1的比例随机拆分;
步骤E3: 将训练集和 测试集的数据转换为 LSTM模型的三维框架数据。
8.根据权利要求1所述 一种基于特 征工程的河涌水质预测方法, 其特 征在于:
在所述步骤F中, 模型训练及自动调参包括:
通过tensorflow的keras构造LSTM模型训练框架, 以特征指标作为模型输入自变量, 以
氨氮小时浓度作为输出的因变量, 参与模型训练, 并通过贝叶斯优化自动调优LSTM模型参
数, 最后保存最优 模型到服 务器上。
9.根据权利要求1所述 一种基于特 征工程的河涌水质预测方法, 其特 征在于:
在所述步骤G中, 模型 预测及结果评估 包括:
步骤G1: 获取 未来时间范围内的天气预报数据、 河涌调水计划 和曝气计划;
步骤G2: 将步骤G1中获取的数据输入最优 模型以预测未来时间范围内的氨 氮浓度;
步骤G3: 通过RMSE和MAE 评估步骤G2中的预测数据与真实数据的偏差 。权 利 要 求 书 2/2 页
3
CN 114330904 A
3
专利 一种基于特征工程的河涌水质预测方法
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 20:27:00上传分享