安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211087335.2 (22)申请日 2022.09.07 (71)申请人 国网山东省电力公司潍 坊供电公司 地址 261041 山 东省潍坊市潍城区东 风西 街425号 申请人 国家电网有限公司 (72)发明人 李丰硕 曹华明 王晓宁 孙明星  金阿龙 王磊 李英涛 龚建刚  (74)专利代理 机构 济南泉城专利商标事务所 37218 专利代理师 李桂存 (51)Int.Cl. G06F 16/2458(2019.01) G06F 16/242(2019.01) G06N 3/04(2006.01)G06N 3/08(2006.01) G06Q 50/18(2012.01) (54)发明名称 一种基于大数据人工智能的双创成果高价 值专利筛 选方法 (57)摘要 本发明提供了一种基于大数据人工智能的 双创成果高价值专利筛选方法, 包括以下步骤: 建立电网企业专利数据库, 记录入知识模型中并 存储于系统知识库; 确定开展知识产权运营的专 利价值目标, 用智慧芽数据、 国家知识产权局网 站两大数据库, 筛选高价值专利和重要发明人, 对筛选结果进行综合评估分析; 开展数据异常治 理, 进行数据清洗、 数据集成和数据变换去除不 完整、 不一致、 有异常的数据; 开展基于神经网络 的智能模型设计与训练, 对数据集进行训练在模 型训练中找到最优参数, 利用测试集进行模型的 验证。 本发明实现海量专利数据快速化、 可定制 化的专利价值筛选, 对提高科技成果转化效率、 促进专利运营 水平具有重要意 义。 权利要求书1页 说明书4页 附图2页 CN 115544112 A 2022.12.30 CN 115544112 A 1.一种基于大数据人工智能的双创成果高价值专利筛选方法, 其特征在于, 包括以下 步骤: (1) 建立电网企业专利数据库, 通过对专利数据库的数据进行挖掘并结构化处理和分 析, 记录入知识模型中并存 储于系统知识库; (2) 确定开展知识产权运营的专利价值目标, 用智慧芽数据、 国家知识产权局网站两大 数据库, 通过专利价值、 同族专利家族规模、 同族被引用 专利总数、 诉讼专利、 权利要求数 量、 重要发明团队、 高价值专利的发明人指标, 筛选高价值专利和重要发明人, 对筛选结果 进行综合评估分析; (3) 开展数据异常治理, 进行数据清洗、 数据集成和数据变换去除不完整、 不一致、 有异 常的数据; (4) 开展基于神经网络的智能模型设计与训练, 在异常数据处理基础上, 利用BP神经网 络模型的自学习和自适应能力, 对数据集进行训练在模型训练中找到最优参数, 针对筛选 出来待运营的专利库, 围绕专利文本核心特征指标, 将处理好的文本数据放入  BP 神经网 络模型中进行训练, 利用测试集进行模型的验证。 2.根据权利要求1所述的基于大数据人工智能的双创成果高价值专利筛选方法, 其特 征在于, 所述数据清洗、 数据集成和数据变换 具体过程如下: 1) 数据清洗 通过数据清洗删除原始数据集中的无关数据、 重复数据和噪声数据, 筛选掉与高价值 专利筛选主题无关的属 性数据, 采用最近临插补、 均值或众数插补的法处理专利原始数据 集中的缺失值、 异常值; 2) 数据集成 从网站上爬取的原始专利数据分布在不同的数据源中, 通过数据集成将多个数据源合 并存放在一个数据库中; 对三种类别的利进 行标引, 其中高价值专利标引为  0, 资产专利标 引为 1, 负债专利标引为  2, 将标引标签转换为独热编码, 将专利类别的离散特征取值扩展 到欧式空间;  3) 数据变换 进行数据变换的规范化处理, 消除参数之间的量纲和取值范围的影响, 先将所有专利 文本属性转换为数值, 然后对所有数据进行均值和方差的归一化处理, 消除专利参数之间 取值范围差异的影响。 3.根据权利要求1所述的基于大数据人工智能的双创成果高价值专利筛选方法, 其特 征在于, 所述BP  神经网络模型训练需要正向和反向计算误差更新权重部 分, 如果更新后的 全局计算误差小于预设值, 则模型训练完成达到效果, 如果更新后的全局计算误差不小于 预设的值, 需要继续判断是否达到了预设的训练次数, 没有达到, 则继续训练, 如果达到则 说明网络训练失败无法收敛, 经 过重复训练得 出 BP 神经网络的预测结果输出。权 利 要 求 书 1/1 页 2 CN 115544112 A 2一种基于大数据人工智能的双创成果高价值专利筛选方 法 技术领域 [0001]本发明涉及 一种基于大数据人工智能的双创成果高价值专利筛选方法, 属于大数 据技术领域。 背景技术 [0002]目前, 高价值专利的筛选和分析在专利许可转让、 质押融资、 企业重组和并购等领 域中均得到了广泛应用。 传统的专利管理系统未采用数字化管理手段, 存在效率低、 数据量 少、 数据关联性差等问题。 随着大数据、 人工智能算法的快速发展, 利用大数据挖掘智能算 法能高效快捷从多维度对专利价值进行快速量化评估, 找出产业发展中的短板和不足, 定 位产业发展的方向, 为电网企业 实施产业规划、 产业布局提供指引和决策参考。 电力科技项 目与一般工程建设项目不同, 科技项目的各种技术指标以及预期 完成后的指标都是电力企 业运行是否达到运行规 程规定的重要评价指标。 [0003]当前已有的专利价值评估研究多依赖于专利本身的指标或字段数据开展核心专 利识别, 但是与双创成果关联性小, 未充分考虑实际科技创新成果转化推广中对专利的技 术保护、 原创性、 普遍适用性 等要素影响。 发明内容 [0004]本发明目的是提供了一种基于大数据人工智能的双创成果高价值专利筛选方法, 实现海量专利数据快速化、 可定制化的专利价值筛选, 对提高科技成果转化效率、 促进专利 运营水平具有重要意 义。 [0005]本发明为实现上述目的, 通过以下技 术方案实现: 一种基于大数据人工智能的双创 成果高价值专利筛选方法, 其特征在于, 包括以 下步骤: (1) 建立电网企业专利数据库, 通过对专利数据库的数据进行挖掘并结构化处理 和分析, 记录入知识模型中并存 储于系统知识库; (2) 确定开展知识产权运营的专利价值目标, 用智慧芽数据、 国家知识产权局网站 两大数据库, 通过专利价值、 同族专利家族规模、 同族被引用专利总数、 诉讼专利、 权利要求 数量、 重要发明团队、 高价值专利的发明人指标, 筛选高价值专利和重要发明人, 对筛选结 果进行综合评估分析; (3) 开展数据异常治理, 进行数据清洗、 数据集成和数据变换去除不完整、 不一致、 有异常的数据; (4) 开展基于神经网络的智能模型设计与训练, 在异常数据处理基础上, 利用BP神 经网络模型 的自学习和自适应能力, 对数据集进行训练在模型训练中找到最优参数, 针对 筛选出来待运营的专利库, 围绕专利文本核心特征指标, 将处理好的文本数据放入  BP 神 经网络模型中进行训练, 利用测试集进行模型的验证。 [0006]优选的, 所述数据清洗、 数据集成和数据变换 具体过程如下:说 明 书 1/4 页 3 CN 115544112 A 3

PDF文档 专利 一种基于大数据人工智能的双创成果高价值专利筛选方法

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于大数据人工智能的双创成果高价值专利筛选方法 第 1 页 专利 一种基于大数据人工智能的双创成果高价值专利筛选方法 第 2 页 专利 一种基于大数据人工智能的双创成果高价值专利筛选方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:34:14上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。