安全公司报告
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210480342.2 (22)申请日 2022.04.28 (65)同一申请的已公布的文献号 申请公布号 CN 114969249 A (43)申请公布日 2022.08.30 (73)专利权人 江苏四象软件 有限公司 地址 225000 江苏省扬州市经济技 术开发 区扬子江中路186号智谷大厦B座8层 804-806 (72)发明人 韩岭 蔡进 胥传龙 李明  (74)专利代理 机构 武汉华强专利代理事务所 (普通合伙) 42237 专利代理师 康晨 (51)Int.Cl. G06F 16/33(2019.01)G06F 16/9535(2019.01) G06F 40/30(2020.01) 审查员 刘芳 (54)发明名称 数据挖掘系统及数据 挖掘方法 (57)摘要 本发明涉及数据挖掘领域, 具体涉及数据挖 掘系统及数据挖掘方法, 通过对用户的访问行为 数据的挖掘; 确定用户的购买迟疑程度以及计算 用户对已购目标产品的倾向程度; 基于已购目标 产品的倾向程度、 购买迟疑程度以及支付时间长 度, 计算任意两两用户的行为差异性, 得到不同 类别的用户群体; 同时引入用户群体中任意两用 户的历史设定时间内对已购目标产品的查询次 数以及滑动速度构成的用户行为向量 以及对应 的评价特征码, 计算任意两两用户之间的邻域距 离, 基于各用户对应的所有邻域距离, 并计算该 用户的偏向程度, 进而获取各用户群体中偏向程 度最大与最小对应的状态向量, 确定推送的产 品。 即本发 明的方案能够为网购平台的优化提供 依据。 权利要求书2页 说明书8页 附图1页 CN 114969249 B 2022.12.20 CN 114969249 B 1.一种数据 挖掘方法, 其特 征在于, 包括以下步骤: 获取用户在已购目标产品的网购过程中的访问行为数据; 所述访问行为数据包括浏 览 记录总时间、 已购目标产品对应页面的停留时间、 已购目标产品的支 付时间长度; 将所述停 留时间与浏览记录总时间的比值作为用户的购买迟疑程度; 根据所述支付时间长度、 停留时间以及购买迟疑程度, 计算用户对已购目标产品的倾 向程度; 基于已购目标产品的倾向程度、 购买迟疑程度以及支付时间长度, 计算任意两两用户 的行为差异性, 基于各 行为差异性对所有用户进行划分, 得到不同类别的用户群 体; 获取各用户群体中的各用户在历史设定时间内对所述已购 目标产品的查询次数以及 滑动速度, 基于所述查询次数以及滑动速度, 构建用户行为向量; 对 各用户群体中的各用户 对已购目标产品的评价内容进行数据挖掘, 得到评价关键词, 对所述评价关键词进行编码 得到评价特征码; 基于各用户群体中的任意两两用户的评价特征码和用户行为向量, 计算任意两两用户 之间的邻域距离, 基于各用户对应的所有邻域距离, 并计算该用户的偏向程度; 将各用户群 体中的最大偏向程度与最小偏向程度组成状态向量; 对所有用户群体的状态向量进行跟踪, 计算设定时间段内用户群体的状态稳定性, 确 定状态稳定性差的前M个用户群体, 根据该M个用户群体的评论情况, 在平台页面 随机投放 热评指数高的已购目标产品的评论, M大于等于2; 状态稳定性 为: 其中, t为当前 时刻, N为设定时间段, 为用户群体在设定时间段N内的第i ‑1个状 态向量, 为用户群 体在设定时间段N内的第i个 状态向量; 根据该M个用户群体的评论情况, 在平台页面随机投放热评指数高的 电影的评论的具 体手段为: 1) 基于设定时间段N内的用户群体的状态稳定性, 找到当前稳定性差的前M个用户群 体, 从M个用户群 体的评论中随机 选取M个评论; 2) 影评平台构建快速点赞/踩的机制, 针对M个评论, 让已购票评价后的用户进行点赞/ 踩, 因此根据点赞和踩的数量 , 获取评价的热评指数: ; 所述偏向程度的获取过程为: 将其中任一用户对应的邻域距离按照从小到大排序, 选 取前k个邻域距离; 将前k个邻域距离之和作为该用户的偏向程度; 邻域距离为:权 利 要 求 书 1/2 页 2 CN 114969249 B 2其中, 为用户p的影评特征码, 为用户q的影评特征码, 为用户p的用户行为向量, 为用户q的用户行为向量, 为哈希特征表示的历史特征码之间的向量夹 角相似度, 为购票行为的相似距离, 是一种L2 距离。 2.根据权利要求1所述的一种数据 挖掘方法, 其特 征在于, 所述 倾向程度为: 其中, 表示当前用户购票的支付时间长度, 表示当前用户当日在电影介绍 页的停留时间, 表示当前订单购票的购买迟疑程度。 3.根据权利要求1所述的一种数据 挖掘方法, 其特 征在于, 所述对已购 目标产品的评价内容进行数据挖掘是通过基于词袋模型的分词处理进行 的。 4.根据权利要求1所述的一种数据挖掘方法, 其特征在于, 所述行为差异性的获取过程 为: 1) 根据任意两用户对应的支付时间长度、 停留时间以及购买迟疑程度, 采用余弦相似 度算法, 确定该两用户的相似度, 进 而获取两用户的不相似度; 2) 将已购目标产品的倾向程度的差异 的绝对值与不相似度的乘积作为两用户的行为 差异性。 5.一种数据挖掘系统, 包括存储器和处理器, 其特征在于, 所述处理器执行所述存储器 存储的用于实现如权利要求1 ‑4中任一项所述 一种数据 挖掘方法的程序。权 利 要 求 书 2/2 页 3 CN 114969249 B 3

.PDF文档 专利 数据挖掘系统及数据挖掘方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据挖掘系统及数据挖掘方法 第 1 页 专利 数据挖掘系统及数据挖掘方法 第 2 页 专利 数据挖掘系统及数据挖掘方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:50:52上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。