安全公司报告
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210074020.8 (22)申请日 2022.01.21 (71)申请人 北京高途云集教育科技有限公司 地址 100094 北京市海淀区西北旺东路10 号院东区17号楼 2层202号 (72)发明人 刘煊  (74)专利代理 机构 北京超凡宏宇专利代理事务 所(特殊普通 合伙) 11463 代理人 蒋姗 (51)Int.Cl. G06F 40/205(2020.01) G06F 40/284(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) (54)发明名称 信息分析方法、 装置、 电子设备及存 储介质 (57)摘要 本申请提供一种信息分析方法、 装置、 电子 设备及存储介质, 涉及智 能识别技术领域。 该方 法包括: 获取目标文字对应的目标图片; 对目标 图片进行文字识别, 得到文字信息; 对文字信息 进行分析, 获取文字信息的目标文字分布信息, 其中, 文字分布信息包括文章结构分布信息、 语 句语义分布信息或词汇分布信息中的至少一种。 本申请将文字的图片信息识别为文字信息, 通过 对文字信息进行分析, 得到目标文字对应的目标 文字分布信息。 能够对文字的结构、 语义、 词汇等 进行有效地 分析, 通过分析结果中的文字分布信 息, 提升了用户的使用体验, 有助于用户对目标 文字进行高效地阅读和理解, 提高了用户进行阅 读学习的效率。 权利要求书2页 说明书11页 附图3页 CN 114417818 A 2022.04.29 CN 114417818 A 1.一种信息分析 方法, 其特 征在于, 所述方法包括: 获取目标文字对应的目标图片; 对所述目标图片进行文字识别, 得到文字信息; 对所述文字信 息进行分析, 获取所述文字信 息的目标文字分布信 息, 其中, 所述文字分 布信息包括文章结构分布信息、 语句语义分布信息或词汇分布信息中的至少一种。 2.根据权利要求1所述的方法, 其特征在于, 所述对所述文字信息进行分析, 获取所述 文字信息的目标文字分布信息, 包括: 获取所述文字信息中的至少一个遍历节点; 基于预设的阅读解析算法, 以所述遍历节点为基点对所述文字信息进行遍历, 得到所 述文字信息的目标文字分布信息 。 3.根据权利要求1所述的方法, 其特征在于, 所述对所述文字信息进行分析, 获取所述 文字信息的目标文字分布信息之前, 所述方法还 包括: 根据所述文字信息在数据库中进行对比, 以确定所述数据库中是否包含所述文字信 息; 若所述数据库中未包含所述文字信息, 则执行所述对所述文字信息进行分析, 获取所 述文字信息的目标文字分布信息的步骤。 4.根据权利要求3所述的方法, 其特征在于, 所述数据库中包括多个历史文字信息; 所 述根据所述文字信息在数据库中进行对比, 以确定所述数据库中是否包含所述文字信息, 包括: 按照预设的标签分布规则, 提取 所述文字信息对应的目标 标签; 根据所述目标标签对所述数据库中的多个历史文字信 息的历史标签进行筛选, 以确定 所述数据库中是否包 含所述文字信息 。 5.根据权利要求4所述的方法, 其特征在于, 所述根据所述目标标签对所述数据库中的 多个历史文字信息的历史标签进行筛选, 以确定所述数据库中是否包含所述文字信息, 包 括: 根据所述目标标签对所述数据库中的多个历史文字信 息的历史标签进行筛选, 得到历 史文字数据集; 将所述历史文字数据集任意一个历史文字信 息与所述文字信 息进行对比, 得到至少一 个相似度; 在任意一个所述相似度大于预设阈值时, 则所述数据库中包 含所述文字信息 。 6.根据权利要求1所述的方法, 其特征在于, 所述对所述文字信息进行分析, 获取所述 文字信息的目标文字分布信息之后, 所述方法还 包括: 对所述文字信息与所述目标文字分布信息进行关联, 得到目标文字分析集 合; 将所述目标文字分析集 合保存在数据库中。 7.根据权利要求1所述的方法, 其特征在于, 所述对所述目标图片进行文字识别, 得到 文字信息, 包括: 将所述目标图片转换为文本信息; 对所述文本信息进行格式处 理, 得到对应的文字信息 。 8.一种信息分析装置, 其特 征在于, 所述装置包括:权 利 要 求 书 1/2 页 2 CN 114417818 A 2获取模块, 用于获取目标文字对应的目标图片; 识别模块, 用于对所述目标图片进行文字识别, 得到文字信息; 分析模块, 对所述文字信息进行分析, 获取所述文字信息的目标文字分布信息, 其中, 所述文字分布信息包括文章结构分布信息、 语句语义分布信息或词汇分布信息中的至少一 种。 9.一种电子设备, 其特征在于, 所述电子设备包括存储器和处理器, 所述存储器中存储 有程序指 令, 所述处理器运行所述程序指 令时, 执行权利要求 1‑7中任一项 所述方法中的步 骤。 10.一种可读取存储介质, 其特征在于, 所述可读取存储介质中存储有计算机程序指 令, 所述计算机程序指令被一处 理器运行时, 执 行权利要求1 ‑7任一项所述方法中的步骤。权 利 要 求 书 2/2 页 3 CN 114417818 A 3

PDF文档 专利 信息分析方法、装置、电子设备及存储介质

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 信息分析方法、装置、电子设备及存储介质 第 1 页 专利 信息分析方法、装置、电子设备及存储介质 第 2 页 专利 信息分析方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:48上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。