安全公司报告
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210364711.1 (22)申请日 2022.04.07 (71)申请人 平安资产管理有限责任公司 地址 200120 上海市浦东 新区中国(上海) 自由贸易试验区陆家嘴环路1333号 29-31楼 (72)发明人 司健 张伯超 (74)专利代理 机构 北京英特普罗知识产权代理 有限公司 1 1015 专利代理师 程超 (51)Int.Cl. G06F 16/958(2019.01) G06F 16/906(2019.01) G06F 40/126(2020.01) G06F 40/30(2020.01)G06F 40/58(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 网页翻译方法、 装置、 计算机设备及存储介 质 (57)摘要 本发明公开了网页翻译方法、 装置、 计算机 设备及存储介质, 属于机器翻译领域。 网页翻译 方法可兼容内容固定以及内容多变的网站翻译, 能够提取待翻译网页中的网页数据及与网页数 据对应的网页特征, 通过依据网页特征对网页数 据进行分类, 进而确定网页数据所属的翻译类 别, 将网页数据存储于第一类别待译表或第二类 别待译表中, 以便于有针对性的对网页数据进行 翻译提高翻译效率; 根据不同类别的网页数据选 择相应的翻译方式对数据进行翻译, 通过翻译模 型将第二类别待译表中的网页数据翻译为目标 语言的第二翻译结果, 从而根据第一翻译结果和 第二翻译结果生成与待翻译网页对应的翻译网 页, 达到可有效快速的对多样化网页翻译的目 的。 权利要求书2页 说明书9页 附图3页 CN 114756795 A 2022.07.15 CN 114756795 A 1.一种网页翻译方法, 其特 征在于, 包括: 获取至少一个待翻译网页以及与所述待翻译网页关联的翻译请求; 提取每个所述待翻译网页的网页数据及与所述网页数据对应的网页特 征; 根据所述网页 数据的所述网页 特征对所述网页数据进行分类, 根据所述网页 数据的类 别, 将所述网页数据存 储于第一类别待 译表或第二类别待 译表中; 根据所述翻译请求, 将所述待翻译网页的所述第 一类别待译表中的网页 数据翻译为目 标语言的第一翻译结果; 根据所述翻译请求, 采用翻译模型将所述第 二类别待译表中的网页数据翻译为目标语 言的第二翻译结果; 根据所述第一翻译结果和所述第二翻译结果 生成与所述待翻译网页对应的翻译网页。 2.根据权利要求1所述的网页翻译方法, 其特征在于, 所述根据所述翻译请求, 将所述 待翻译网页的所述第一类别待 译表中的网页数据翻译为目标语言的第一翻译结果, 包括: 根据所述翻译请求采用I18N翻译方式、 L10N翻译方式或G11N翻译方式, 将所述待翻译 网页的所述第一类别待 译表中的网页数据翻译为目标语言的第一翻译结果。 3.根据权利要求1所述的网页翻译方法, 其特征在于, 所述网页 特征用于标识所述网页 数据所属的状态, 所述网页特 征包括动态特 征和静态特 征; 所述根据 所述网页数据的所述网页 特征对所述网页 数据进行分类, 根据 所述网页 数据 的类别, 将所述网页数据存 储于第一类别待 译表或第二类别待 译表中, 包括: 识别所述网页特 征的状态; 当所述网页数据的所述网页 特征为静态特征时, 将所述网页数据存储于第 一类别待译 表中; 当所述网页数据的所述网页特征为动态特征时, 获取所述网页数据的存储路径, 将所 述存储路径储于第二类别待 译表中。 4.根据权利要求3所述的网页翻译方法, 其特征在于, 所述根据所述翻译请求, 采用翻 译模型将所述第二类别待 译表中的网页数据翻译为目标语言的第二翻译结果, 包括: 根据所述第二类别待译表中所述网页数据的存储路径, 提取所述网页数据, 并将所述 网页数据与翻译结果表中的翻译数据逐 条进行匹配; 若匹配, 将所述翻译结果表中与所述网页数据匹配的数据作为所述第二翻译结果; 若不匹配, 采用所述翻译模型根据 所述翻译请求将所述网页数据翻译为目标语言的第 二翻译结果。 5.根据权利要求4所述的网页翻译方法, 其特征在于, 所述翻译模型包括编码器和解码 器; 所述编码器获取所述网页数据中各个数据的词向量, 对所述词向量进行编码, 以得到 经处理后的各个所述词向量对应的隐状态 表示; 所述解码器根据所述词向量对应的隐状态 表示生成所述第二翻译结果。 6.根据权利要求1所述的网页翻译方法, 其特征在于, 所述根据 所述第一翻译结果和所 述第二翻译结果 生成与所述待翻译网页对应的翻译网页, 包括: 提取所述待翻译网页的网页属性; 基于所述网页属性构建与所述待翻译网页对应的网页模板;权 利 要 求 书 1/2 页 2 CN 114756795 A 2将所述第一翻译结果中的数据和所述第 二翻译结果中的数据添加到所述网页模板, 得 到与所述待翻译网页对应的翻译网页。 7.一种网页翻译装置, 其特 征在于, 包括: 获取单元, 用于获取至少一个待翻译网页以及与所述待翻译网页关联的翻译请求; 提取单元, 用于提取每个所述待翻译 网页的网页 数据及与所述网页数据对应的网页 特 征; 分类单元, 用于根据所述网页数据的所述网页特征对所述网页数据进行分类, 根据所 述网页数据的类别, 将所述网页数据存 储于第一类别待 译表或第二类别待 译表中; 第一翻译单元, 用于根据所述翻译请求, 将所述待翻译网页的所述第一类别待译表中 的网页数据翻译为目标语言的第一翻译结果; 第二翻译单元, 用于根据所述翻译请求, 采用翻译模型将所述第二类别待译表中的网 页数据翻译为目标语言的第二翻译结果; 生成单元, 用于根据 所述第一翻译结果和所述第 二翻译结果生成与 所述待翻译 网页对 应的翻译网页。 8.根据权利要求7所述的网页翻译装置, 其特征在于, 所述第 一翻译单元用于根据 所述 翻译请求采用I18N翻译 方式、 L10N翻译方式或G11N翻译 方式将所述待翻译网页的所述第一 类别待译表中的网页数据翻译为目标语言的第一翻译结果。 9.一种计算机设备, 其特征在于, 所述计算机设备包括存储器、 处理器以及存储在存储 器上并可在处理器上运行的计算机程序, 所述处理器执行所述计算机程序时实现权利要求 1至6任一项所述方法的步骤。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现权利要求1至 6任一项所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 114756795 A 3
专利 网页翻译方法、装置、计算机设备及存储介质
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:52:03
上传分享
举报
下载
原文档
(618.2 KB)
分享
友情链接
DB12-T 724.35-2021 安全生产等级评定技术规范 第35部分:医药制造企业 天津市.pdf
GB-T 41619-2022 科学技术研究项目评价实施指南 基础研究项目.pdf
NB-T 10682-2021 数字化继电保护现场系统级检测规范.pdf
GB-T 31147-2014 人身损害护理依赖程度评定.pdf
GB-T 42570-2023 信息安全技术 区块链技术安全框架.pdf
GB-T 17876-2010 包装容器 塑料防盗瓶盖.pdf
T-JSSLKX 002—2023 小型农田水利工程规划设计导则.pdf
GB-T 22151-2008 国际货运代理作业规范.pdf
GB-T 36073-2018数据管理能力成熟度评估模型.pdf
T-CASME 845—2023 电饭煲及电压力煲聚四氟乙烯不粘表面性能通用要求.pdf
DB11-T 1484-2017 固定污染源废气挥发性有机物监测技术规范 北京市.pdf
DB3301-T 71—2018 数字城管系统运维服务规范 杭州市.pdf
信息安全能力建设5级矩阵 英文版.pdf
GB-T 17710-2008 信息技术 安全技术 校验字符系统.pdf
GB-T 23007-2022 信息化和工业化融合管理体系 评定分级指南.pdf
DB34-T 3074-2017 电子政务外网 IPv4 地址规范 安徽省.pdf
GB-Z 18906-2002 开放式电子图书出版物结构.pdf
GB-T 38408-2019 皮革 材质鉴别 显微镜法.pdf
GB/T 38825-2020 民用飞机复合材料制件铆接要求.pdf
DB61-T 1636-2022 数据安全审计规范 陕西省.pdf
1
/
3
15
评价文档
赞助2.5元 点击下载(618.2 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。