安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210501128.0 (22)申请日 2022.05.09 (71)申请人 合肥综合 性国家科 学中心人工智能 研究院 (安徽省人工智能实验室) 地址 230088 安徽省合肥市望江西路5 089 号,中国科学技术大学先进技术研究 院未来中心B120 5-B1208 (72)发明人 陆闻滢  (74)专利代理 机构 广州海心联合专利代理事务 所(普通合伙) 44295 专利代理师 黄为 (51)Int.Cl. G06V 20/59(2022.01) G06V 40/70(2022.01) G06V 40/50(2022.01)G06V 40/16(2022.01) G06V 10/764(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) A61B 5/00(2006.01) A61B 5/16(2006.01) A61B 5/18(2006.01) A61B 5/369(2021.01) (54)发明名称 基于多模态Tran sformer网络的驾驶员疲 劳 检测系统 (57)摘要 本发明公开了基于多模态Transformer网络 的驾驶员疲 劳检测系统, 涉及深度学习及智能生 物医学信号处理。 数据采集模块, 用于获取驾驶 员的脑电信号及其面部表情图像块; 嵌入处理模 块, 用于对脑电信号和面部表情图像块进行嵌入 处理, 以获取脑电令牌和图像块令牌; 自注意力 分析模块, 用于通过Transformer编码器对脑电 令牌和图像块令牌进行多头自注 意力分析, 以获 取脑电信号令牌向量和图像块令牌向量; 结果预 测模块, 用于通过预测函数式对令牌向量进行结 果预测。 本发 明能够根据驾驶员的脑电和面部表 情来获得驾驶员的驾驶状态并实时地给出反馈, 有效提高了驾驶的安全性。 权利要求书2页 说明书5页 附图3页 CN 114782933 A 2022.07.22 CN 114782933 A 1.基于多模态Transformer网络的驾驶员疲劳检测系统, 其特 征在于, 包括, 数据采集模块, 用于采集驾驶员的脑电信号及其面部表情图像, 并将所述面部表情图 像分割为 面部表情图像块; 嵌入处理模块, 用于对所述脑电信号和面部表情图像块进行嵌入处理, 以获取脑电令 牌和图像块令牌; 自注意力分析模块, 用于通过Transformer编码器对所述脑电令牌和图像块令牌进行 多头自注意力分析, 以获取脑电信号令牌向量和图像块令牌向量; 结果预测模块, 用于通过能进行降维处理 的预测函数式对所述脑电信号令牌向量和图 像块令牌向量进行 结果预测。 2.根据权利要求1所述的基于多模态Transformer网络的驾驶员疲劳检测系统, 其特征 在于, 所述预测函数式为, predicti on=tanh(W(Po oling([EEG class token; Image class token]))+b); 式中, prediction为预测结果值; EEG  class token为脑电信号令牌向量; Image   classtoken为图像块令牌向量; Po oling为池化 函数; b为偏置向量; W 为权重向量。 3.根据权利要求2所述的基于多模态Transformer网络的驾驶员疲劳检测系统, 其特征 在于, 根据Transformer的分类任务构建一损失函数, 通过所述损失函数对 预测结果值进行 分析, 以对预测结果 值进行优化。 4.根据权利要求3所述的基于多模态Transformer网络的驾驶员疲劳检测系统, 其特征 在于, 所述损失函数为, 式中, yi表示预测结果值样本是否属于第i类分类任务; pi为模型认为样本属于第i类分 类任务的概 率; task为参数因子; clas s为类别数目。 5.根据权利要求1所述的基于多模态Transformer网络的驾驶员疲劳检测系统, 其特征 在于, 所述脑电信号令牌向量和图像块令牌向量均通过以下公式获取, x’=MSA(LN(x))+x; output=tanh(MLP(L N(x’))+x’); 式中, MSA为多头自注意力机制 函数; LN为层标准化函数; x为Transformer编码器的输 入值; x’为x经过多头自注 意力机制函数运算后的输出值; MLP为多层感知器函数; tanh为分 类器函数; output为Transformer编码器的输出值。 6.根据权利要求1所述的基于多模态Transformer网络的驾驶员疲劳检测系统, 其特征 在于, 通过以下公式对所述脑电信号和面部表情图像块进行嵌入处 理, EEG=[EEGclass; EEG1;…; EEGt]+posEEG; Image=[Ima geclass; ImagePatch1;…; ImagePatchn]+posImage; 式中, EEG为脑电令牌, 且EEG∈Rt×c; R为实数域; t为时间维度上的采样 点的数目; C为通 道数目; EEGclass为脑电信号类别令牌; posEEG为脑电信号的位置嵌入矩阵, 且posEEG∈R(t +1)×c; Image为图像块令牌; Imageclass为面部表情图像块类别令牌; posImage为面部表情图像 块的位置嵌入矩阵, 且posImage∈R(n+1)×c。 7.根据权利要求6所述的基于多模态Transformer网络的驾驶员疲劳检测系统, 其特征权 利 要 求 书 1/2 页 2 CN 114782933 A 2在于, 通过以下公式为所述脑电令牌和图像块令牌添加位置向量, 式中, PE(pos,2i)为元素的行向量; PE(pos,2i+1)为元素的列向量; pos为脑电信号或面部表 情图像块在时序 序列中的位置, 也即位置嵌入矩阵中的行向量; i是矩阵行向量的维度。 8.根据权利要求1所述的基于多模态Transformer网络的驾驶员疲劳检测系统, 其特征 在于, 所述 面部表情图像分割为 面部表情图像块的数量 为, n=H×L/P2; 式中, P为图像尺寸; L 为图像长度; H为图像宽度; C为 通道数目。权 利 要 求 书 2/2 页 3 CN 114782933 A 3

.PDF文档 专利 基于多模态Transformer网络的驾驶员疲劳检测系统

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于多模态Transformer网络的驾驶员疲劳检测系统 第 1 页 专利 基于多模态Transformer网络的驾驶员疲劳检测系统 第 2 页 专利 基于多模态Transformer网络的驾驶员疲劳检测系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:37:25上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。