iso file download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211442584.9 (22)申请日 2022.11.18 (71)申请人 之江实验室 地址 311100 浙江省杭州市余杭区中泰街 道之江实验室南湖总部 (72)发明人 廖龙飞 黄刚 华炜 韩佳易 周舟 李永福 (74)专利代理 机构 杭州浙科专利事务所(普通 合伙) 33213 专利代理师 孙孟辉 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/126(2020.01) G06F 40/242(2020.01) G06K 9/62(2022.01)G06Q 50/00(2012.01) (54)发明名称 一种基于模态观察和评分的多模态情感分 析方法和装置 (57)摘要 本发明公开一种基于模态观察和评分的多 模态情感分析方法和装置, 该方法包括: 步骤一, 获取不同模态原始数据, 针对不同模态特点提取 模态特征表示; 步骤二, 使用模态观察模块对各 模态信息进行初步融合, 获得模态融合权重和模 态学习权重; 步骤三, 基于模态融合权重和单模 态特征表 示, 构建多模态特征表 示和多模态代理 特征表示; 步骤四, 使用模态评分模块对多模态 特征表示和多模态代理特征表示进行情感打分, 结合模态学习权重, 基于多任务学习框架完成情 感分析模型的训练。 本发明不仅能够完成多模态 情感分析任务, 也能够完成各个单模态情感分析 任务, 能够 做到一次训练、 多处使用, 从而减 轻训 练负担, 大大提升使用效率和多模态情感分析效 果。 权利要求书3页 说明书7页 附图2页 CN 115496077 A 2022.12.20 CN 115496077 A 1.一种基于模态 观察和评分的多模态情感分析 方法, 其特 征在于, 包括以下步骤: 步骤一, 获取不同模态 原始数据, 针对不同模态特点 提取模态特 征表示; 步骤二, 使用模态观察模块对各模态信息进行初步融合, 获得模态融合权重和模态学 习权重; 步骤三, 基于模态融合权重和单模态特征表示, 构建多模态特征表示和多模态代理特 征表示; 步骤四, 使用模态评分模块对多模态特征表示和多模态代理特征表示进行情感打分, 结合模态学习权 重, 基于多任务学习框架完成情感分析模型的训练。 2.如权利要求1所述的一种基于模态观察和评分的多模态情感分析方法, 其特征在于, 所述步骤一具体包括以下子步骤: 步骤1.1, 采集现有的带有情 感标记的多模态数据集, 具体为: 截取影音片段, 通过剪辑 分离出片段数据中的文本模态数据、 视觉模态数据和语音模态数据, 并进 行人工情感标注, 标注出对应的对应的文本模态情感标签、 视觉模态情感标签、 语音模态情感标签, 以及多模 态情感标签; 步骤1.2, 根据不同模态的数据特点, 提取 各模态数据的特 征表示。 3.如权利要求2所述的一种基于模态观察和评分的多模态情感分析方法, 其特征在于, 所述步骤1.2具体为: 对于文本模态数据, 首先通过字典对文本字符进行编码, 并添加特殊字符[cls]和 [sep]; 然后通 过预训练好的BERT模型得到词向量序列 , 其 中 表示特殊字符[cls ]的词向量, 表示第i个词向量, 表示特殊字符[sep]的词向 量, 以 作为初始文本模态特征表示 , 通过一个三层神经网络 Ft得到文本模态特征表示 ; 对于视觉模态数据, 首先把视频转换 成图像帧集合 , 通 过人脸检测技术得到人脸图像 集合 ; 再使用OpenFace提取每张人脸图 像的特征向量, 得到 人脸特征序列 , 其中 代表第i个人脸特征向量, 对 人脸特征序列求均值得到初始视觉模态特征表示 , 通过一个三层神经网络 Fv得 到视觉模态特 征表示 ; 对于语音模态数据, 通过Python库librosa提取过零率 、 梅尔倒谱系数 、 CQT色 谱图 , 得到语音特征序列 , 其中 表示对应时间权 利 要 求 书 1/3 页 2 CN 115496077 A 2步的语音特征, 对语音特征序列求均值得到初始语音模态特征表示 , 通过一个 三层神经网络 Fa得到语音模态特 征表示 。 4.如权利要求3所述的一种基于模态观察和评分的多模态情感分析方法, 其特征在于, 所述步骤二具体包括以下子步骤: 步骤2.1, 将文本模态 特征表示 、 视觉模态 特征表示 、 语音模态 特征表示 , 通过拼 接得到初步模态融合表征 ; 步骤2.2, 把初步模态融合特征表示 通过一个前馈神经网络得到模态权重观察向量 , 其中 表示对应单模态 观察分数, 具体表达式如下: , 其中 和是模态 观察模块可 学习参数; 再通过模态 观察分数, 计算模态融合权 重, 表达式为: , 其中 范围在0到1之间, 越大表示模态 在模态融合中贡献越大; 在模态融合权重基础上进行模态学习权重的计算, 具体是通过在1个批次的训练数据 中对每个样本做加权平均, 然后通过指数函数 求得, 表达式为: , 其中 代表在训练数据的批次大小。 5.如权利要求4所述的一种基于模态观察和评分的多模态情感分析方法, 其特征在于, 所述步骤三具体包括以下子步骤: 步骤3.1, 通过文本模态 特征表示 、 视觉模态 特征表示 、 语音模态特征表示 , 结合 文本模态融合权 重 、 视觉模态融合权 重 、 语音模态融合权 重 , 得到多模态特征表 示 表达式为: ; 步骤3.2, 引入三个零向量 分别作为文本代理特征表示 、 语音代理特征表示 和视觉 代理特征表 示 , 其维度与文本模态特征表示 、 视觉模态特征表 示 、 语音模态特征表示权 利 要 求 书 2/3 页 3 CN 115496077 A 3
专利 一种基于模态观察和评分的多模态情感分析方法和装置
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 SC 于
2024-03-03 12:04:11
上传分享
举报
下载
原文档
(752.0 KB)
分享
友情链接
民航 MH-T 6038-2012 民用航空燃料水路运输质量控制.pdf
GB-T 31710.3-2015 休闲露营地建设与服务规范 第3部分:帐篷露营地.pdf
GB-T 39026-2020 循环再利用聚酯(PET)纤维鉴别方法.pdf
DB23-T 3278—2022 应急指挥中心基础设施与支撑系统建设规范 黑龙江省.pdf
GB-T 43294-2023 教育与学习服务 术语.pdf
电信研究院 游耀东 DevSecOps在云网融合环境下的实践 2021.pdf
T-JSJCXH T-JSJCXH4—2023 先张法预应力超高强混凝土管桩.pdf
GB-T 40219-2021 拉曼光谱仪通用规范.pdf
NY-T 1520-2021 木薯.pdf
GB-T 14406-2011 通用门式起重机.pdf
OWASP go语言 安全编码实践指南 中文版.pdf
数据安全和个人信息保护社会责任指南2.1实施.pdf
T-STMA 008—2022 党政信息网络空间安全运维管理体系标准.pdf
GB-T 34680.4-2018 智慧城市评价模型及基础评价指标体系 第4部分:建设管理.pdf
GB-T 706-2016 热轧型钢.pdf
DB32-T 4535-2023 固定污染源废气 颗粒物快速监测技术规范 江苏省.pdf
GB-T 42829-2023 量子保密通信应用基本要求.pdf
GB-T 29505-2013 硅片平坦表面的表面粗糙度测量方法.pdf
DB3708-T 10-2022 公共机构节能监管平台建设指南 济宁市.pdf
T-CPQS XF005—2023 消防应急照明和疏散指示产品维修、更换及相关服务.pdf
1
/
13
评价文档
赞助3元 点击下载(752.0 KB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。