iso file download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211266801.3 (22)申请日 2022.10.17 (71)申请人 上海城建职业学院 地址 200438 上海市杨 浦区军工路23 60号 (72)发明人 贾思远 孙文龙 (74)专利代理 机构 北京鑫知翼知识产权代理事 务所(普通 合伙) 11984 专利代理师 孙长江 (51)Int.Cl. G10L 15/26(2006.01) G10L 15/06(2013.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 小学作文语音识别文本纠错系统及方法 (57)摘要 本发明涉及一种小学作文语音识别文本纠 错系统及方法, 包括如下步骤: 选择目标小学作 文训练语料, 将选择的目标小学作文训练语料按 照句子分成长度小于512字的短句; 使用语音合 成服务, 分别按照男童音和女童音生成相应的语 音文件; 将语音作为模型输入、 文本作为模型输 出, 对语料进行自适应训练下的微调; 根据训练 后的深度模 型推断小学作文语音的文本。 本发明 主要解决小学生在写作文 过程中, 遇到不会书写 的汉字时, 通过说出想写的句子, 系统会自动快 速的提供正确的书写模式, 作为参考, 帮助学生 完成作文的写作。 权利要求书2页 说明书13页 附图3页 CN 115547334 A 2022.12.30 CN 115547334 A 1.小学作文语音识别文本纠错方法, 其特 征在于, 包括如下步骤: S1.选择目标小学作文训练语料, 将选择的目标小学作文训练语料按照句子分成长度 小于512字的短句; S2.使用语音合成服 务, 分别按照男童音和女童音生成相应的语音 文件; S3.将语音作为模型输入、 文本作为模型输出, 对语料进行自适应训练下的微调; S4.根据训练后的深度模型推断小学作文语音的文本 。 2.根据权利要求1所述的小学作文语音识别文本纠 错方法, 其特征在于, 所述S1中, 具 体包括步骤: 首先加载相关Python模型, 然后 分别加载每一篇小学作文文本, 加载完成后, 对所有文本按照句子进行分割, 获得每段文本的字数, 筛选出字数在1 ‑512之间的文本, 并 保存为文本 。 3.根据权利要求2所述的小学作文语音识别文本纠 错方法, 其特征在于, 所述S2中, 具 体包括步骤: 首先加载微软相关服务模块, 然后将文本转语音配置文件设置为中文童音, 读 取S1中筛选出的所有文本文件, 针对每一个文件使用微软的Asure服务转 成对应语音, 并按 照文本编号对语音 文件命名。 4.根据权利要求3所述的小学作文语音识别文本纠 错方法, 其特征在于, 所述S3中, 具 体包括步骤: S31.导入Transformers中语音相关的模型; S32.读取文本语料文件; S33.获取语音 文件名称; S34.将文本文件与语音 文件一一对应; S35.删除多余的字段; S36.增加全部语音的音频 数字表达; S37.获得 所有小学作文的字典表; S38.将所有样本分成训练集和验证集; S39.生成用于深度学习的DataSet; S310.加载Transformers的语音处 理程序; S311.生成适用于深度学习的训练集和验证集; S312.定义基于语音的损失函数; S313.构建基于Wav2 Vec2的Transformers模型; S314.利用Transformers的自训练模型对语音和文本进行训练。 5.根据权利要求4所述的小学作文语音识别文本纠 错方法, 其特征在于, 所述S4中, 具 体包括步骤: S41.加载Transformers的语音相关模型; S42.训练后的模型 结果; S43.加载训练后的模型 结果; S44.配置用于语音识别的模型; S45.设置分词器, 加载训练时的所有 小学作文的全部词汇; S46.设置语音处 理接口; S47.加载对应的语音 文件, 并获得 该语音文件的向量;权 利 要 求 书 1/2 页 2 CN 115547334 A 2S48.对上述语音 文件进行 预测; S49.输出对应的文本 。 6.利用权利要求5所述的小学作文语音识别文本纠错方法的纠错系统, 其特征在于, 包 括存储模块、 语音合 成模块、 语音识别模块、 训练模块、 文本输出模块, 所述存储模块用于存 储目标小 学作文训练语料文本、 短句文本、 词汇文本, 所述语音合成模块用于读取存储模块 中的文本文件, 并将其转成对应语音, 并存储, 所述语音识别模块用于接收语音输入信号, 所述训练模块用于将接收语音输入信号进 行处理和预测并对语音和文本进 行训练, 所述文 本输出模块用于根据训练模块的预测结果输出对应的文本信息 。权 利 要 求 书 2/2 页 3 CN 115547334 A 3
专利 小学作文语音识别文本纠错系统及方法
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 SC 于
2024-02-18 22:24:33
上传分享
举报
下载
原文档
(660.9 KB)
分享
友情链接
T-GHDQ 87.1—2022 车辆控制器信息安全技术要求 第1部分:通用技术要求.pdf
GB-T 43079.2-2023 钢制管法兰、垫片及紧固件选用规定 第2部分:Class系列.pdf
GB-T 38629-2020 信息安全技术 签名验签服务器技术规范.pdf
法律法规 易制毒化学品管理条例.pdf
GB-T 32609-2016 网球拍及部件的物理参数和试验方法.pdf
DB14-T 2136-2020 《特种设备风险分级管控实施指南》 山西省.pdf
中汽研汽车检验中心 汽车个人信息保护白皮书 2022.pdf
NIST.SP.800-53Ar4 Assessing Security and Privacy Controls in Federal Information Systems and Organizations.pdf
GB-T 15045-2013 脂肪烷基二甲基叔胺.pdf
GB-T 26067-2010 硅片切口尺寸测试方法.pdf
GM-T 0028-2014 密码模块安全技术要求.pdf
GB-T 30491.1-2014 天然气 热力学性质计算 第1部分:输配气中的气相性质.pdf
GB-T 19466.4-2016 塑料 差示扫描量热法 DSC 第4部分:比热容的测定.pdf
GB-T 35347-2017 机动车安全技术检测站.pdf
GB-T 29246-2022 信息安全技术 信息安全管理体系 概述和词汇 征求意见稿.pdf
GB-T 32932-2016 留学中介服务规范.pdf
DB5223-T 15-2021 新市民家庭经济困难学生资助、补助规范 黔西南布依族苗族自治州.pdf
GB-T 38114-2019 纳米技术 石墨烯材料表面含氧官能团的定量分析 化学滴定法.pdf
深信服 数字化转型下医院安全运营实践 2021.pdf
SN-T 5415.4-2022 输“一带一路”沿线国家产品安全项目检验指南 纺织品 第4部分:东南亚.pdf
1
/
19
评价文档
赞助3元 点击下载(660.9 KB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。