专利内容由知识产权出版社提供
专利名称:基于数据增强的情感分类模型及情感分类方法专利类型:发明专利
发明人:李博涵,王文幻,王萌,历傲然,杨新民,解文彬申请号:CN202011591215.7申请日:20201229公开号:CN112580337A公开日:20210330
摘要:本发明公开一种基于数据增强的情感分类模型,该模型构建方法包括如下步骤:(1)获得原始数据集;(2)对原始数据集进行预处理和清洗;(3)对各文本进行否定处理;(4)将文本进行反转,形成对立文本;(5)标记原始文本和对应的对立文本的标签;(6)生成对立文本的数据集作为对立文本训练集;(7)采用分类器,从原始数据集和对立文本训练集两个方面训练分类器模型,获得情感分类模型。本发明利用数据增强技术得到对立文本训练集和对立文本测试集,并利用词嵌入将文本转换为词向量,从正反两个角度来对文本情感进行预测,增加了模型预测的鲁棒性,提高了模型预测的准确率,通过本发明提出的分类方法能够有效提高分类精度。
申请人:南京航空航天大学
地址:211100 江苏省南京市江宁区将军大道29号
国籍:CN
代理机构:南京业腾知识产权代理事务所(特殊普通合伙)
代理人:缪友益
更多信息请下载全文后查看