单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,任务概述,技术要点,实验结果,总结,任务概述,评测任务,微博情绪识别与分类(,C,lose,测试,),:,对于输入的整条微博,本任务要求判断出该微博是否包含情绪。,对包含情绪的微博,要求判别其情绪分类输出为,anger,愤怒、,disgust,厌恶、,fear,恐惧、,happiness,高兴、,like,喜好、,sadness,悲伤、,surprise,惊讶中的一种,即单分类输出。,评测任务微博情绪识别与分类(Close测试):,任务概述,技术要点,实验结果,总结,任务概述,技术要点,技术要点,技术要点一,朴素贝叶斯分类的特征词选择,i=0,,判断某词在有情绪微博中的表征作用。,i=1,,判断某词在无情绪微博中的表征作用。,对有无情绪微博中的词性特征进行分析,筛选出表征能力强的词性特征。,最终,经试验取,k=4,,,n=20,,得到了,796,个特征词和,19,种词性,组成了,815,个特征集合。,技术要点一朴素贝叶斯分类的特征词选择i=0,判断某词在有情,技术要点二,面向细粒度情绪的微博向量化,=0.9,,,=0.1,,,w,表示属于第,m,维情感类的总词数,,intension,表示情感强度,,polarity,表示情感极性。,对卡方检验的特征词进行情感强度和极性人工标注。(参考大连理工本体库),根据计算得到的特征词权重值,对分词后的微博进行向量化。,技术要点二面向细粒度情绪的微博向量化=0.9,=0.1,任务概述,技术要点,实验结果,总结,任务概述,实验结果,情绪判别实验结果,情绪分类宏平均实验结果,实验结果情绪判别实验结果情绪分类宏平均实验结果,实验结果,情绪分类微平均实验结果,实验结果情绪分类微平均实验结果,任务概述,技术要点,实验结果,总结,任务概述,总结,分阶段进行微博情绪分析的方案比较理想。,无论是情绪分类还是情绪判别,特征词的选择,微博的特征化都是非常重要的环节。,本次实验并未对分类算法进行改进,将是下一步工作的重点。,总结分阶段进行微博情绪分析的方案比较理想。,谢 谢!,南华大学 计算机科学与技术学院,谢 谢!南华大学 计算机科学与技术学院,