情感分析方法 情感分析的流程包括文本预处理、特征标注与选择、训练模型、调整模型。 现有的文本情感分析的途径大致可以集合成四类:关键词识别、词汇关联、统计方法和概念级技术。 关键词识别 :利用文本中出现的清楚定义的影响词(affect words),例如“开心”、“难过”、“伤心”、“害怕”、“无聊”等等,来影响分类。 词汇关联 :除了侦查影响词以外,还附于词汇一个和某项情绪的“关联”值。 统计方法 :通过调控机器学习中的元素,比如潜在语意分析(latent semantic analysis),SVM(support vector machines),词袋(bag of words),等等。 (参见Peter Turney在相关领域的研究成果。 )