在分析句子时,红色的节点代表这个词汇或短语带有负面情绪,例如“weird”虽然是一个负面词汇,但短语“is weird but likeable”被正确理解为正面情绪。
如上图所示“surreal but likeable Leon”是一个正面词组,但“this movie is weird”是负面的,整个句子得到的分析结果也是负面的。
相比之前模型80%的准确率,NaSent的准确率达到了85%。这个系统还没有授权给外部组织,但是据Socher说已经有几个初创公司联系他们表示对NaSent算法很感兴趣。
但遇到没有被统计的词汇或短语,这个系统就会失效。Socher和他的团队已经开始通过Twitter和网上的电影数据库,扩充系统的词汇库。他们还允许外部人员对这个词汇库进行扩充。短短几周内,就收到了14000份词汇库的提交。