附录中提供了每个来源和分类的混淆矩阵。虽然AlchemyAPI很容易扩展,不需要任何预处理,并且与其他模型相比,它在IRC聊天和论坛帖子上显示出相当高的精确度,但精确度和召回率较低,这使得它对我们的应用程序来说是一个很差的选择。如果没有错误决策带来的真正成本,就无法直接在准确度和召回率之间进行区分。精度和召回率的调和平均值(非测量值,由van Rijsbergen[57]介绍)和准确度将作为目前的主要选择标准。精确性和召回率的调和平均值计算如下:F1=2·精确性·再调用精确性+召回率(11)4相关性和因果召回,情绪以二元方式分类。这意味着,在累积计算情绪时,单个负面帖子抵消了单个正面帖子,而不考虑极性的程度。为了建立累积、负和正的相关性12。IRC OTC分类比较。IRC#OTC精密召回F-Measure CV/AccuracyAlchemyAPIRaw文本0.57677 0.6720 0.6207 0.77NB多项。统计量0.623 0.57 0.595 0.65对数回归统计量0.7 0.538 0.609 0.69表13。IRC开发分类比较。IRC#DEV Precision Recall F-Measure CV/AccuracyAlchemyAPIRaw文本0.3099 0.8549 0.45489 0.658NB MultiNom。统计量0.641 0.59 0.616 0.69对数回归统计量0.623 0.631 0.628 0.71情绪,分别计算相关系数。最初,假设在情绪表达后的一天以上,情绪可以与市场波动相关。