全部版块 我的主页
论坛 经济学人 二区 外文文献专区
2022-6-25 04:26:14
附录中提供了每个来源和分类的混淆矩阵。虽然AlchemyAPI很容易扩展,不需要任何预处理,并且与其他模型相比,它在IRC聊天和论坛帖子上显示出相当高的精确度,但精确度和召回率较低,这使得它对我们的应用程序来说是一个很差的选择。如果没有错误决策带来的真正成本,就无法直接在准确度和召回率之间进行区分。精度和召回率的调和平均值(非测量值,由van Rijsbergen[57]介绍)和准确度将作为目前的主要选择标准。精确性和召回率的调和平均值计算如下:F1=2·精确性·再调用精确性+召回率(11)4相关性和因果召回,情绪以二元方式分类。这意味着,在累积计算情绪时,单个负面帖子抵消了单个正面帖子,而不考虑极性的程度。为了建立累积、负和正的相关性12。IRC OTC分类比较。IRC#OTC精密召回F-Measure CV/AccuracyAlchemyAPIRaw文本0.57677 0.6720 0.6207 0.77NB多项。统计量0.623 0.57 0.595 0.65对数回归统计量0.7 0.538 0.609 0.69表13。IRC开发分类比较。IRC#DEV Precision Recall F-Measure CV/AccuracyAlchemyAPIRaw文本0.3099 0.8549 0.45489 0.658NB MultiNom。统计量0.641 0.59 0.616 0.69对数回归统计量0.623 0.631 0.628 0.71情绪,分别计算相关系数。最初,假设在情绪表达后的一天以上,情绪可以与市场波动相关。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-25 04:26:17
由于我们最感兴趣的是预测汇率和交易量的上升或下降,因此我们计算t(情绪表达的日期)和t+n(我们计算相关性的日期)之间交易量和日均价格的百分比和绝对变化。表23、24和25说明了t的积极、消极和累积情绪与从t到t+n的价格和交易量变化之间的相关性。对于每个渠道,选择上一节中的最佳分类者对2015年的数据集进行分类。Pearson相关系数(r)和相应的p值是使用Pythonspipy库中的pearsonr模块计算的【58】。对于除Reddit以外的所有渠道,积极情绪似乎与t+2之后的交易量变化呈负相关,显著水平至少为0.05或以下。有趣的是,积极的Reddit情绪是唯一与价格上涨正相关的情绪来源。没有其他积极的情感渠道表现出这种相关性——所有其他积极的情感都是消极的。渠道之间相同情绪类型相关性的差异可以提供有趣的见解,了解居住在特定在线社区的比特币市场参与者对新闻的反应(可能是也可能不是该社区独有的)。总体而言,负面情绪表达的相关性更强。在假设的背景下,这可能表明比特币交易员对负面消息更敏感。这与[11]的发现相符。在做出该声明时,重要的是要考虑分类错误。积极情绪的不正确分类会溢出到消极情绪中。这意味着分类者将识别出比实际情况更多的负面新闻。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-25 04:26:20
另一方面也是如此,这在某种程度上平均弥补了这种影响。未来改进积极情绪分类的研究可能会略微降低消极情绪的相关性。最强的相关性可以在论坛情绪中找到。对此的一种可能解释是数据收集之前的子论坛过滤。其他消息来源讨论了任何与比特币相关的内容,而围绕比特币交易、投机和经济的琐碎的子谣言,因此可能会有更多的活跃比特币交易者。尽管迄今为止发现的相关性较弱,但从未期望有完美的相关性;比特币价格形成还有许多其他因素。在加强相关性的第一步中,如果t处的积极情绪高于2015年该渠道每日积极情绪的90%,而消极情绪低于2015年消极情绪的10%,我们仅考虑t时的情绪和t+n时的市场走势。这改善了相关性,但显著降低了统计显著性(p>0.05)。由于剩余样本较少(2015年365次每日观察的第10个百分位),即使变量之间没有真正的相关性,我们也可以观察到相关性。p值的增加反映了这种不确定性。4.1格兰杰因果关系检验为了确定情绪在预测比特币价格和交易量变动方面是否具有任何预测价值,我们可以进行格兰杰因果关系检验【59】。Granger因果关系检验确定了一个时间序列(x)中的信息是否先于另一个时间序列(y),以及包含x中的历史数据是否比仅使用y中的历史数据提高了y的预测精度。因此,x Granger导致了y。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-25 04:26:23
Granger因果关系测试通过使用一个时间序列中的信息来建模另一个时间序列中的变化来实现这一点。该测试的目的不是为了证明真实或哲学上的因果关系。该测试仅旨在建立预测因果关系[60]。由于测试是双向的(我们想确定因果关系的方向),执行格兰杰因果关系测试的无效假设如下:oH0.1:x系列不会格兰杰导致y系列oH0.2:y系列不会格兰杰导致x系列将是情绪类型,y系列是市场指标。超过0.05的显著水平拒绝零假设。格兰杰因果关系检验要求分析的时间序列都是协方差平稳的。数据中不应该有明确的(上升或下降)趋势。为了确定这一点,在将要进行inH测试的每个系列上进行增强Dickey Fuller(ADF)[61]睾丸。然后将每个变量的平稳序列用于格兰杰因果关系检验。ADF测试证实了价格和成交量每日变化百分比的平稳性,以及所有收集的情绪时间序列。EViews 9软件【62】用于对各种滞后设置进行因果性测试。示例2的滞后长度假设,如果从y中删除的时间步长超过两个,则来自所选时间序列x之一的数据无助于预测序列y。表14。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-25 04:26:25
已执行格兰杰因果关系测试的总结结果,显示了x系列和y系列之间的格兰杰因果关系方向,显著水平为0.05。x y滞后1滞后2滞后3滞后4滞后5负面消息%价格变化→ → → → →正面消息%价格变化负面Reddit%价格变化← →← ← ← ←正Reddit%价格变化→← →← ← ←负面论坛%价格变化→ → → →正面论坛%价格变化负面新闻%数量变化→积极消息%数量变化→← →←负Reddit%体积变化← ← ← ←正增量%体积变化← ←负面论坛%卷更改← ← ← ← ←积极论坛%卷更改→← ← ← ← ←表14显示了对新闻文章、Reddit帖子和论坛主题进行格兰杰因果关系测试的总结结果,包括收入和日均价格的百分比变化。对于新闻和论坛频道,我们最显著的发现是从负面情绪到价格变化的格兰杰因果关系,这表明负面情绪在预测这些变化方面有价值。这一观察结果在负面的Reddit情绪中被逆转,其中情绪是由价格百分比变化引起的Granger。这在在线比特币社区的行为中呈现出一种有趣的模式。新闻和论坛似乎被用来收集交易情报,而补充信息似乎包含了对市场发生了什么的讨论。我们还发现,成交量变化是负面和正面论坛情绪以及负面Reddit情绪的主要指标。所分析的渠道均未显示出从消极或积极情绪到交易量变化的预测因果关系。格兰杰检验的全部结果见附录中的表26、27和28。5结论和进一步研究本研究提供了证据,证明在预测每日比特币交易价格和交易量时,将源自各种来源的在线话语情感纳入其中的价值。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-25 04:26:29
同时,它也证实了[7]的早期发现,即社交聊天反映了交易所之前发生的价格和交易量变化。正如我们现在发现的那样,这种预测因果关系并非对所有渠道都是单向的,应该通过渠道、市场指标和情绪进一步剖析。与[7]的研究结果一致,汇率变动似乎确实可以作为预测指标,预测所研究的社交渠道(论坛和Reddit)对交易量和价格表达的情绪。另一方面,我们发现负面论坛和新闻情绪与日均交易价格之间存在预测因果关系。这一点从执行的格兰杰因果关系测试(Granger causalitytest)中可以明显看出,在该测试中,我们最显著地发现负面新闻和论坛情绪会导致价格变动,但价格和成交量变动会导致论坛和Reddit渠道的情绪处于0.05或以下的显著水平。这种关系可能会通过提高分类精度而得到加强,而不仅仅是使用简单的Logistic回归和多项式朴素贝叶斯模型来获得这些结果。功能工程也可能有所帮助,因为对于积极情绪文档,似乎没有一套明确的分离功能。真正的测试是将这些发现应用到算法比特币交易策略中,以确定这些发现在实践中是否有效。虽然情绪时间序列未包含在交易算法中,但执行的测试足以证实该假设。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-25 04:26:31
由于格兰杰因果关系可以测试预测序列X中是否存在其他时间序列y(在本例中为情绪)的任何附加值,因此我们可以得出结论,如果该情绪数据包含在交易模型中,则有可能提高预测精度。所进行研究的主要局限性在于相对较小且稀疏的数据集和研究的时间框架。从更广泛的来源收集情绪将有助于更好地了解比特币社区的整体情绪,并了解情绪是如何随时间变化的。一年期比特币交换价格通常不是固定不变的,而是遵循一种趋势。语言和地理偏见也发挥了作用。例如,比特币在中国被大量使用。因此,中国比特币市场参与者可能也会受到本研究中未包括的在线讨论的影响。本研究也未对未直接提及比特币的次要新闻和讨论进行调查,尽管此类新闻可能包含有关比特币的重要信息。例如,有关外国货币政策的消息很可能对比特币产生积极影响,因为比特币的使用可以规避更严格的货币管制,从而进一步推动对加密货币的需求。在进行的研究中,有人假设,如果这些信息与比特币真正相关,它将蔓延到比特币社区。然而,如果将这种直接分析和综合与比特币相关的次要新闻和讨论应用于交易算法,将带来Asped优势。参考文献【1】J.Bollen,H.Mao,X.Zeng,《计算科学杂志》2,1(2011),1010.3003【2】C.Oh,O.Sheng(2011)【3】J.Smailovi\'C,M.Grˇcar,N.LavraˇC,M。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-25 04:26:34
Znidarsiˇc,《复杂、非结构化、大数据中的人机交互和知识发现》(Springer,2013),第77–88页【4】张,P.E.斯旺森,《经济与金融杂志》34,96(2010)【5】Y。。。uh、 u。。。Coindesk LLC,标题=比特币市值[6]CoinMarketCap,加密货币市值(2017),http://coinmarketcap.com[7] J.Kaminski,第1–8页(2014),1406.7577[8]D.Garcia,F.Schweitzer,皇家学会开放科学2,150288(2015)[9]J.Bukovina,M.Marticek等人,技术代表,门德卢大学商业与经济学院(2016)[10]P.Ciian,M.Rajcaniova,D.Kancs,应用经济学481799(2016)[11]P.C.Tetlock,《金融杂志》621139(2007)[12]G.Gidofalvi,C.Elkan,加利福尼亚大学圣地亚哥分校计算机科学与工程系(2001)【13】I.Bordino,S.Battiston,G.Caldarelli,M.Cristelli,A.Ukkonen,I.Weber,PloS one 7,e40014(2012)【14】S.Satherwal,S.K.Sarkar,Y.Zhang,《商业财务与会计杂志》381209(2011)【15】C.M.Jones,G.Kaul,M.L.Lipson,《金融研究评论》7631(1994)【16】S.Nakamoto,Www.Bitcoin。Org p.9(2008),4354534534V343453[17]A.Back等人,《Hashcash-A拒绝服务对策》(2002)[18]N.Popper,《数字黄金:比特币和试图重塑金钱的百万富翁的内幕》(Harper,2015)[19]Dell Inc.,Dell现在接受比特币(2014),http://www.dell.com/bitcoin/[20] 库存过剩。com,Inc.,比特币库存过剩。com(2014),https://www.overstock.com/bitcoin【21】D.Yermack,NBER工作文件系列53,1689(2013),arXiv:1011.1669v3【22】A.Kumar,C.Lee,《金融杂志》612451(2006)【23】B.M.Barber,T.Odean(2011)【24】D.K.Pearce,V.V.Roley,《股票价格与经济新闻》(1984)【25】E.F.Fama,《金融杂志》25383(1970)【26】J.Kleininjenhuis,F.Schultz,D.Oegema,W。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-25 04:26:38
Van Atteveldt,Journalism 14,271(2013)【27】A.P.Chaboud,B.Chiquoine,E.Hjalmarsson,C.Vega,《金融杂志》69,2045(2014)【28】M.Glantz,R.Kissell,《多资产风险建模:电子和算法交易时代的全球经济技术》(学术出版社,2013)【29】Aldridge,Krawciw,《实时风险:投资者应该了解的金融科技》,高频交易和闪电崩盘(Wiley and Sons,Inc.,2017)[30]M.O\'Hara,D.Easley,《金融市场面临“大数据”崩盘的风险》(2013),https://www.ft.com/content/48a278b2-c13a-11e2-9767-00144feab7de【31】B.Pang,L.Lee等人,《信息检索基础与趋势》(Foundations and Trends(R))2,1(2008)【32】B.Liu,《人类语言技术综合讲座》5,1(2012)【33】B.Pang,L.Lee,S.Vaithyanathan,《竖起大拇指?:使用机器学习技术进行情感分类,摘自《ACL-02自然语言处理中的实证方法会议论文集》第10卷(计算语言学协会,2002),第79–86页[34]R.Snow,B.O.Connor,D.Jurafsky,A.Y.Ng,D.Labs,C.St,《自然语言处理中的经验方法会议录》(EMNLP)第254–263页(2008)[35]I.亚马逊。亚马逊机械土耳其常见问题解答(2005),https://www.mturk.com/mturk/help?helpPage=overview【36】B.Mellebeek,F.Benavent,J.Grivolla,J.Codina,M.R.Costa Jussa,R.Banchs,《机械土耳其语非专家注释的西班牙客户评论意见挖掘》,载于《2010年AACL HLT研讨会论文集,使用亚马逊的机械土耳其语创建语音和语言数据》(计算语言学协会,2010),pp.114–121【37】A.P.Dawid,A.M.Skene,应用统计学第20–28页(1979)[38]J.Whitehill,P.Ruvolo,T.Wu,J.Bergsma,J。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-25 04:26:41
Movellan,《神经信息处理系统进展》22,1(2009)[39]区块链。信息,主要比特币交易所的平均美元市场价格(2015年),https://blockchain.info/charts/market-price【40】C.D.Manning,P.Raghavan,H.Schütze等人,《信息检索导论》,第1卷(剑桥大学出版社,2008年)【41】spaCy,spaCy,工业实力自然语言处理(2016年),https://spacy.io[42]D.Andor,C.Alberti,D.Weiss,A.Severyn,A.Presta,K.Gancev,S.Petrov,M.Collins,arXiv预印本arXiv:1603.06042(2016)[43]J.D.Choi,J.R.Tetreault,A.Stent,它取决于:使用基于Web的贬值工具进行依赖项解析器比较。,在ACL(1)(2015)中,第387–396页【44】nltk。组织,Nltk语料库(2017),http://www.nltk.org/nltk_data/【45】H.Saif,M.Fernández,Y.He,H.Alani(2014)[46]scikit learn,scikit learn,python机器学习(2007),http://http://scikit-学习。org【47】G.Salton,C.Buckley,《信息处理与管理》24513(1988)【48】V.Jain,J.Mahadeokar,《使用离散小波的短文本表示》,载于《第23届万维网国际会议记录》(ACM,2014),第301–302页【49】IBM,IBM Watson DeveloperCloud:AlchemyLanguage(2015),https://www.ibm.com/watson/developercloud/alchemy-language.html[50]S.Tan,G.Wu,H.Tang,X.Cheng,《情感分析背景下的域转移问题的新模式》,载于第十六届信息与知识管理会议论文集(ACM,2007),第979-982页[51]A.L.Berger,V.J.D.Pietra,S.A.D.Pietra,计算语言学22,39(1996)[52]X.Zhang,Y.LeCun,arXiv预印本XIV:1502.01710(2015)【53】P.Domingos,M.Pazzani,《机器学习》29103(1997)【54】S.Wang,C.D。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-25 04:26:44
Manning,《基线和bigrams:简单、良好的情绪和主题分类》,摘自计算语言学协会第50届年会:短文第2卷(计算语言学协会,2012),第90–94页,A.Y.Ng,M.I.Jordan,《神经信息处理系统的进展》,2841(2002)[56]V.N.Vapnik,V.Vapnik,《统计学习理论》,第1卷(Wiley New York,1998)【57】C.J.Van Rijsbergen(1979)【58】SciPy。组织,Scipy。组织-scipy。org(2017年),https://www.scipy.org【59】C.W.Granger,《计量经济学:计量经济学学会杂志》第424–438页(1969年)【60】F.X.Diebold,《预测要素》(Citeseer,1998年)【61】R.Mushtaq(2011年)【62】I.G.Inc.,Eviews 9sv(2015年),http://www.eviews.com/EViews9/EViews9SV/evstud9.htmlA附录可找到所进行实验的代码athttps://github.com/marvinkennis/BitcoinThesisThe用于数据收集的铲运机已经采购并记录,并且可以找到athttps://github.com/marvinkennis/BitCollectB附录B表15。新闻文章上逻辑回归的混淆矩阵/RealP NP 191 114N 62 453表16。RedditpostsPred上逻辑回归的混淆矩阵/RealP NP 208 281N 112 867表17。forumtopicsPred上logistic回归的混淆矩阵/RealP NP 391 303N 209 1.048表18。IRCChatterPred上logistic回归的混淆矩阵/RealP NP 371 318N 159 692表19。newsarticlesPred上多项式NB的混淆矩阵/RealP NP 222 83N 66 449表20。Reddit postsPred上多项式NB的混淆矩阵/RealP NP 267 222N 176 803表21。forumtopicsPred上多项式NB的混淆矩阵/RealP NP 405 289N 287 970表22。IRC上多项式NB的混淆矩阵/RealP NP 393 296N 238 613表23。t时来源的积极情绪与t+n时的指标的相关表。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群