投资者关注度。除了投资者情感倾向与预期,投资者关注度也是一个热点,传统金融理论假设市场上的新信息产生后会快速的传递到投资者,因此没有考虑投资者关注度对于信息传播的影响。行为金融学认为投资者的关注度是有限的,由于精力和时间限制,投资者并不对所有信息进行关注,只会选择那些吸引其注意力的信息进行关注,也只有这些信息才会对投资者的投资行为产生影响。
SeasholesandWu认为高收益率、高交易量、大量的新闻报道都会吸引投资者的关注,高关注度会导致个人投资者买入或者卖出该类股票。饶育蕾、彭叠峰等利用媒体效应与规模、换手率和波动率与股票收益率进行交互关系分析,实证研究表明关注度与股票收益率呈现负向关系,即当公众对上市公司关注度和曝光度较高时,未来该上市公司的股票收益率将会降低。
张雅慧、万迪昉以媒体对于胡润财富榜上榜富豪的关注度为研究对象分析富豪上榜后所在上市公司股票未来收益的变化情况。研究发现公众、媒体关注期间,股票会产生负的超额收益。
学术界对于投资者情绪的定义并不统一,在总结以上学者的研究的基础上给出一个宽泛的定义:投资者情绪是投资者自身心理对于金融资产的关注程度、乐观或者悲观的看法和信念。同理性预期能够对当前基本面消息进行合理反映不同,投资者情绪往往存在对当前基本面消息过度反应或者反应不足等非理性现象。
不同的投资者个体具有不同的投资情绪,但个体投资者情绪会在一定的互动机制的作用下趋于一致,具有普遍性的投资者情感倾向会显著的影响市场上金融资产的价格变化。投资者情绪不仅是投资者由于股票市场行情的变化所产生的心理态度,还是投资者对当期整个国家经济景气程度、宏观经济政策、国内外重大事件等的看法和态度。
情感分析与预测。Web2.0时代的到来,使“网民参与,以网民为中心”的理念成为新时代的主题。
互联网由“少数人写网页,大多数人读网页”的模式向“全民参与,共同建设”的模式转变,互联网用户对于事物的看法与“喜、怒、哀、乐”都会通过自己创造的互联网内容表现出来,这些内容所蕴含的信息对于社会、企业、政府都有着极大的价值,如何从海量的互联网文本信息中挖掘出这些信息一直是学术界的研究热点。
情感分析又称意见挖掘,是文本挖掘领域的一种研究方法。国外较早的采用了情感分析方法,同时对情感分析的概念也做岀了阐述:它是使用自然语言的技术去获取文本情感偏好的一种手段,随后又有学者不断丰富、充实情感分析的内涵,这些内涵包括:
PangandLee对情感分析做了比较系统的阐述。他们将情感分析定义为:使用自然语言处理技术从大量富含意见和情感的在线文本中挖掘、理解别人的意见和情绪。
近年来关于情感分析的研究大量涌现,学者们通过对在线评论、博文等语料进行主题、情感、关注度等进行挖掘,分析其与事物之间的关系。研究人员很早的就认识到大量社交媒体上的数据对于某些事情的发展就有一定的预测功能。Gruhl以网络上关于某本书的在线聊天记录为自变量来预测该书籍的未来销量。
Mishne使用博客中关于某部电影的博文情感倾向来预测电影的未来销售情况。LiuYang利用概率潜在语义分析模型对博文进行情感分析以预测产品的未来销量。Hyunyoung的文章说明了如何使用Google关键词的搜索量来预测汽车的销量、初请失业金人数、旅游目的地游客量和消费者信心指数。
HubermanandAsur利用电影上映之前Twitter上推文产生的频率与票房收入进行线性回归模型建模,通过比较,该模型对于电影上映前的票房收入预测要好于好莱坞票务部门的预测结果,且运行效率更高。他们认为通过进一步提取与电影有关推文的情感因素,能够有效的提高模型的预测能力。
HubermanandRegev对《纽约时报》上的股票市场新闻与股票价格之间的关系进行研究,有效地证明了新闻媒体的新闻报道会对股票价格产生影响。
AntweilerandFrank对《华尔街日报》发布的上市公司新闻,通过使用文本分类算法对新闻进行分类处理,辅以事件研究法,以期探索新闻对股价波动的影响。该研究得出了不同于传统的结论:股票市场存在过度反应;股票相关新闻发布后,股票收益率会在此后的几天内存在明显的异常波动;新闻对于熊市的影响程度要明显的大于牛市的影响程度,这与“有效市场假说”相悖。
SchumakerandChen首先从词语、句子、篇章三个层面将股票市场新闻文本进行量化,然后使用支持向量机SVM方法预测股票市场新闻发布20分钟后的股价,实证结果说明,加入新闻变量的模型的预测效果要好于传统的线性模型。
Tetlock通过对新闻文本进行简单的量化处理,将新闻文本分为正面和负面两类,研究发现:负面新闻将会降低公司的收益预期,但是股价并不随着消极新闻产生而剧烈波动。SchumakerandChen研究了破产类的财经新闻与股票价格变化之间的关系。最早对互联网信息或消息与股票市场之间的关系的探讨可以追溯到1999年Wysocki的文章。
在文章中,他通过获取50家公司在一段时间内的发帖信息,发现帖子的数量在一定程度上能够对次日的股票交易量和异常收益率进行预测。在这个研究的基础上,Wysocki获取了更大数量的样本以期获得更准确的预测。他首先对雅虎财政股票论坛里与股票市场相关的发帖总量进行了统计,此外,他还进一步分析了多家股票论坛之间的差异。
在获取发帖总量和横截面差异的基础上,Wysocki得出了一些非常有价值的结论:股票公司或金融公司的发帖量通常与其交易量成正比例关系,即交易量越大,公司的发帖总量相应的会越大。
同理,还有卖空交易和市值/账面比,这两者也均与发帖量成正比关系。此外,通过分析还发现,机构持股与发帖量成反比,即机构持股的比例越大,发帖量反而越小。随后出现大量的文章,都与通过网络获取的文本数据来进行挖掘的研究相关。
新闻固然会对股票市场的价格产生显著的影响,但其中真正起作用的是公众的情绪状态和情感倾向。心理学的研究告诉我们,在人们的决策过程中,除了决策者获得的信息之外,决策者当时的情绪对决策结果的影响也十分显著。行为金融学的提供了进一步的证据证明情感和情绪显著的金融决策过程。因此作出如下假设是合理的:公众的情感和情绪对股票市场的变化具有驱动作用。
然而,为了研究公众情绪如何对股票市场产生影响,我们需要找到更可靠的、更直接,并且可以量化的指标来对公众情绪进行测度。如果进行大规模的公众情绪问卷调查势必会耗费大量的时间和金钱,而且由于时间限制,调查所得到的结果时效性不会太高,现有的公众情绪调查往往以月度或者季度数据的形式出现。
由于直接数据获取存在难度,研究者们就试图利用各种间接数据来对公众情绪进行测度,例如天气状况、股票换手率等。
近十年,国外对于利用社会化媒体内容对公众情绪进行测度的研究大量出现,并日趋成熟。学者们主要通过微博、财经论坛等社交媒体获取研究所需的样本数据。在先前的研究中,Fama和Carhart认为从金融公司的规模大小、公司账面的结构和股票的动能这些资料中都能够获取投资者的情绪。
但是随着搜索技术的发展,搜索引擎也逐渐被研究者们重视。利用在线搜索的方式对个股的搜索强度进行搜索和分析,并将其划分成五分位数,在此基础上将其每周进行一次更新,以保证获取数据的准确性,逐渐剔除了Fama和Carhart的三大因素,发现搜索强度和超额收益率呈现正比例关系,即搜索强度越高,超额收益率也会越高。
不仅如此,他们还得出了更进一步的结论:高波动率的股票和搜索强度之间也有一定的相关关系,也就是说当股票的波动率越高的时候,对其搜索强度也会相应的增加。如果根据这种潜在的关系对股票市场进行深入的分析,并以此建立相应的策略,势必会对波动率较高的股票产生一定的优化选择的效用。国内学者通过搜索引擎来研究投资者关注度方面的文章也有不少。
Bollen,MaoandZeng的文章是最早利用微博研究公众情感与股票市场关系的文章,他们利用OpinionFinder和GPOMSCGoogle-ProfileofMoodStates对有关道琼斯指数的微博进行情感测度,并将测度得到的不同维度的情感值与道琼斯工业指数进行相关性分析,发现平静维度的情感值滞后三天后与道琼斯工业指数显著相关。
此后出现大量关于微博与股票市场关系的研究。Zhang,FuehresandGloor使用Twitter对投资者的希望和恐惧程度进行测度,并分析两个情绪指标与股票市场指数间的关系。
结语
得出情绪指标与市场指数呈负相关,但与市场波动率指数呈正相关。Arafat,HabibandHossain设计了一个基于云计算的算法系统,用于分析社交媒体上的数据与股票市场之间的关系。周胜臣等将基于微博数据构造的BSI指数应用到大盘指数预测模型中,得出的结果表明新预测模型比传统预测模型的预测性能要好。
免责声明:本平台仅供信息发布交流之途,请谨慎判断信息真伪。如遇虚假诈骗信息,请立即举报
举报