一起来进修如何用大数据炒股_市场研究_万豪酒店神秘顾客

2017-01-13 00:40:57 盈海咨询

  比传统量化投资越发壮大的是,大数据投资在原有金融构造化数据基本上,增添了更多非构造化数据,把握市场心境,量化成为投资选股计谋。

市场研究_市场调查公司_调研公司——盈海咨询

我们如今生活在一个数据爆炸的天下里。百度天天相应凌驾60亿次的搜刮请求,日处置惩罚数据凌驾100PB,相当于6000多座中国国度图书馆的书本信息量总和。新浪微博天天都邑宣布上亿条微博。在荒无人烟的郊野,潜伏着无数大公司的信息存储中间,24小时通宵达旦地运转着。

克托•迈尔-舍恩伯格在《大数据时代》一书中以为,大数据的中心就是展望,即只需数据雄厚到肯定水平,便可展望事变发作的能够性。比方,“从一个人乱穿马路时行进的轨迹和速率来看他能及时穿过马路的能够性”,或许经由历程一个人穿过马路的速率,展望车子什么时刻应当减速从而让他及时穿过马路。

 

那末,假如把这类展望才能运用在股票投资上,又会怎样?

如今,美国已有很多对冲基金采纳大数据手艺举行投资,而且收成甚丰。中国的中证广发百度百发100指数基金(下称百发100),上线四个多月以来已上涨68%。

和传统量化投资相似,大数据投资也是依托模子,但模子里的数据变量多少倍地增添了,在原有的金融构造化数据基本上,增添了交际谈吐、地理信息、卫星监测等非构造化数据,而且将这些非构造化数据举行量化,从而让模子能够吸取。

因为大数据模子对本钱请求极高,业内人士以为,大数据将成为同享平台化的效劳,数据和手艺相当于食材和锅,基金司理和剖析师能够经由历程平台制造自身的计谋。

 

量化非构造数据

不要小视大数据的本事,恰是这项方才鼓起的手艺已制造了无数“料事如神”的奇观。

2014年,百度用大数据手艺展望命中了全国18卷中12卷高考作文题目,被网友称为“神展望”。百度公司人士示意,在这个大数据池中,包含互联网积聚的用户数据、积年的命题数据以及教诲机构对出题方向作出的推断。

在2014年巴西天下杯竞赛中,Google亦经由历程大数据手艺胜利展望了16强和8强名单。

从昔时英格兰报社的信鸽、费城股票生意营业所的信号灯到报纸电话,再到如今的互联网、云盘算、大数据,前沿手艺敏捷在投资范畴落地。在股票计谋中,大数据日趋崭露锋芒。

做股票投资计谋,须要的大数据能够分为构造化数据和非构造化数据。构造化数据,简朴说就是“一堆数字”,一般包含传统量化剖析中经常运用的CPI、PMI、市值、生意营业量等专业信息;非构造化数据就是交际笔墨、地理位置、用户行动等“还没有举行量化的信息”。

量化非构造化就是用深度模子替换简朴线性模子的历程,个中所触及的手艺包含天然语言处置惩罚、语音辨认、图像辨认等。

金融大数据平台-通联数据CEO王政示意,通联数据采纳的非构造化数据能够分为三类:第一类和人相干,包含交际谈吐、消耗、去过的所在等;第二类与物相干,如经由历程正在行驶的船只和货车推断物联网状况;第三类则是卫星监测的环境信息,包含汽车流、口岸装载量、新的修建完工等状况。

卫星监测信息在美国已被投入运用,2014年Google斥资5亿美圆收买了卫星公司Skybox,从而能够取得实行卫星监测信息。

构造化和非构造化数据也经常互相转化。“构造化和非构造化数据能够抽象明白成把一切数据装在一个篮子里,根据运用计谋差别互相转化。比方,在搜刮频次视察中,用户搜刮就是构造化数据;在金融计谋剖析中,用户搜刮就黑白构造化数据。”百度公司人士示意。

 

华尔街拿着丰盛薪水的剖析师们还不晓得,自身的店主已将大批资本投向了庖代自身的机械。

2014年11月23日,高盛向Kensho公司投资1500万美圆,以支撑该公司的大数据平台建立。该平台很像iPhone里的Siri,能够疾速整合海量数据举行剖析,而且回覆投资者提出的种种金融题目,比方“下月有飓风,将对美国建材板块构成什么影响?”

在Kensho处置惩罚的信息中,有80%是“非构造化”数据,比方政策文件、天然事宜、地理环境、科技立异等。这类信息一般是电脑和模子难以消化的。因而,Kensho的CEO Daniel Nadler以为,华尔街过去是基于20%的信息做出100%的决议设计。

既然说到高盛,趁便提一下,这家华尔街老牌投行如今对大数据可谓青睐有加。除了Kensho,高盛还和Fortress信贷团体在两年前投资了8000万美圆给小额融资平台On Deck Capital。这家公司的中心协作力也是大数据,它应用大数据对中小企业举行剖析,从而选出值得投资的企业并以很快的速率为之供应短期贷款。

 

捕获市场心境

上述诸多非构造化数据,归根结柢是为了取得一个信息:市场心境。

在采访中,2013年诺贝尔经济学奖得主罗伯特•席勒的看法被无数采访对象引述。能够说,大数据计谋投资的创业者们无一不是席勒的信仰者。

席勒于上世纪80年代设想的投资模子至今仍被业内称道。在他的模子中,重要参考三个变量:投资项目设计的现金流、公司资本的预算本钱、股票市场对投资的回响反应(市场心境)。他以为,市场自身带有主观推断要素,投资者心境会影响投资行动,而投资行动直接影响资产价钱。

然则,在大数据手艺降生之前,市场心境一向没法举行量化。

回忆人类股票投资生长史,实在就是将影响股价的因子不停量化的历程。

上世纪70年代之前,股票投资是一种定性的剖析,没有数据运用,而是一门主观的艺术。跟着电脑的进步,很多人最先研讨驱动股价变化的规律,把传统基本面研讨要领用模子替代,市盈率、市净率的观点降生,量化投资由此鼓起。

量化投资手艺的鼓起也带动了一批华尔街大鳄的降生。比方,巴克莱环球投资者(BGI)在上世纪70年代就以其逾越偕行的电脑模子成为环球最大的基金治理公司;进入80年代,另一家基金公司文艺复兴(Renaissance)年均回报率在扣除治理费和投资收益分红等费用后仍高达34%,可谓当时最好的对冲基金,以后十多年该基金资产亦非常稳固。

“从主观推断到量化投资,是从艺术转为科学的历程。”王政示意,上世纪70年代之前一个基本面研讨员只能关注20只到50只股票,掩盖面很有限。有了量化模子就能够掩盖一切股票,这就是一个大的奔腾。另外,跟着盘算机处置惩罚才能的生长,信息的用量也有一个奔腾变化。过去看三个目标就够了,如今看的目标愈来愈多,做出的展望愈来愈正确。

跟着21世纪的到来,量化投资又遇到了新的瓶颈,就是同质化协作。各家机构的量化模子愈来愈趋同,致使投资结果同涨同跌。“可否在看到报表数据之前,用更大的数据寻觅规律?”这是大数据计谋创业者们试图处理的题目。

因而,量化投资的多米诺骨牌终究触碰到了席勒理论的第三层变量——市场心境。

盘算机经由历程剖析消息、研讨报告、交际信息、搜刮行动等,借助天然语言处置惩罚要领,提取有用的信息;而借助机械进修智能剖析,过去量化投资只能掩盖几十个计谋,大数据投资则能够掩盖不计其数个计谋。

基于互联网搜刮数据和交际行动的经济展望研讨,已逐步成为一个新的学术热门,并在经济、社会以及康健等范畴的研讨中取得了肯定结果。在资本市场运用上,研讨发明搜刮数据可有用展望未来股市活跃度(以生意营业量目标权衡)及股价走势的变化。

外洋就有学术研讨指出,公司的称号或许相干关键词的搜刮量,与该公司的股票生意营业量正相干。德国科学家Tobias Preis就举行了云云研讨:Tobias应用谷歌搜刮引擎和谷歌趋向(Google Trends),以美国标普500指数的500只股票为其样本,以2004年至2010年为视察区间,发明谷歌趋向数据的公司称号搜刮量和对应股票的生意营业量,在每周一次的时刻尺度上有高度关联性。也就是说,当某个公司称号在谷歌的搜刮量运动增添时,不管股票的价钱是上涨或许下跌,股票成交量与搜刮量增添;反之亦然,搜刮量下落,股票成交量下落。以标普500指数的样本股为基本,根据上述计谋构建的模仿投资组合在六年的时刻内取得了高达329%的累计收益。

在美国市场上,另有多家私募对冲基金应用Twitter和Facebook的交际数据作为反应投资者心境和市场趋向的因子,构建对冲投资计谋。应用互联网大数据举行投资计谋和东西的开辟已成为天下金融投资范畴的新热门。

保罗•霍丁治理的对冲基金Derwent建立于2011年5月,注册在开曼群岛,初始范围约为4000万美圆, 2013年投资收益高达23.77%。该基金的投资标的包含活动性较好的股票及股票指数产品。

通联数据董事长肖风在《投资反动》中写道,Derwent的投资计谋是经由历程及时跟踪Twitter用户的心境,以此感知市场介入者的“贪欲与恐惊”,从而推断市场涨跌来赢利。

在Derwent的网页上能够看到如许一句话:“用及时的交际媒体解码潜伏的生意营业时机。”保罗•霍丁在基金宣传册中示意:“多年以来,投资者已广泛接收一种看法,即恐惊和贪欲是金融市场的驱动力。然则之前人们没有手艺或数据来对人类情绪举行量化。这是第四维。Derwent就是要经由历程立即关注Twitter中的民众心境,指点投资。”

另一家位于美国加州的对冲基金MarketPsych与汤普森•路透协作供应了散布在119个国度不低于18864项自力指数,比方每分钟更新的心境状况(包含乐观、郁闷、快活、畏惧、生机,以至还包含立异、诉讼及争执状况等),而这些指数都是经由历程剖析Twitter的数据文本,作为股市投资的信号。

此类基金还在不停涌现。金融危机后,几个台湾年青人在波士顿组建了一家名为FlyBerry的对冲基金,标语是“Modeling the World(把天下建模)”。它的投资理念悉数依托大数据手艺,经由历程监测市场言论和行动,对投资做出秒速推断。

 

关于交际媒体信息的量化运用,在股票投资以外的范畴也很罕见:Twitter自身也非常注意信息的开辟发掘,它与DataSift和Gnip两家公司达成了一项出卖数据接见权限的协定,贩卖人们的主意、心境和沟通数据,从而作为主顾的反应看法汇总后对贸易营销运动的结果举行推断。处置相似事情的公司另有DMetics,它经由历程对人们的购物行动举行剖析,寻觅影响消耗者终究挑选的纤细缘由。

回到股票天下,应用交际媒体信息做投资的公司另有StockTwits。翻开这家网站,起首映入眼帘的宣传语是“看看投资者和生意营业员如今正怎样议论你的股票”。正如其名,这家网站相当于“股票界的Twitter”,重要面向剖析师、媒体和投资者。它经由历程机械和人工相结合的手腕,将关于股票和市场的信息整顿为140字之内的短消息供用户参考。

另外,StockTwits还整合了交际功用,并作为插件能够嵌入Twitter、Facebook和linkedIn等重要交际平台,让人们能够随意马虎分享投资信息。

另一家公司Market Prophit也很风趣。这家网站的宣传语是“从交际媒体噪音中提炼市场信号”。和StockTwits比拟,Market Prophit越发注意大数据的运用。它采纳了先进的语义剖析法,能够将Twitter里的金融对话量化为“-1(极度看空)”到“1(极度看多)”之间的投资发起。网站还根据语义量化,天天宣布前十名和后十名的股票热度榜单。网站还设想了“热度舆图”功用,根据投资者心境和看法,根据差别板块,将板块内的个股根据色彩深浅举行标注,谁涨谁跌一览无余。

 

中国原创大数据指数

只管大数据计谋投资在美国貌似炙手可热,但现实上,其运用尚仅限于中小型对冲基金和创业平台公司。大数据计谋投资第一次被大范围运用,应归于中国的百发100。

百度金融中间相干担任人示意,与西欧等成熟资本市场重要由理性机构投资者组成比拟,东亚尤其是中国的股票类证券投资市场仍以散户为主,因而市场受投资者心境和宏观政策性要素影响很大。而个人投资者行动能够更多地反应在互联网用户行动大数据上,从而为有用地展望市场心境和趋向供应了能够。这也就是中国国内公募基金在运用互联网大数据投资方面比外洋市场并不落伍、以至抢先的缘由。

百发100指数由百度、中证指数公司、广发基金团结研发推出,于2014年7月8日正式对市场宣布,实盘运转以来一同上涨,涨幅凌驾60%。跟踪该指数的指数基金范围上限为30亿份,2014年9月17日正式获批,10月20日发行时一度创下26小时疯卖18亿份的“神话”。

外界都晓得百发100是依托大数据的指数基金,但其背地的细节不为人知。

百发100数据层面的剖析分为两个层面,即数据工场的数据归集和数据处置惩罚体系的数据剖析。个中数据工场担任大数据的网络剖析,比方未泉源于互联网的非构造化数据举行目标化、产品化等数据量化历程;数据处置惩罚体系,能够在数据工场递交的大数据中寻觅互相统计关联,提取有用信息,终究运用于计谋投资。

“实在百发100是在传统量化投资手艺上融会了基于互联网大数据的市场走势和投资心境推断。”业内人士归纳综合道。

和传统量化投资相似,百发100对样本股的甄选要斟酌财务因子、基本面因子和动量因子,包含净资产收益率(ROE)、资产收益率(ROA)、每股收益增长率(EPS)、活动欠债比率、企业代价倍数(EV/EBITDA)、净利润同比增长率、股权集中度、自在流畅市值以及近来一个月的个股价钱收益率和波动率等。

另外,市场走势和投资心境是在传统量化计谋基本上的立异产品,也是百发100的中心协作力。靠近百度的人士称,市场心境因子对百发100基金起决议性作用。

百度金融中间相干担任人是罗伯特•席勒看法的支撑者。他以为,投资者行动和心境对资产价钱、市场走势有着庞大的影响。因而“经由历程互联网用户行动大数据反应的投资市场心境、宏观经济预期和走势,成为百发100指数模子引入大数据因子的重点”。

传统量化投资重要着眼点在于对专业化金融市场基本面和生意营业数据的运用。但在百度金融中间相干营业担任人看来,不管是泉源于专业金融市场的构造化数据,照样泉源于互联网的非构造化数据,都是能够应用的数据资本。因而,前文所述的市场心境数据,包含泉源于互联网的用户行动、搜刮量、市场舆情、宏观基本面预期等等,都被百度“变废为宝”,从而经由历程互联网找到投资者介入特性,选出投资者关注度较高的股票。

“与同期沪深300指数的表现相较,百发100更能在股票市场振荡时代、行业轮动猛烈时代、基本面不明朗时代捉住市场热门、相识投资者心境、抗击投资波动风险。”百度金融中间相干担任人示意。

百发100拔取的100只样本股替换频次是一个月,调解时刻为每个月第三周的周五。

业内人士指出,百发100指数的月收益率与中证100、沪深300、中证500的相干性顺次提拔,申明其投资作风倾向中小盘。

但现实并非云云。从样本股的组成来讲,以某一期样本股为例,样本股总市值6700亿元,占A股市值4.7%。样本股的组成上,中小板21只,创业板4只,其他75只样本股均为大盘股。因而可知,百发100照样倾向大盘为主、反应主流市场走势。

样本股每个月的转变比例都差别,最极度的时刻曾经有60%举行了换仓。用大数据展望热门变化,市场热门每每更迭很快;但同时也要斟酌生意营业本钱。两方面斟酌,百度末了测算以为一个月换一次仓位为最好。

样本股对百发100而言是中心秘要——听说“环球只要基金司理和指数编制机构担任人两个人晓得”——都是由机械决议后,基金司理分配给差别的生意营业员建仓买入。基金司理也没有转变样本股的权益。

展望未来,百度金融中间相干担任人意得志满,“百发100指数及基金的推出,只是我们的末尾和尝试,未来将构成多样化、系列投资产品。”

除了百发100,如今市场上打着大数据旌旗的基金另有2014年9月推出的南边-新浪I100和I300指数基金。

南边-新浪I100和I300是由南边基金、新浪财经和深圳证券信息公司三方团结编制的。和百发100相似,也是根据财务因子和市场心境因子举行模子打分,根据分值将前100和前300名股票组成样本股。推出至今,这两个指数基金离别上涨了10%摆布。

正如百发100的市场心境因子来自百度,南边-新浪I100和I300的市场心境因子悉数来自新浪平台。个中包含用户在新浪财经对行情的接见热度、对股票的搜刮热度;用户在新浪财经对股票相干消息的阅读热度;股票相干微博的多空剖析数据等。

另外,阿里巴巴旗下的天弘基金也有意在大数据计谋上做文章。据相识,天弘基金将和阿里巴巴协作,推出大数据基金产品,最早将于2015年终问世。

天弘基金机构产品部总司理刘燕曾对媒体示意,“在传统的调研上,大数据将孝敬于基本资产的研讨,而以往过分依靠线下研讨报告。大数据将视野拓展至了线上的数据剖析,给基金司理选股带来新的逻辑。”

在BAT三巨头中,腾讯实际上是最早推出指数基金的。腾讯与中证指数公司、济安金信公司协作开辟的“中证腾安代价100指数”早在2013年5月就宣布了,号称是国内第一家由互联网媒体与专业机构编制宣布的A股指数。不过,业内人士示意,有关指数并没有真正运用大数据手艺。虽然腾讯旗下的微信是如今最热的交际平台,储藏了大批的交际数据,但腾讯未来怎样开辟,如今还并不清晰。

 

大数据投资平台化

中欧商学院副教授陈威如在其《平台计谋》一书中提到,21世纪将成为一道分水岭,人类贸易行动将周全进步平台形式,大数据金融也不破例。

然则,因为大数据模子对本钱请求极高,就比如不能够每家公司都搭建自身的云盘算体系一样,让每家机构自身建立大数据模子,从数据泉源和处置惩罚手艺方面看都是不现实的。业内人士以为,大数据未来势必成为平台化的效劳。

如今,阿里、百度等企业都示意下一步方向是平台化。

蚂蚁金服所努力搭建的平台,一方面包含招财宝一类的金融产品平台,另一方面包含云盘算、大数据效劳平台。蚂蚁金服人士说,“我们很清晰自身的上风不是金融,而是包含电商、云盘算、大数据等手艺。蚂蚁金服愿望用这些手艺搭建一个基本平台,把这些才能开放出去,供金融机构运用。”

百度亦是云云。靠近百度的人士称,未来是不是向平台化生长,如今还在议论中,但能够肯定的是,“百度不是金融机构,目标不是发产品,百发100的意义在于打造影响力,而非经济效益。”

当BAT还在探索前行时,已有嗅觉敏锐者抢占了先机,那就是通联数据。

通联数据股份公司(DataYes)由曾任博时基金副董事长肖风带队建立、万向团体投资建立,总部位于上海,公司愿景是“让投资更轻易,用金融效劳云平台提拔投资治理效力和投研才能”。该平台7月上线公测,如今已具有130多家机构客户,逾万名个人投资者。

通联数据如今有四个重要平台,离别是通联智能投资研讨平台、通联金融大数据效劳平台、通联多资产投资治理平台和金融挪动办公平台。

通联智能投资研讨平台包含雅典娜-智能事宜研讨、计谋研讨、智能研报三款产品,能够对基于天然语言的智能事宜举行计谋剖析,及时跟踪市场热门,捕获市场心境。能够说,和百发100相似,个中心手艺在于将互联网非构造化数据的量化运用。

通联金融大数据效劳平台更侧重于专业金融数据的剖析整顿。它能够供应公司基本面数据、国内外重要证券、期货生意营业所的行情数据、公司公告数据、公关经济、行业动态的构造化数据、金融消息和舆情的非构造化数据等。

假如将上述两个平台比作“收割机”,通联多资产投资治理平台就是“厨房”。在这个“厨房”里,能够举行环球跨资产的投资组合治理计划、定单治理计划、资产证券化订价剖析计划等。

通联数据能够根据主题热门或许自定义关键字举行剖析,构建学问图谱,将相干的消息和股票提取做成简约的剖析框架。比方用户对特斯拉感兴趣,就能够经由历程主题热门看到和特斯拉相干的公司,并推断这个观点是不是值得投资。“过去这个汇集历程要花费几天时刻,如今只须要几分钟就能够完成。”王政示意。

“通联数据就比如一家餐馆,我们把一切质料汇集来、清洗好、预备好,同时预备了一个锅,也就是大数据存储平台。研讨员和基金司理像厨师一样,用质料、东西去‘烹制’自身的计谋。”王政描述道。

大数据在平台上饰演的角色,就是寻觅关联关联。人类老是习气起首构建因果关联,继而去倒推和左证。机械进修则不然,它能够在海量数据中查获逾越人类设想的关联关联。正如维克托•迈尔-舍恩伯格在《大数据时代》中所提到的,社会须要摒弃它对因果关联的渴求,而仅需关注互相关联。

比方,美国超市沃尔玛经由历程大数据剖析,发明飓风用品和蛋挞摆在一同能够进步销量,并由此制造了颇大的经济效益。假如没有大数据手艺,谁能将这毫无关联的两件商品联络在一同?

通联数据经由历程机械进修,也能找到传统量化计谋没法发明的市场联络。个中包含各家公司之间的资本关联、产品关联、协作关联、上下游关联,也包含人与人之间的关联,比方治理团队和其他公司有无关联,是不是牵涉协作等。

未来量化研讨员是不是将成为一个被镌汰的职业?如今研讨员的重要事情就是网络整顿数据,变成投资决议设计,而以后这个事情将更多由机械完成。

“当初医疗科技生长时,人们也以为大夫会被镌汰,但实在并不会。同理,研讨员也会一向存在,但他们会更注意深入剖析和调研,低级的数据汇集能够交给机械完成。”王政示意。

但当未来大数据平台并广泛运用后,是不是会敏捷挤压套利空间?这也是一个题目。

 

摘自:财新网(Caixinwang)

作者:李小晓

,

盈海咨询是一家专业的市场研究公司,2005年成立,我们服务的客户80%以上均为世界500强企业以及行业知名企业;

经过多年的发展,建立了适合中国社会调查的独有调查网络,可提供全方位市场调查跟踪服务。咨询电话:010-86399425

一起来聊聊:互联网思维和大数据


一起来聊聊:互联网思维和大数据


电话咨询
业务领域
服务内容
在线客服