九坤王琛:量化+AI,未来可期!

发布时间:2022年05月11日

       2021国际人工智能大会于2021年7月8日至10日在上海世博中心和上海世博展览馆一起举行。国际人工智能大会自2018年以来, 已成功举行三届。2021国际人工智能大会由国家开展和变革委员会、工业和信息化部、科学技术部、国家互联网信息办公室、我国科学院、我国工程院、我国科学技术协会, 以及上海市人民政府一起主办。作为本届国际人工智能大会承办单位之一, 数库科技于7月9日下午举行以“数据智能, 链接未来”主题分论坛, 会中九坤出资创始人王琛宣布了《数智年代量化出资的演进与应战》的主题讲演, 从量化出资的数智演进、九坤在数据与智能方面的实践、未来量化出资数智开展中面对的应战和瓶颈三方面论述量化职业开展。在王琛看来, 量化出资盈余的要素, 一是金融商场的弱有效性, 导致商场有出资空间、出资时机, 这是金融商场出资挣钱的根底确保;二是计算方法的有效性, 这是量化根底的出资崇奉。量化的中心开展方向, 包含信息、算法、履行三个方面。图片来自:数库科技王琛表明, 在人工智能鼓起之前, 量化范畴现已做到了必定高度。但进入数字化年代之后, 这三个方向都被AI和大数据冲击。以九坤运用AI处理信息的实践为例, 现在正测验在时刻序列上把各种多模态的特殊数据来历进行交错, 终究构成对价值的猜测才干, 使得猜测才干不止来历于量价。王琛还说到未来量化出资数智年代的应战, 详细包含多模态应战、数据质量应战、处理速度应战。还有两个严重应战, 包含模型有效性、商场反身性与金融商场高噪音的叠加的应战, 以及我国商场环境下, 不一起间商场风格和结构的改变带来的应战。下面, 是对王琛先生在本次论坛讲演内容的收拾:量化出资为什么能盈余?“Historydoesntrepeatitself, butitdoes rhyme.”—MarkTwain许多人问量化为什么能挣钱?马克吐温的这句话现已道出了金融商场乃至人类前史背面的规则。
       他说前史不会重复自己, 但会压自己的韵脚。前史是人发明的, 不论前史怎样开展, 人道在其间起到的效果会重复呈现。金融商场是由人买卖出来的商场, 背面反映的计算规则是量化存在的根据。量化出资为什么能够盈余?两个要素:一是金融商场的弱有效性。导致商场有出资空间和出资时机, 这是一切在金融商场出资挣钱的一个根底确保;二是计算方法的有效性。咱们已然发现前史是能压自己韵脚, 前史简略的重复和押韵脚最大的差异在于找到它背面的规则性, 咱们叫因子或算法也好, 这些需求经过重复的验证, 咱们才干信任它在量化的运用, 这也是量化根底的出资崇奉。AI怎样猜测股票?数据!要害是找到那些影响股价的信息对应的数据。首要是数据。什么叫量化所期望的数据, 或许什么叫好的数据?数据最重要的是对股价要有必定的影响才干称之为好的数据。有这么一个故事, 在每年的“315晚会”上, 那些被点名的企业(上市企业/非上市企业)。当这些上市企业尤其在美股上市的企业在晚会上有被说到有负面音讯后, 由于其正在盘中买卖, 该公司的股价则会发生大的跳水。这是一个很显着的比方, 只要把数据用得更好, 这样一个简略的数据就会变成咱们比速度的一个游戏, 速度越快, 就能更早的发现这些信息并运用到股票买卖中去。第二个比方, 当咱们把十分简略的数据运用之后, 怎样去提高数据关于股价的影响, 咱们需求再隔一层。许多做根本面的人都知道, 根本面出资的中心是猜测上市公司的盈余才干。上市公司的盈余才干在不同的职业会有不同的盈余目标。比方特斯拉, 它有一个十分重要的盈余目标, 那便是量产才干。2018年, 特斯拉在加州的某个工厂, 有一个公司收集到其工厂职工的手机信号。这些信号显现了在当季度加班的状况。
       他们以为, 加班状况会直接猜测到整个特斯拉的产能。由于经过猜测后发现:在2018年第三季度职工加班的份额比较之前有30%以上的增幅, 其时便对特斯拉给出了十分强的买入信号。当特斯拉Q3季报出来之后, 咱们看到特斯拉当天上涨了9%。类似于这样的数据能够直接影响到股价, 那么, 咱们以为这便是好的数据!大数据+AI算法年代的降临人工智能已从简略的算法+数据库开展演化到了机器学习+深度了解的状况。图片来自:九坤出资大约2018年之前, 国内量化仍是以量价数据+人工发掘的方法为主。在2018年之后, 整个商场开端逐步进入AI算法的年代, 不论从因子发掘、组合办理, 仍是说话优化等方面, 进一步提高了整个量化出资的收益。到2019年之后, 整个量化职业的规划快速增加, 这是推进整个职业开展十分重要的动力。到2020年, 咱们以为量化职业现已到了大数据+AI算法的阶段。全体来看, 在量化职业打破7000亿的体量之后, 大数据+AI算法在未来的开展趋势势不可挡, 咱们以为未来量化职业的首要增加来历也是来自于此。量化数据分类和规划图片来自:九坤出资九坤举了两个其在数据+AI算法方面的事例:事例一:新闻/公告上图看到新闻和公告是有超越数百万条的记载, 当咱们拿到这样的数据后,

榜首件事是得先知道这些数据长什么样。首要, 咱们需求先把这些数据进行相关的分类, 在这其间会运用一些NLP算法, 完成对不同类型的新闻或许公告数据的分类, 比方成绩预增或许预减, 股价上涨和跌落等。前面说到315的比方,

咱们想是不是能够从中找出一两个或许几个立刻影响股价的新闻事例, 变成简略的算法就能够套利了?这件事其实是挺难的, 经过咱们验证后发现:当咱们把商场价格放到模型中后, 大都新闻对股价的影响是与咱们的预期有所不同。图片来自:九坤出资举个比方, 许多人会觉得假如看到一些上市公司的严重负面音讯,

股价会有比较大的跌幅。假如咱们看到上市公司有严重的重组或许严重合同的签署音讯, 或许对上市公司是一个十分利好的音讯。
       实际状况恰恰相反, 当呈现一些严重合同签署的时分, 股价在接下来的几天都是跌落的。细心回看商场的走势, 能够看到在呈现这些严重利好之前的几天, 股价现现已过了一波快速的上涨。关于我国商场来说, 现在许多新闻数据, 在终究的成果中有的时分是一个反指, 这是咱们在研讨中发现的问题。包含在美股商场, 我能显着感觉到, 至少在十年之前, 你以为它是利好就很有或许是利好, 但后边利好会逐步衰减。这也是金融商场买卖反身性的一个成果, 也便是所谓的“靴子落地就会发生利空促进, 或许利好实现”的成果。事例二:量化根本面咱们都在想怎样用量化去做根本面, 这是一切的量化公司都在考虑的问题。在A股做量化根本面要做的工作跟海外不太相同, 由于国内根本面的研讨信息和数据关于量化来说并不是那么充沛。咱们能够想到一个根本的研讨来自于职业研讨陈述, 怎样对这些职业研讨陈述进行剖析?很直接的方法找到一切券商的职业研讨员, 让他定时给咱们职业研讨的数据。当咱们拿到几百万篇前史研讨陈述的时分, 能不能把这些陈述变成对研讨员猜测才干的判别剖析, 这也是十分重要的。咱们企图从几百万篇的研讨陈述中经过NLP的方法来获取相关信息。图片来自:九坤出资当一个研讨陈述描绘职业的时分, 咱们看里边有哪些要害的目标跟职业相关的。
       对量化来说最缺的是对一个职业的常识图谱的构建, 要树立这个常识图谱的就要经过这样的系统, 经过NLP对研报进行剖析, 然后把一切的信息抽取出来, 得到在时刻序列上研讨陈述在前史上所呈现的二维结构。根据这样的二维结构咱们能够对其间许多目标进行验证, 看它是不是对上市公司盈余的成果或许股价的成果有影响, 是长时刻的影响仍是短期的影响。榜首步, 咱们假如把左面的研讨陈述变成右边的款式, 这便是十分典型的自然语言处理手法, 左图许多是PDF格局的文件, 咱们要对它进行结构分段处理。在这个过程中, 咱们会得到一个与一切职业相关的研讨目标或许研讨结构系统。咱们现在尽力测验的, 便是期望在各个方向上, 在时刻序列上把各种多模态的特殊数据来历进行交错, 终究构成对价值的猜测才干!量化出资大数据智能化面对的应战1、多模态化应战模态化的数据需求多模态的算法来处理信噪比低,

掩盖股票数量要求高2、数据质量的应战数据源自身的过错或噪音数据提取、更新的反常数据在时刻序列要求3、处理速度应战低时延+海量数据+7X24AI算力支撑更大的应战1、模型有效性、商场反身性与金融商场高噪音的叠加2、不一起间商场风格和结构的改变终究, 王总为咱们深入了当年他入职量化时的一句话:“Ifyoutorturethedatalongenough, itwillconfess.”—RonaldCoase期望与咱们共勉!

返回到上一页>>

友情链接:

Copyright © 2009-2022 八达科技有限公司 badakejiyouxiangongsi (stationgourmande.com),All Rights Reserved