量本投资极客系列:如何快速对“陌生人”知根知底?

想认识美国总统特朗普,你需要几个人来引荐?

人际关系理论中有一个叫六度分离理论(Six Degrees of Separation)的定理,就是说地球上随便一个人要与另外一个人攀上关系,只需要不超过五个中间人就能达成。

这形象地揭示了知识图谱的基本逻辑——万事万物无不处于相关关联之中。

通过知识图谱,将各类信息用节点和关系加以整合,能为真实世界的各类场景直观建模,运用“图”的基础性、通用性“语言”,“高保真”地描绘多姿多彩的世界。

量本投资极客系列:如何快速对“陌生人”知根知底?

图1:把信息通过知识图谱建模后,变为了更有价值的知识

深入一下,知识图谱可根据覆盖的领域进行垂直研究,尤其是金融这种专业度比较高的领域。在人工挖掘和管理这些关系的过程中,投资者常常会遗漏很多有价值的信息。下图展示了投资者经常面临的数据问题,针对两种情况,DataYes·萝卜投资提出了两种解决思路:

量本投资极客系列:如何快速对“陌生人”知根知底?

图2:常见的知识图谱问题及解决方案

下面我们介绍一下萝卜投资金融知识图谱在进行知识推理过程中的尝试和实践。

1、产业上下游关系推理

以汽车行业为例。中国汽车工业已经告别野蛮增长的时代,从成长期步入成熟期。

今年年初,汽车行业受到了疫情影响,遭遇复工难、销售难、供应链紧张等问题。乘联会公布的乘用车产销数据显示,2020年2月,狭义乘用车(轿车+SUV+MPV)零售销量达25.2万辆,同比下降78.5%,环比1月下85.3%。

产业链上,中国汽车零部件企业已超过10万家,并基本实现了1500种部品的覆盖。抛开外生政策面的影响,汽车产业链条上的商业逻辑关系已日益成熟和清晰。

在DataYes·萝卜投资的知识图谱中,涉及汽车行业的上游指标包括原材料(钢铁、玻璃、铝、铜等)、汽车零部件(轮胎、内燃机、工业机器人设备等),中游指标包括汽车生产制造及整合,同时,面向消费市场的终端环节,我们将上市公司划分为生产类、销售类两类进行投研体系的搭建。

1.1 产业链上下游关系

我们知道,汽车整车与零部件的上下游存在相互促进的依赖关系,汽车零部件的利润水平受到原材料价格和整车厂商价格变动的影响。

比如,如果上游的钢材价格波动加大,会加剧下游整车制造商的竞争,这也会倒逼零部件厂商不断加强技术创新,以提高产能和质量,降低成本。

量本投资极客系列:如何快速对“陌生人”知根知底?

图3-1:萝卜投资知识图谱-汽车产业链上下游关系

百年汽车工业,老树也会开新花。汽车行业的外延也随着时代发展和技术进步不断扩展,比如养护维修、汽车共享、汽车金融、新能源汽车等概念也成为衡量汽车市场发展必不可少的因素。

用户可点击萝卜投资知识图谱里的“+”功能键继续推演产业链里的关系,如下图中“原材料——钢铁——焦炭”的关系。

量本投资极客系列:如何快速对“陌生人”知根知底?

量本投资极客系列:如何快速对“陌生人”知根知底?

图3-2:萝卜投资知识图谱-汽车产业链上下游关系

1.2 产品公司关系

在汽车行业下游的消费市场,经销商们会控制不同地区的销售网络,其销售网络的覆盖和销售能力会对上游的汽车生产商产生直接影响。

用户可点击平台上的公司名称进行跳转,进而通过相关公司的基本情况研判汽车行业的销售状况和汽车市场潜力。

量本投资极客系列:如何快速对“陌生人”知根知底?

图4:萝卜投资知识图谱-汽车产品公司关系

1.3 研究数据

在知识图谱中的“研究数据”板块,根据汽车产品种类,我们别具特色地细分了汽车厂商的产销数据,更加精细化地为研判个股基本面,提供了支撑。

量本投资极客系列:如何快速对“陌生人”知根知底?

量本投资极客系列:如何快速对“陌生人”知根知底?

图5:萝卜投资知识图谱-汽车研究数据板块

02、指标间关系推理

在金融领域,指标纷繁复杂,有宏观指标、中观指标、微观指标等,各个指标之间也不是一对一的固定关系。我们运用知识图谱中图特征的技术原理进行指标间关系的梳理,即预测一条可能存在的边:

1. 相似的节点更有可能连在一起(物以类聚);

2. 节点的相似度可以从节点邻居或者节点间的路径得到。

对于2,简而言之,如果A指标的变动会引起B指标、C指标的变动,同时B指标和C指标也相互影响,则B、C均为整个知识图谱体系中的重要节点。

也就是说,我们必须处理知识图谱中的多节点间的共有关系。

量本投资极客系列:如何快速对“陌生人”知根知底?

图6:PPI与CPI的主要影响因素和传导路径(来源:中信证券)

举个例子,如上图,宏观方面,国家政府通过需求侧改革、货币财政政策的调整,实现对市场中投资需求和消费需求的调控。如果投资和消费规模不断增加,理论上会分别拉动PPI和CPI的上涨。

值得注意的是,在PPI和CPI的两个节点上,根据价格传导规律,市场整体价格水平的波动一般会先出现在生产领域,然后通过产业链向下游产业扩散,最后波及流通领域(消费品)。以工业品为原材料的生产即工业品价格PPI向CPI的传导途径为:从原材料→生产资料→生活资料的传导。因此,由于时间差,PPI和CPI可能会存在背离情况,进而出现多节点间的共生关系。

就此,DataYes·萝卜投资平台基于数据、算法和工程,在上层搭建了供投研人员使用的知识图谱,把割裂的、充满噪声的大数据,经过知识图谱的处理、加工和链接,变为高度浓缩、可被人脑处理的有价值小数据。并支持全领域的金融图谱查看、搜索、主题信息推荐、风险传导影响、舆情监控等。

量本投资极客系列:如何快速对“陌生人”知根知底?

萝卜投资,让基本面研究量化起来!扫描下方二维码可免费注册试用,了解更多投资线索。

量本投资极客系列:如何快速对“陌生人”知根知底?

DataYes·萝卜投资致力于打造从投资研究、组合管理到风险控制的一体化智能投资平台。依托人工智能、大数据和知识图谱技术,以及量化基本面投资理念,我们帮助客户跟踪投资动态、发掘投资机会、防范投资风险、沉淀投资知识。


分享到:


相關文章: