商灏
十年前,SAO是面向服务的架构。在DT时代,一切都发生了改变。面对海量的即时的数据,要进行实时的分析,人工已经远远不能够做到,必须通过机器学习,通过深度学习,通过建模,形成一气呵成的链条,这就是IT到DT的时代大转换。在这个时代,如何保证新技术能够大幅提高系统的效率,新技术能够在哪个层次保障系统安全稳定运行?DT的应用如何少走弯路?在技术发展的新浪潮中,最主流的东西是什么?它将如何影响未来?
老的IT系统依然有路径依赖
柏睿数据公司的董事长刘睿民回答笔者上述问题时表示,DT就是数据科学,数据科学更多是让机器自主的发现规律,它融合了数据库技术、人工智能技术、机器学习技术等,包括云计算的很多创新技术,其实也都为数据科学准备的。刘睿民是从美国回国创业的颇有成就的大数据技术专家,他还是中国主导制定的2018年流数据库国际标准的执笔人、人民大学特聘教授、柏睿数据首席架构师。笔者问他,这个领域哪些厂商处于统治地位?刘睿民认为,这是一个战国时代,没有谁可以一统天下。以前IBM很火,惠普也很火,现在他们都已经掉队了,包括“沃森医生”最近也发生了很多问题。所以这些老的厂商用它老的技术,希望能够继续站在前沿,已经是很难的事情了。但在某一个领域里,比如全内存的分布式技术,这在数据库领域,属于一种前沿技术,从方向上看,谷歌、亚马逊等一些比较领先的厂商,都是以这个全内存的方式实现对新的数据库布局。
国内大量老的IT系统,是否依然有路径依赖,依然有对传统厂商技术的依赖,这会否使得他们面对新技术踌躇不前?刘睿民觉得,某种程度上,很多IT人士对中国自己的技术仍然缺乏信心。尽管中国现在已经能够制定数据库的国际标准,已经可以冲击甲骨文公司的传统市场,但如果技术上仍然没有自信,这将是一个很大的问题。
一些大的金融企业往往更信任传统的国际著名厂商的技术和产品,以保证自己系统安全稳定、有效运行,然而在当前面临着系统效率和安全性进、稳定性进一步提升的迫切需求的时候,对于选择什么样厂商的产品和技术这个问题,他们是否有选择性困难,并因此可能给自己的系统带来危害?
刘睿民称,这种危害其实是显而易见的。比如一些很小的金融机构,他们也许身处北京某个SOHO的办公室里,但它可以做金融科技的变革,通过新技术跟互联网和移动互联网的结合,去颠覆某一金融领域原来传统的非常死板的流程。而选择那些老牌的国际大公司,他们的技术已经落后了,看上去比较安全,却只能导致使用者自己更落后。很多情况下,采用新技术,可能会带来不稳定,但不稳定的同时,其实更多的感知到了市场的机会,而抓住了机会就能抓住更多用户,让他们体验到更好的服务,这是从整个变革当中应该去认清的很现实的问题。所以,动力就来自于变革才能带来进步,才能不断在市场赢得成功。
新技术应用范围和深度非常令人惊奇
DT技术变革的魅力到底在哪儿?其实从生活中人们已经有很多感知。刘睿民举例支付宝,认为其通过数据挖掘客户需求,知道哪些客户需要类似于像这种按天来计的基金形式。他还说到,人们使用京东的时候,在什么时间它会推送给你一些消费信贷,这些也都是基于数据科技才能达成的目标,类似这些东西在我们生活当中都已经开始出现。“我今年在贵阳参加数博会的时候,就看到已经有非常多的技术改变的应用展示。比如通过摄像头识别罪犯的人脸识别技术应用。我们最近也在跟人脸识别的公司紧密的合作,人脸识别也需要数据库,数据库的速度要跟上,很多人脸识别的公司底层还要买SQL这样的数据库,首先我们不谈它的安全性,光从性能上面其实是不能支撑大规模的人脸识别的应用场景的。
新技术应用的范围和深度非常令人感到惊奇,对于技术创新公司而言,技术创新的热情来自于哪里?刘说,技术创新的热情驱动很简单,既有市场会重新洗牌,创新者可以得到既有市场的一些份额。而在非既有市场、增量市场,很明显,那是新技术首先要抢夺的份额,每一次技术变革都发生同样的故事。同样,旧的技术都喜欢停留在那里,觉得它能够熬过去,但最后都没熬过去,都是新技术把它们颠覆掉,一点点的蚕食,老的技术也因此不得不做变革,否则就会被淘汰掉。
在技术更新的速度方面,刘睿民认为变化的周期比以前更快了,基本上两年左右。我们看到,从大数据到人工智能,再到区块链,每两到三年左右就有一波新的东西出来。而云的出现很大程度上是因为有移动互联网,很多中小商户可以通过移动APP直接接触到客户,但他们又没有维护这些小程序背后的能力,所以就出现类似于公有云,大家都可以租用它的空间,租用它的计算能力,租用它的带宽,然后通过移动APP来提供服务,而且是稳定的服务。因为最早的移动APP不是一个稳定的服务,它是通过各厂家的服务器给大家提供服务。APP出来以后就催生了大数据,因为每个APP就相当于一个传感器,它要感知某个人之前发生了一些什么事情,他对每一个栏目里面不同商品或文章的感知,他的各种动作都在这里体现,而这些数据被收集下来以后(这些数据比原来大的多,几乎是原来的基本上百万倍的规模),如何保存?因为数据只有保存下来才能做分析——所以这就是几步演变的过程。
刘睿民认为,在分析这些数据的过程中,有可能发现很多是重复的数据,根据这些重复的数据怎么样能够在重复的过程当中推理出一定的规律,这个推理的过程最后就使用到了机器学习的算法和深度学习的算法。继而催生了像GPU的大量使用,因为原来GPU的使用是处理图片的,尤其是在游戏里面处理图片,它恰好被用来处理网络上大家拍的大量的照片。
为什么会产生区块链?区块链最主要的作用是保护用户的数字资产,用户的数字资产怎么样能够被保护到不被别人篡改,不被别人盗用,整个过程其实都一环套一环。所以,你看,整个技术变革的浪潮,就这样一波一波,并且现在周期明显加快。
新业务用老技术往往是掉到坑里的前奏
在使用大数据基础软件支撑人工智能的运用,以及在应用最先进的区块链的过程当中,技术目标或技术路线的确定,如何能够让用户少走弯路,或不掉进坑里?
刘的观点是,老的技术可能对原有业务还有支撑能力,但对新业务的支撑就可能有点勉为其难。老的技术,更多的因为它相对比较稳定,老的业务系统相对来说也比较稳定,但对于一些新业务,要敢于用新技术,因为新业务再用老技术,往往就是掉到坑里的前奏。想要用旧瓶子装新酒,这在技术领域经常会犯错。
面对新技术新产品,用户怎么样不被厂商绕进去,不走弯路?刘表示这个问题确实还比较难解决,因为每一用户都可能有自己的长处,毕竟没有一个技术是完备的,它可能会有自己的一些不是特别擅长的地方。这个过程当中,用户更多的是要选择适合自己的技术,用户自己要有一个评估体系,在这个评估体系之上,可以选择一些不同的技术做搭配,这在某种程度上可以理解成一种最佳实践,而只有通过试错的过程,才会有最佳实践。
对CIO来说,能够做的事情更多的是能够识别哪些是适合自己的技术,而不是追求哪些技术是最新的,只有最适合自己的技术才对业务最有帮助。
目前竞争中受到用户追捧的,或者有可能成为用户追捧对象的这类公司有哪些?刘睿民称,在数据库领域,比较明显的有SAP,HARNEL;还有像亚马逊,“我们最近在写标准的时候才发现亚马逊的AWS里面的流数据库的分析数据是从硅谷的一家小公司OEM过来的,这说明技术不是有你没我,其本身是一种合法的商业的处理方法。所以这某种程度上其实这也是比较新奇的从侧面证明了我们流数据库的方向是正确的,同时我也可以很自豪地告诉大家,我们的性能要比这家硅谷小公司的性能好,功能比它还要全。”
刘说,我们还看到几家比较重要的公司,包括像AMIT,就是麻省理工的一家公司,他们也是往这个方向转,原来他们是做全内存的交易型的数据库,现在也在开始转去全内存的类似于像分析型的数据库。这都是业界的趋势,包括那些比较领先一些的厂商。(主编商灏 编辑严葭淇)