柏睿数据人工智能并行算法库技术闪耀美Strata硅谷峰会—— 大数据新里程碑:大数据底层技术与人工智能的深度加持

6 梁睿 2018-3-9 13:29:33

image003.jpgimage005.jpgimage007.jpg

特约记者梁睿 美国旧金山报道

当地时间3月7日,全球瞩目的Strata Data Conference2018在美国硅谷盛大举行。作为全球最具影响力的顶级大数据峰会,此次汇聚了众多全球顶尖产业决策者、战略专家、架构师、开发员和分析师,展示了最新大数据相关产业和技术未来,被《福布斯》杂志誉为“大数据运动的里程碑”。

每年的Strata峰会都会带来许多令人振奋惊艳的大数据与人工智能技术。值得关注的是,在Strata2017纽约峰会上因发布“2018国际标准流数据库(Rapids StreamDB)而获全球数据库领域专家一致认可的实时分析数据库产品的缔造者——中国的柏睿数据,再次闪耀Strata Data Conference2018,并在峰会上分享了其国内首款数据库内人工智能并行算法库(Rapids Parallel R)。

据柏睿数据创始人兼CTO刘睿民介绍:“在此次峰会上,柏睿数据将大数据底层技术与人工智能技术相结合,研发并推出了数据库内人工智能并行算法库(Rapids Parallel R)。这是国内唯一一款支持机器学习与深度学习的数据库产品。其特点是R运算引擎的分布式突破了业界R被迫单机运行限制,并提供了四大类数十种统计算法,支持更广泛应用范围,同时能够直接在内存数据库里进行R建模运算,无需繁琐数据加载清洗过程,赋予用户业务数据智慧决策与自我进化的新能力。”

业内人士表示:库内人工智能并行算法库,很新颖,具有革命性。能够将非常复杂的机器学习模型,通过调用SQL实现调用并行R语言算法,易用性强,可以减轻大量繁杂的工作,降低时间与管理成本,做到实时运用R语言人工智能算法库。

现场上柏睿数据SQL/Hadoop研发总监James Ma(马珺)表示:在对标测试查找相似用户的应用场景中,对397万数据的计算,传统的机器学习与深度学习用时82.2分钟,库内人工智能并行算法库的完成时间是4.49分钟,效率提高近20倍。另外,库内人工智能并行算法库在CPU的使用效率占据更高优势。

随着新一轮科技革命和产业变革的推进, 2018年的政府工作报告再次重点提及人工智能的研发:“发展壮大新动能。加强新一代人工智能研发应用。发展智能产业,拓展智能生活。运用新技术、新业态、新模式,大力改造提升传统产业。”为传统行业提供新动能,这正是人工智能技术的核心价值所在,也是人工智能可以代表先进生产力的核心依据。人工智能在快速变化的参数下运行,需要强大的机器学习与深度学习来支撑数据模型的建立并运用于实践中。在医疗领域,通过构建医疗数据模型进行机器学习与深度学习,能够帮助医生快速查找合适的诊断方案;在金融领域,通过构建金融数据模型进行机器学习与深度学习,能够让系统智能定位风险账号;在公共安全领域,通过构建公安数据模型进行机器学习与深度学习,能够协助警务人员快速锁定犯罪嫌疑人……利用库内人工智能并行算法库技术,柏睿数据先后为省市级统计局、国土局、网信办、医疗业、金融业等行业提供库内人工智能服务,实现了人工智能赋能产业升级、城市升级、政府效率职能升级等效能,为数字经济带动国民经济从量变到质变的飞跃提供了方案贡献了力量。

与此同时,柏睿数据在峰会上展示了代表中国30年来首次获得国际标准化委员会计算机领域2018流数据库国际标准制定权产品——流数据库(Rapids StreamDB)、新版全内存分布式数据库(RapidsDB v3.3.2)和大数据存储和在线服务系统(Rapids Hadoop)等。让世界见证了柏睿数据出色的技术实力与全球影响力,也为国产数据库产品占领行业一席之地。柏睿数据创始人兼CEO刘睿民表示:“我们非常荣幸能够再次受邀参加Strata硅谷峰会,峰会不仅是向全球用户展示先进产品及领先技术的机会,更为柏睿数据与甲骨文、SAP、IBM、Spark、微软等世界一流公司开展交流合作提供了极佳的平台。我们对未来充满信心。中国是全球最大的数据市场,相信伴随着我们的技术和产品在实践中的不断探索与应用,未来能够在该领域继续保持领先水平,为客户提供更好的服务。”

在当前信息变革和网络时代的大潮下,中国崛起不仅是经济现象,更是科技文化现象。今天的中国,已在世界刷出了自己的“存在感”,独具东方气质的软实力已成为一张醒目的名片。在此次Strata硅谷峰会上记者发现,来自中国的大数据、人工智能企业逐渐增多,他们为本次峰会带来了满满的中国风。在柏睿数据展台,参观者络绎不绝,不少国内外技术大咖、媒体记者专门流连于此,探访柏睿数据给美国乃至世界带来的改变。

此次峰会作为该系列会议的开年首站,还将围绕人工智能、机器学习、大数据与云计算、数据工程、数据驱动业务、数据科学、Hadoop、流处理等主题进行深入探索与交流。


2