从GaussDB到无限想象:开发者眼中的2019数据变局
大嘉购整理编辑:
文经授权转载自公众号: 脑极体(ID:unity007),作者: 风辞远
AI的万丈高楼,正在拔地而起。
但是显然,这座高楼不可能突然从地基变成一百层。在2019年,我们更多看到的是产业智能化基础设施的演进、大量开发者的涌入,以及行业AI应用的渗透。
在这一过程中,有一条赛道可能并不声张,但却与产业智能化发展进程息息相关,那就是数据。
我们都知道,算法、算力、数据是AI三要素。算法的进化是AI产学各界的主要关注点,代表算力的AI芯片如今成为了社会各界共同观众的焦点。而作为“三巨头”之一的数据与数据服务基础设施,似乎相对有些沉默。
事实上,在即将过去的一年中,面向智能纪元与技术融合时代的数据开发环境,同样迎来了一场巨大变局。对于开发者来说,很多难以克服的数据问题如今都找到了解决方案。当这一年的时间额度已经明显不足,让我们来回顾一下开发者眼中的数据变局。
为了回顾这个问题,华为在今年5月15日发布的GaussDB可以作为一个明显的标志物。它的出现,意味着智能时代开发者的数据问题,正在被产业正视和解决。
让我们从开发者的视角,理顺着GaussDB的脉络,来回忆一下2019年的数据基础设施,究竟发生了什么变化。故事的开始,我们要先回到开发者在智能洪流到来时的思考与彷徨。
智能开发时代的数据基石
AI技术在产业应用中走向成熟,需要体系严密、具有清晰逻辑关联性的产业支撑。也就是说,想要在智能时代最大限度释放开发者的潜能,让智能走入千行万业,与大量新技术融合产生“智能溢出”效应,是一个典型的木桶理论——所有IT基础设施与开发工具必须适配新阶段的智能开发需求。
这个逻辑下,数据库为代表的数据基础设施,也就必须跟上智能的节奏,扛住时代的压力。之所以这样说,是因为智能时代的开发者,会清晰地感受到来自不同领域的明显数据压力。这些问题只能交给数据集成设施来拆解,否则就会成为整个智能开发体系的明显短板。比如说,智能时代有这样几个典型的“数据压力”:
1、数据潮:AI、5G、IoT、移动互联网,所有这些新技术驱动,都意味着空前大的数据井喷,对现有数据库的容量、存储与调用效率、运维管理能力提出新的挑战。数据如洪水般涌来,是开发者眼中最显著的时代挑战。
2、业务复杂性无限延申:智能时代,意味着云边端多场景都将出现复杂的业务部署与数据调用需求,这给数据库带来了分布式架构的挑战,也对故障检测维修、运维等课题带来了新的挑战。
3、强烈的异构计算需求:多技术融合是今天开发者的另一个重点工作,当传统企业业务与云原生、AI计算等新趋势融合到一起。
或许可以这样理解,能够解决这三大挑战的数据基础设施产品,是智能开发时代必不可少的基石,也是数据产业走向下一产业阶段的必经之路。而在开发者的立场上,最关注的显然是走向AI纪元的数据库产品何时能够诞生,是否能真实支撑起现实产业场景里的开发需求。
这样的思虑下,GaussDB如约而至。
GaussDB与技术跃点
锁定了问题之后,下一个阶段就是回答。
在总结了产业智能化进程中,数据领域可能面临的数据爆炸、复杂部署和异构计算三大难题后,华为推出了数据库GaussDB。
而GaussDB之所以可以看作是给开发者的答案,原因也就蕴藏于其中。其一,在数据库中运用AI技术,来解决传统数据库无法处理的诸多问题;其二。面向AI开发和AI应用,提供更领先、具备针对性的数据库支撑作用。
当GaussDB包含着着两层涵义而来,对于开发者们来说,一个新的技术跃点也随之诞生,关于数据库如何与智能时代关联的诸多问题也就有了答案。
在面向产业智能化应用与开发过程里,GaussDB通过异构计算创新框架,实现了x86、鲲鹏、GPU、NPU多种算力优势的结合,在TPC-DS测试集中,性能表现较比业界提升了50%。
作为全球首款既支持x86架构,又支持华为鲲鹏架构的数据库产品,GaussDB具备一系列性能表现领先性,比如支持单机、分布式和主备三种主流部署模式,可以满足企业核心应用的诉求,高性能表现可以达到单机部署实测百万级tmpC,分布式达到千万级tpmC。
此外,GaussDB支持本地部署、私有云、公有云等多种场景,能为各行业提供数据库进化的关键支撑。GaussDB携带的产业进化特性,可以看作是这一年中数据基础设施变革的风向标。自此开始,数据产业的生态迭代开始步步推进。
数据库的生态应用进展
在开发者的真实视野中,单一产品显然不可能满足所有开发需求与行业场景。想要让数据库真实发挥价值,就需要整个应用生态的配合进展。
这个层面,我们可以看到GaussDB在并不长的诞生时间里,已经完成了一系列生态合作探索。在华为在“鲲鹏+昇腾”的计算战略布局下,GaussDB 也成为了重要的生态支点与产业协作通道。
2019年9月,伴随着华为“鲲鹏+昇腾”双引擎正式全面启动,一系列拥抱生态开放的计算产品策略被提上了日常。其中,GaussDB OLTP单机版数据库宣布开源,开源版本的数据库名称为openGauss,可以覆盖企业70%以上的数据库业务场景,让开发者可以在最底层拥抱智能时代的数据基础设施。
在主动的软件开源之外,一系列产业生态合作构成了另一条GaussDB生态化的主线,其中的进展完成了GaussDB的产业应用矩阵,带动了IT服务市场上一系列新升级的发生。
比如在华为全联接大会2019期间,上海爱数信息技术股份有限公司手华为发布了基于华为GaussDB数据库的备份解决方案。这一解决方案面向数据保护领域面临的海量数据安全问题,为GaussDB数据库提供定时备份及恢复、集群全库数据保护、集群恢复、传输和存储加密,有效保障数据安全,并且能够使存储支持分布式架构,提升备份及恢复速率,有效应对PB级数据保护挑战,形成了对GaussDB生态的重要补完。
在此之前,用友网络科技股份有限公司与华为合作,宣布将基于用友企业云服务和华为GaussDB 数据库打造领先的联合解决方案。双方将共享产品计算优势,共同完成大型企业数字化平台NC Cloud等产品对GaussDB的适配。并在9月推出了NC Cloud+GaussDB的联合解决方案。
同样在9月的金蝶云·苍穹高峰论坛上,金蝶软件(中国)有限公司与华为联合发布了金蝶云·苍穹+GaussDB解决方案。金蝶云·苍穹解决方案是云原生架构的新一代数字化企业共生平台,采用分布式架构,支持微服务、容器服务、DevOps等为代表的云原生技术,能够帮助企业用户构建PaaS+SaaS一体化企业级云服务平台。这可以看作GaussDB在企业服务领域的关键进展,为GaussDB技术优势走入真实的产业空间拓宽了道路。
此外,在生态建设方面GaussDB还广泛赋能培养数据库人才培养。华为在9月份宣布将发起高校金种子发展计划,并提供1.5亿元的GaussDB创新研究启动基金,与高校展开GaussDB实训课程,成立十大GaussDB 高校联合创新实验室,通过产学研一体化进程打造世界级数据库产品。
在软件开源、产业生态合作与产学研一体化三条轨道上,GaussDB都在短时间中构建了完善的产业生态进展。这对于开发者来说,意味着具备更多真实使用GaussDB相关解决方案、基于GaussDB生态进行开发,融入GaussDB产业进程的机会。
而在容纳广度不断提升的基础上,GaussDB还做了另一件事,就是快速完成了大型政企与数据高标准应用行业的合规认可,让GaussDB走向了深度应用的关键赛道。
从合规走向行业深入
一直以来,数据库领域的核心争议点在于,对于金融行业等特殊行业,以及大型政企等特殊用户来说,他们对数据库的性能、安全、运维有具体入微的要求。这些场景也成为了数据基础设施走向智能时代的第一座产业高地。
某种程度上来说,特殊场景的数据产品滞后,会成为大型政企基于突破数据障碍,走向智能创新的关键问题。而解决之道,只能是数据库代表的数据基础设施,突破层层考验,走向价值自我证明的极致。
GaussDB自诞生以来,完成的另一条重要突破,就是面向这些场景展开了不间断的自我挑战,完成合规测试。从而在三个关键词:大型政企、高数据要求行业、核心业务,解锁了自身技术支撑价值的独特性。最适合大型政企的数据库,也成为了GaussDB的代名词。
2019年,GaussDB的合规测试成果可谓颇丰。8月,华为GaussDB数据库与中标麒麟高级服务器操作系统完成兼容性互认证测试。测试结果显示,GaussDB与中标麒麟服务器操作系统兼容性良好,安装顺利,系统功能正常,运行稳定。9月,亿信华辰与华为正式宣布,双方已完成亿信BI(商业智能)产品与华为GaussDB数据库兼容互认证工作。经严格测试,亿信BI与华为GaussDB数据库共同稳定运行,相互兼容、性能卓越、安全可靠,可为企业级应用提供全方位保障。这些测试证明了GaussDB在大型政企代表的高标准产业需求上,具备完善的适配性与高性能特点,成为GaussDB走入产业的基石。
在关键的金融领域,GaussDB在7月率先通过中金国盛金融行业标准符合性试点测评。基于华为鲲鹏处理器和通用CPU的GaussDB数据库均通过本次检测,82个检测项全部为“符合”。这标志着华为GaussDB数据库的功能性、安全性、稳定性等方面都符合规范要求,并在银行批量结息业务以及银行信用卡代授权业务等场景中实现性能领先。换言之,GaussDB成功完成了金融大考这份顶级试卷。
此外,今年7月在数据中心联盟发布了第八批大数据产品评测结果中显示, GaussDB率先通过512节点分布式分析型数据库基础能力评测,为分布式数据库的性能创新开创了新局面。
11月,华为发布了GaussDB OLTP数据库双分布式新架构。基于该创新架构与原创内核,GaussDB达成了面向金融行业核心生产交易系统,提供极致可用、应用透明、极致性能、强全局一致的数据库产品与金融解决方案,保证金融核心数据实时可靠处理。并且基于创新内核,实现一套代码满足双模业务分布式部署的需求,进一步强化了极致数据场景下最佳数据库表现的特征。至此,GaussDB达成了2019年在产业深度层面的不间断探索,而更多的故事,就要交给2020了。
And more?
从5月诞生开始,仅仅7个月的时间,GaussDB完成了一系列高速进化,在技术特性、产业生态布局、行业合规测试方面不间断拿出丰硕成果。这场数据库的高速奔跑,意味着开发者可以在各行业、各场景中,寻找到与GaussDB合作完成开发工作的完整契机。当开发者面临智能命题汹涌而来,云、5G、IoT组成新的技术融合机遇时,数据库不再是令人担忧的短板。
但是显然,这是故事的开始,而非旅程的结束。GaussDB和华为在智能数据领域的探索,这个命题上开发者的无尽想象,都会无缝衔接进入2020。年岁交替,更高的起点意味着更精彩的开发者传奇。
在2020年2月11-12日,华为开发者大会2020(Cloud)亟待揭晓。GaussDB的进化和“智能+数据”的探索,将在其中继续盛放。
今天,数据之变远未完结——数据与AI的结合、产业场景的深入、技术融合趋势中数据库的战略进化,都还等待着开发者们一个个去揭开谜题。
答案尽在不远处,华为开发者大会2020(Cloud)也在不远处。
开发者同样是生态的重要角色。2020年2月13-14日,华为将在深圳与所有生态角色一起,共议数字化转型路径、共商生态演进策略、共建行业创新能力、共享未来成长空间,敬请关注“华为中国生态大会2020”。
特别声明:本文为合作媒体授权DoNews专栏转载,文章版权归原作者及原出处所有。文章系作者个人观点,不代表DoNews专栏的立场,转载请联系原作者及原出处获取授权。(有任何疑问都请联系idonews@donews.com)