旷视开源一小步,AI 基建一大步
大嘉购整理编辑:
文章经授权转自公众号:PingWest品玩(ID:wepingwest),作者: Decode
进入 2020 年,新冠肺炎疫情袭击中国各地,经济不可避免受到冲击。压力之下,3 月中共中央政治局常务委员会召开会议,提出加快 5G 网络、数据中心等新型基础设施建设进度。
新基建,这一 2018 年被提出、2019 年被写入政府工作报告的概念,顿时成为全民热议话题。
它涵括了新能源汽车充电桩、特高压、城际高速路和城际轨道交通、5G、大数据中心、人工智能和工业互联网七大领域。这其中,后四项共同组成的数字化基础设施,尤为引人注目。
数字化基础设施建设的本质是什么?5G、大数据中心、人工智能(以下简称 AI)和工业互联网之间,又有什么内在联系?
数字基建的本质
传统基础设施主要是“铁公鸡”(铁路、公路、机场),为中国实体经济发展打下了汗马功劳。
▲(图片来自网易财经)
从实体经济到数字经济,数字化基础设施接过了“铁公鸡”的基建大旗,成为新一代经济底层支柱。
疫情期间,数字化基础设施已经展示了其影响力。
病原发现和药物研发环节,AI 与大数据中心加速了基因检测和蛋白质结构模拟的进程;疫情防控一线,基于 AI 和 5G 的机器人及设备在不少地方节省了人力,更高效更安全;复工复产后,工业互联网帮制造业提升了效率。
种种应用场景背后,不难看出数字化基础设施建设的本质,是通过通用的底层技术,把物理世界在线化、数字化和智能化,以提高数字经济的生产效率。
具体而言,5G 和工业互联网让一切个人的、企业的设备在线化、数字化,生成了大量的数据;大数据中心提供了算力支持,是一切计算的基础;而 AI 作为算法承担了智能化的任务。
很多人都把数据比喻成数字经济的石油,如果按照这个逻辑进一步类比,那算力就是燃料,算法就是炼油工艺——原油必须经过一系列工艺加工过程,才能得到有用的各种石油产品。
正如炼油工艺推动了石油时代的快速发展,AI 也代表了数字经济时代的先进生产力。
那么,AI 的基础设施又是什么?
手机的人脸识别,家里的智能音箱,天上的无人机,路上的无人驾驶……新基建被提出的 2018 年,AI 产业已经在中国市场上蓬勃发展。
AI 产业链有三个层级:基础层(计算基础设施)、通用层(软件算法及平台)和应用层(行业应用及产品)。
益于庞大用户量产生的数据红利,以及丰富的应用场景,中国 AI 产业的发展更多集中于应用层。而在基础层,依然缺少有竞争力的技术和人才。主流芯片(比如 GPU)和算法框架(比如 TensorFlow)话语权都被国外巨头占据。
对于这种情况,有专业知乎用户这么比喻道,这只是游轮上的表面繁荣,水下是技术垄断的冰山。一个被断了电的游乐场,即使别出心裁设计出再多新奇有趣的项目,又有什么意义?
政府力推新基建,必然是希望产业和学界深入到 AI 的基础层,而不是只停留在应用层的表面繁荣。
那么,对于 AI 来说,基础层的设施又是什么?
“只有 AI 芯片平台和 AI 生产力平台,能够被称为 AI 基础设施。”2020 年 3 月 25 日,在旷视一场线上发布会里,旷视联合创始人兼 CTO 唐文斌一针见血地指出。这场发布会的主题是,旷视开源其深度学习框架“天元”(MegEngine)。深度学习框架通常被认为是 AI 的操作系统,上承各种业务模型、行业应用,下接芯片、大型计算机系统。
芯片平台是 AI 的基础设施,这一点毋庸置疑。就在旷视这场发布会几天前,业界传出了腾讯进军芯片制造的消息。
更早之前,阿里巴巴和百度已投入许久,前者依靠平头哥造出了“含光 800”,后者推出了“昆仑”,覆盖训练和推理环节。就连一些靠算法起家的 AI 创业公司,也纷纷往产业链上游走,自己研发 AI 芯片。
AI 芯片的重要性已经被业界看到,而 AI 生产力平台依然缺少足够的聚光灯。
怎么样的平台,才能被称为AI 生产力平台?唐文斌是如此定义的:“算法研发和普通编程不同,是一个系统工程,需要能够协同优化数据、算法、算力的平台级产品,我们把它定义为三位一体的 AI 生产力平台。”
在他看来,旷视目前内部已经拥有了这样的平台,它诞生在 6 年前,叫做 Brain++。
Brain++ 由上述开源的天元发展而来。天元负责的是 AI 算法部分,它和 MegData(数据管理平台)以及 MegCompute(深度学习云计算平台 ),一起组成了一个 AI 生产力平台。
学术领域,旷视借助 Brain++ 在获得了 27 个世界级的人工智能竞赛冠军,其中包括 2017 年至 2019 年拿下 COCO 三连冠。COCO 是人工智能领域最具影响力的通用物体检测挑战赛,在计算机视觉领域享有很高声誉。
而在产业方面,旷视依靠 Brain++ 布局了个人物联网、城市物联网和供应链物联网三个领域,并且扎得足够深入。比如,在个人物联网领域,Face++ 已经是人脸识别领域的行业标杆。在供应链物联网领域,旷视的客户心怡科技,借助 Brain++,实现双 11 当天拆零出仓八万多箱货物,刷新了单仓机器人集群作业的行业记录。
小作坊和中央厨房
为什么数据、算法和算力三位一体,就可以被称之为 AI 生产力平台?AI 的发展,又为什么需要生产力平台作为基础设施?这要从 AI 算法的生产效率说起。
之前算法生产模式就像一个小作坊,它特点是一个大厨在里面要干所有的事,而且全手工操作,包括洗菜、配菜、调味。
对应到算法开发者,洗菜就是洗数据,配菜相当于选模型,后面的烹制、调味和装盘,相当于算法训练、调参数和部署。
整个过程费时费力,小作坊厨师一个中午也许只能为三桌客人提供菜品,而且炒出来的菜好不好吃,完全取决于大厨的厨艺造诣。
好厨师终归稀少,小作坊如果要做成连锁店,就需要雇佣大量优秀厨师,成本极大攀升。类似的,企业实现 AI+ 的共性难题,莫过于无法解决场景过小而技术升级投入过大之间的矛盾,因此 AI 解决方案难以落地。
而 AI 生产力平台好比一个中央厨房,厨师将拥有自动洗菜机、智能化炉灶和智能锅等套件工具,他一个人可以服务的桌数大大增加,而且味道有保证。
对应到 Brain++ 上,数据管理平台 MegData 就是自动洗菜机,计算平台 MegCompute 就是智能化炉灶,而刚刚开源的天元,就是一套集煎炒烹炸多功能为一体的智能锅。
在 TensorFlow 还没开源的 2014 年,旷视就开始着手研发深度学习框架天元。迭代到现在,天元这口“智能锅”已经覆盖了从训练到推理再到部署全流程,不仅自带菜谱(旷视自己的模型中心 ModelHub)还支持自定义菜谱(模型导入),并且配置了“动静合一”的显示屏。
所谓“动静合一”,即动态图和静态图兼容并包。“我们经常听说 TensorFlow 和 PyTorch 是两个极端:PyTorch 采取动态图,灵活方便好调试,适合学术科研;而 TensorFlow 采用静态图,利于部署,更适合工业界使用。”旷视副总裁谢忆楠说,“但是,产学研自古不分家,旷视想找到一个平衡点。”
因此,天元整合了动态图与静态图各自的优势,在充分利用动态图模型训练优势同时,通过动静态一键转换功能,以静态图的形式完成生产和部署。此外,天元还支持动静态的混合编程,灵活性更强。
借助天元,开发者不再需要重复造轮子。有了这个“智能锅”,AI 厨师可以把更多精力放在配菜(选模型)和调味(调参数)上,而无需过多关注底层细节。
值得一提的是,在天元之后,Brain++ 的 MegData 和 MegCompute 后续也会逐步开放给企业级用户。发布会上,旷视云服务业务资深副总裁赵立威向业界展示了 Brain++ 商业化的全景。“我们不仅将把深度学习框架开源使用,也将开放数据能力、算力能力给企业级种子用户,至少能够先让一部分企业实现 AI+。”
回到上文提到的一个难题:如果采用传统模式,小作坊要做成连锁店,就需要雇佣大量的优秀厨师,成本极大攀升。
采用中央厨房模式,小作坊能在成本可接受的情况下,开成连锁店。类似的,借助 AI 生产力平台,企业要实现 AI+,不再受制于场景过小而技术升级投入过大的矛盾。
在上述发布会里,旷视云服务业务资深副总裁赵立威举了一个例子:一家制造业领域的工厂,在配电产品质量检测中,会出现零部件颜色搭配错误、字符印刷残缺等情况,靠人工目检费时费力效率低,靠机器视觉方案就需要在数据、算法和算力投入大量的人力、物力,且模型效果难以维持。
旷视为客户提供基于 Brain++ 平台的智能质检解决方案后,工厂实现了模型的快速选型、优化和封装,极大地提升了质检效率和生产效率。
这个案例也正体现了数字化基础设施建设的本质——通过通用的底层技术,把物理世界在线化、数字化和智能化,以提高数字经济的生产效率。
“MegEngine 中文名为什么叫‘天元’?”这是很多业界人士的疑问。
旷视研究院高级技术总监田忠博说,“天元”在围棋中,是棋盘的正中心。旷视希望用这种方式,来表达出 MegEngine 是旷视技术战略大图最核心的 “布局”。同时也借“天元”之名指出,像 Brain++ 这样的 AI 生产力平台,作为基础设施对整个产业来说都是非常关键的点。
特别声明:本文为合作媒体授权DoNews专栏转载,文章版权归原作者及原出处所有。文章系作者个人观点,不代表DoNews专栏的立场,转载请联系原作者及原出处获取授权。
下一篇:红米K30Pro的对手究竟是谁?