长期主义者旷视：开源人工智能算法框架，能为中国带来什么？

新冠肺炎的影响是前所未有、空前巨大，但同时也带来了一次前所未有、空前巨大的全社会转型时刻。

以前很多业务都要去门店、银行、学校、医院……但是疫情之下，我们被迫快速适应了许多新的生活方式。

汪丁丁（著名经济学家、北京大学国家发展研究院经济学教授）教授说，人类社会必须找到经济活动的新模式。

以前用不好手机软件的父母，现在每天流畅的在生鲜电商上下单买菜；人们出门戴口罩成为习惯，进地铁接受智能测温也成为习惯；直播电商/线上办公/线上办学再临风口，“妈妈守着李佳琦，孩子守着钉钉群”。

很多人都觉得，这些新功能/新服务像早就准备好了一样，不像是应对疫情匆匆上马的项目。

是的，你想的没错。其实我们国家已经持续建设多年5G、大数据、人工智能、工业互联网和物联网五大类数字基础设施。这次疫情，是将很多本来就很厉害的技术，加速进入到我们的生活中。

最近，发展这些数字基础设施有了一个统一的名字——“新基建”。

一、“新基建”时代，提升“AI大脑”却成了老大难

这场新基建声势浩大。

抛开电力、交通和新能源垂类的基建领域，最核心的就是万物互联的新一代信息技术：5G、大数据中心、人工智能、工业互联网和物联网为代表的“新基建”，将在未来20年支撑经济发展。

而且“新基建五兄弟”之间，联系是非常紧密的，你中有我，我中有你。

人工智能是大脑，负责思考；大数据是大脑中储存的知识，负责提供经验；5G是神经网络，负责高速传达大脑指令；工业互联网/物联网是四肢，负责执行大脑的命令。

“新基建五兄弟”之间，是一个看起来特别完美的协作关系，只是人工智能稍稍高出其他四兄弟，作为大脑起到统领整个“新基建”的作用。

此前我们也发文介绍过人工智能在疫情期间成为了人类看不见的“盟友”，通过大数据的分析与智能的预测，加拿大的人工智能监测平台BlueDot在2019年12月31日就曾向人类发出警告。

在之后的全球抗疫战之中，我们也看到了人工智能不仅预测方面的能力，更多的是在公共场所的防控能力，还有在医疗诊断方面的能力和效率要远超过人类。

人工智能已经在潜移默化地改变着我们的生产、生活。除了在疫情期间的特殊作用，从长期来讲，还有更多的行业和场景需要变革。不论是“新基建五兄弟”中的工业互联网/物联网，还是各种传统产业，还是你手机中的人脸解锁/AI美颜，都有赖于人工智能为其提供大脑支持。

然而，这里边却有一个“老大难”的问题：场景和新问题总是涌现，因此就需要算法不断革新，场景对定制化算法的需求是无限的。然而算法的生产效率却因数据、算法和算力的制约而无法破解。

算法的生产有赖于深度学习框架。但是深度学习研究的门槛较高，中国AI开发者面临基础薄弱、学习资源较少和开发工具不系统等问题。掌握深度学习和算法开发技术的中国企业也是屈指可数。

一来一去，人工智能产业出现了严重的供需不平衡。

二、深度学习框架开源，旷视按下产业加速键

旷视科技，就是中国人工智能产业中少之又少的精英玩家。2015年，马云在德国汉诺威首秀的支付宝刷脸支付，其背后的技术支撑就是旷视。

为了解决企业自身的业务拓展需求，旷视2014年开始自己构建了一套AI生产力平台，叫做Brain++。包括深度学习框架（旷视天元MegEngine）、深度学习云计算平台（MegCompute）以及数据管理平台（MegData）的能力，将算法、算力和数据能力集为一体。

为了解释这三者的关系，旷视做了一个形象的类比。“我们把做算法比作炒菜的话，数据其实就像是食材，是炒菜的原材料；算法的里面需要有个框架承载计算，就像炒菜的锅一样；大火还是小火，就是我们的算力大小。”

旷视很早就在思考AI产业供需不平衡的问题。供需问题的本质，是AI算法训练的不可复制性。早期AI公司在服务客户时，每个客户的业务需求不同，对算法训练的需求也就不同，每接触一个新客户，就要搭一套新框架。

还是拿厨房做类比，以前算法的开发模式像一个小作坊，它的特点是厨师需要自己清洗菜（数据清洗）、配菜（搭模型）、炒菜（训模型）、调火候和口味（调参数）。通过这种小作坊模式，可能一个厨师（开发者）可能支持有限的客人的需求，费时又费力。

但以类似旷视这样的“AI生产力平台”为例，如何解决刚刚提到的问题呢？

在现代化、自动化的中央厨房里工作的大厨（开发者），他将拥有标准化、流水线管理的配菜间（数据管理中心）和智能化的炉灶（计算平台）和厨具（深度学习框架）等配套设施（开发环境），这样，他不仅能大幅提高菜品的供应效率，还有了研发和创新的空间和时间。

但是，也不是所有企业都有能力建设自己的中央厨房（深度学习框架等AI基础设施），因为研发成本非常高。当一家企业有自己的业务之后，如果建了一个AI研究院，这个企业可能赚不到钱。目前传统产业无法快速融入AI的最重要的原因是深度学习和算法开发成本过高。

旷视Brain++“AI生产力平台”通过过去6年的科研创新和业务创新、技术积累和产业实践，已经具备了一套能够批量生产算法的深度学习框架，在诸多智慧城市的落地中证明这个框架具备支持工业级研究院的规模化算法研发能力。

为了能够让更多传统产业的开发者和高校师生能够获得这样的AI生产力，旷视决定开源其AI生产力平台Brain++的核心组件：深度学习框架天元（MegEngine）。

三、开源信心何在：开发者训得好、训得动、训得快

开源的意义何在？很多人可能不知道。

过去几年，美国企业扎堆开源（即开放，也就是任何人都可以得到软件的源代码），大部分人在各种开源代码上进行技术开发，正因为有Linux这样开源的自由操作系统，才有了安卓系统，也才有了国内小米、华为的崛起。

旷视为什么有信心开源呢？

主要是在已经实现开源的深度学习框架中，旷视是唯一一家以AI为本业企业。开源之前，旷视有1400多名研发人员，全员使用旷视天元作为算法开发的引擎，截至目前，旷视的自研算法模型已经有上百种，部署的硬件中台有数十款，覆盖的行业也有10+个。

多年以来旷视都是通过天元去解决各种商业场景中的各种问题，可谓是身经百战。

天元项目负责人兼旷视研究院高级技术总监田忠博说，这次开源的天元是一套训练推理一体化、动静态合一的工业级深度学习框架，采用训练与推理在同一个框架、同一个体系内完整支持的设计，让开发者真正体验到“训得好”、“训得动”、“训得快”。

而且在旷视经年累月的打磨下，一些研发过程中的痛点，也在天元中被很好的解决。

旷视首席科学家、研究院院长孙剑亲切的将天元比做他们的“孩子”，他认为这个“孩子”的三大特色优点：

优点一，框架与算法的协同。当前计算平台差异非常大，很难只设计一种网络，能够满足所有的需求。旷视以天元框架成为中间桥梁，根据不同设备的计算特性，协同设计网络结构和框架算子，从而获得最好的性能。而ShuffleNet就是协同设计的成果，最近几年的在端上运行非常高效的一个神经网络的设计，效果优异。

优点二，高效训练系统。在COCO物体检测和识别挑战赛上，旷视取得了2017年、2018年、2019三连冠的佳绩。其中一个非常关键的优势，就是旷视天元这样一个训得快的系统。从第一次从框架上引入Synced BN技术，它能支持非常大的Mini-Batch训练，以至于旷视可以非常高速的训练一个系统。

优点三，大规模能力。孙剑表示这与旷视数据大规模有关，并发布了最新版的Objects365V2版本。这是世界上最大或者更大的物体检测数据集，这个数据集有365种常见物体，超过200万张图象，超过2800万个人工标志的框。

四、坚持长期主义，眼光要放50年那么长

技术有点难懂？我们不妨来看看旷视的成绩。

2017-2019年间，依托旷视Brain++大规模分布式训练能力，以及业界领先的分布式计算技术训练出的超大规模深度学习模型，旷视累计斩获 27项全球 AI竞赛冠军。

同时，旷视还开发出大量部署于云端、移动端、边缘端全计算平台的先进深度神经网络，为旷视的个人物联网、城市物联网、供应链物联网三大垂直场景提供了有力的支撑。

而疫情期间，旷视更是创造了10天上线AI测温系统的“奇迹速度”。旷视考虑到，公共场所人流量大，传统手检测温速度慢，且测温人员要和被测人员频繁接触。

所以旷视提出了“人体识别+人像识别+红外/可见光双传感”的解决方案，能够在各类公共场所等高密度人员流动场景下，实现大于3米的非接触远距离测温。

要知道，测体温场景中的AI算法需要做很多生理性的测试，从腋下的温度测试到额温中间的差异值，到底是不是可以通过黑体去调校……

尤其是在地铁站、火车站，每个进站口、出站口每个通道日均通行2000人，大密度、高流动等外部物理世界对于算法的一些影响，都要考量进去。

然而春节期间，旷视通过Brain++高效的算法研发能力，用不到10天的时间完成了AI测温系统的开发和上线，其中算法开发只用了不到两天时间，抢在社会大规模复工之前上线了AI测温系统。

旷视选择将自己的“大脑”开放给整个中国AI产业使用。这样一来，无论是高校研究人员，还是传统企业技术人员，只要是有志于学习 AI、用 AI改变世界的开发者，都可以更加简单高效地用 AI去创造，实现AI+产业降本增效释放生产力。

另一方面，框架代码开源意味着接受群众检验的同时，也能够激发出更多的技术贡献者让它变得更好用。

旷视研究院的墙上挂着一幅字：“持续创新拓展认知边界，非凡科技成就产品价值。”旷视首席科学家、旷视研究院院长孙剑表示，这是旷视研究院的使命。意思就是说做AI研究既要仰望星空，更要脚踏实地。

旷视内部还有个词汇，叫做“长期主义”，这次开源的旷视显然是将眼光放到了20-50年的长期角度，从行业基础设施的角度，去思考企业、行业与国家社会的共同命运的战略决策。同样，新基建也是中央站在国家发展的更大视角，开展的“长期主义”战略。

有了人人可用的深度学习框架，和AI生产力平台这样类似AI水电站级别的设施，未来，人工智能才有可能像“自来水”一样无处不在，且即开即用。各产业技术、产品、平台的高度协同，才能更好发展行业，推动整个社会生产方式的改进和生产力的发展。

这篇有关于 长期主义者旷视：开源人工智能算法框架，能为中国带来什么？ 的文章，就为您介绍到这里，希望它对您有帮助。如果您喜欢这篇文章，请分享给您的好友。

分享到：新浪微博 QQ空间腾讯微博人人网网易微博天涯社区豆瓣网