华为云modelarts全体验人工智能的本质是赋能不是耗能

2018年曾被寄予厚望,被称作是“人工智能元年”。

我们都知道,一个年份一旦被称作“xx元年”,那么一定不是某一个单方面的力量作用的结果,而是一个大势所趋的必然方向。

就像是2018年对于人工智能来说,从技术井喷、认知倾斜、政策和产业扶持等方面,都展现出了具有强烈象征意味的风口,你可以说这是“众人拾柴火焰高”的结果,但无论如何,ai的确是这个时代,即将全面点燃每一个行业的烈火。

我之前曾经写文章聊过对ai的理解。

我始终认为,ai不是一个行业,而是一个工具,一种全新的理解世界的方法。

是向每一个行业进行赋能的放大器。

2018年在国内和国外发生了很多事情,有些初看起来和人工智能没什么关系,但本质上的驱动力的确来自于ai的入局。

比如亚马逊跨越市值万亿美元的门槛,成为继苹果公司后美国第二家市值破万亿的上市公司。万亿成就的达成,得益于aws云服务和围绕alexa打造智能生态圈。而背后缭绕的,全部都是人工智能的影子。

而在中国,2018年3月国家就明确提出了“要加强新一代人工智能的研发应用。大力发展智能产业,拓展智能生活,并且大力改造提升传统的产业”的方向,教育部还发布了《高等学校人工智能创新行动计划》,在这样的驱动力下,包括华为、阿里等在内的很多国内云计算厂商都陆续开启和高校在人工智能领域的战略投放合作。

即便不聊这些大事件,就算是在我们的生活的琐碎细节中,我们也很容易察觉到ai的“全面入侵”。

房间里的音箱可以和你对话;

扫地机器人出现在更多人们的家里;

手机里的ai拍照越来越智能;

越来越多朋友聊起的自动驾驶。

但是。

虽然说今年作为ai的元年,似乎整个世界都准备好了投身到一个全新的时代,但除了行业内的开发者们,又有多少人除了张口ai闭口人工智能之外,能够真正了解它多一点呢?

这种感觉有点像是去区块链。

去年我写了一篇关于人工智能的文章,在其中为了深入浅出解释ai究竟是什么,以及ai将会从哪种层面上改变人类的文明,我讲了著名的“吓尿理论”。

想象一下坐时间机器回到1750年,那个时代没有电,畅通通讯基本靠吼,交通主要靠动物拉着跑。你在那个时代邀请了一个叫老王的人到2018年来玩,顺便看看他对“未来”有什么感受。我们可能没有办法了解1750年的老王内心的感受——金属铁壳在宽敞的公路上飞驰,和太平洋另一头的人聊天,看几千公里外正在发生进行的体育比赛,观看一场发生于半个世纪前的演唱会,从口袋里掏出一个黑色长方形工具把眼前发生的事情记录下来,生成一个地图然后地图上有个蓝点告诉你现在的位置,一边看着地球另一边的人的脸一边聊天,以及其它各种各样的黑科技。

这时候的老王会是什么体验?惊讶、震惊、脑洞大开这些词都太温顺了,我觉得老王很可能直接被吓尿了。

以及这幅极具冲击力的图片。

后面的十月,我被邀请去上海世博参加了华为的全连接大会,目睹了包括modelarts在内的三块ai开发平台的发布。

更早一些时候,曾经流出过关于微软的中国区数据中心即将使用华为的ai芯片的消息,所以那几天在世博中心,我有一种强烈的直觉是:

未来在ai芯片领域,将会是华为和英伟达的“神仙打架”。

再接下来就是上周,在斯坦福大学发布了dawnbenchmark的最新成绩中,华为云modelarts排名世界第一,仅需10分28秒,比第二名提升近44%。

对于这个结果我要解释一下,为什么说在dawnbenchmark的深度学习测试中,训练时间变得这么重要。

近期biggan、nasnet、bert等模型的出现,预示着训练更好精度的模型需要更强大的计算资源。未来随着模型的增大、数据量的增加,深度学习训练的加速性能则成为了重中之重。

在衡量深度学习的加速性能时,主要通过两个指标来衡量,一个是吞吐量,即单位时间内处理的数据量;另一个是收敛时间,即达到一定的收敛精度所需的时间。

你们可以这么理解,吞吐量就像是你一口气能往嘴里塞多少干面包,而收敛时间则是你最终要花多久才能咽下去。

所以说,普通用户在使用ai开发平台时,最终关注的一定是收敛时间。

毕竟,吃到肚子里的面包,才算是真正的营养。

所以,出于对modelarts在保证收敛精度前提下实操性的深切的好奇心,我去了在国际会议中心的华为modelarts线下workshop。

我在9月份写过的文章里,曾经聊过我对普惠ai在“普惠性”上的看法,我认为,普惠并不是指单一的便宜,更多指的是在面对基础不同的用户群的时候,都可以弹性自如的满足各方的实际需求。

我记得我当时举了一个行业中的例子说,2017年的ai人才招聘缺口将达到500万,所以一个可以适配各类初级开发者的ai云平台,将会是承载着ai未来的“飞天魔毯”。

但即便如此,我也全然没有想到,当modelarts实操上手后,它的“普惠性”竟然可以达到人人可以上手的程度。

是的,你没有听错,是人人可以上手。

接下来,我将以一个“零基础”使用者的视角,来做一个粗略的modelarts体验。

进入modelarts开发平台界面后,会有弹窗提示,你可以查看其简易的操作流程。

刚才我说过,在这个时代真正可以面向每一个人的ai开发平台,应该做到收放自如的弹性,无论是面对高阶开发者,还是入门级开发者,甚至是完全和行业无关的门外汉,都可以满足其不同层级的需求。

比如这个自动学习的板块,虽然我已经离开通信行业5年了,早已经忘记了代码世界里的所有关隘,但即便你和我一样,也可以通过上传数据,并且进行指向性的标注,来完成定制化的模型训练。

当然,如果你是一个高阶开发者,modelarts也将提供给你更全套的生产力,同时modelarts继承了很多华为的优秀基因,极强的实用性体现在数据准备、训练、部署、上线的全流程里,实现了“上手快、训练快和上线快”的极致体验。

但由于我今天采用的是“零基础”和“无门槛”视角,所以我只展示“即便一个小学生都可以操作训练的模型”。

在自动学习版块,有图像分类、物体监测和预测分析三种训练模型。由于我今天写文章使用的是macbook,浏览器暂时不能支持某些页面功能,所以我先简单聊一下实操的体验感受。

以“图像分类”举例,比如说你想做一个花卉识别的训练模型,那么你需要上传一些花卉的数据样本,也就是你想要识别出的花卉的图片,比如向日葵、水仙、玫瑰等等。

接下来你要针对上传的数据样本进行标注,为你即将训练的模型建立规则,也就是告诉机器“这些图片中哪些是水仙,而哪些是玫瑰”。

完成这些步骤之后,modelarts将为你建立的模型进行训练,理论上你上传的数据样本越多,训练后的精度也就越高,目标识别也就越准确。

这种实操环节的易上手性,是绝大部分对ai并不了解的朋友想象不到的。

我时常和身边的人讲这样一个道理。

在每一个拥有标志性技术的时代里,技术真正向人们赋能的标志,不在于享有技术红利,而在于普通人对技术的驾驭。

比如说煤炭被开掘出来之后,人们不光要享受它带来的能源革命,同时每一个人都学会对煤炭的使用,才是技术真正接入时代的标志性意义。

而在ai全面降临的时代里,并不是说它无处不在就已经是足够极致的体现了,而是当每一个普通人都可以根据自己的需求,来完成ai的定制化需求的时候,这才是这个工具真正井喷的时刻。

我身边的很多创业者,本身并不是开发者,他们不懂代码,不懂神经网络,也不懂深度学习,但他们对人工智能有可能带来的提效降本有根本性的需求。像华为云的modelarts这样的ai发开平台,才能满足他们在专业技能有限的前提,依然可以定制化自我需求的可能性。

最后。

读书的时候学习写作,语文老师总会和我们讲白居易的故事,说他写好一首诗都要读给村口的老太太听,她能听得懂才算是一首好诗。

这其实讲的是文学上的雅俗共赏。

换回技术的语境中,我想说:

技术究竟是否需要“雅俗共赏”呢?

如果一项大众技术,人们对它的认知永远停留在望而生畏和云山雾罩,虽然看起来逼格满满,那么它一定不能为我们带来足够多的红利。

拿ai来说,对于我身边的绝大部分朋友来说,这都是一样“知其然而不知其所以然”的东西。

ai行业之外的人们,通常对ai没有一个清晰的认知。如果你和他们讲ai开发平台,他们会先入为主的认为这是一个异常艰难精深的领域。

而当我把试用modelarts的过程讲给他们听,他们的反应几乎全都是“还能有这样的操作”?

是的,的确可以有这样的操作。

最后的最后,我想说两句话。

ai作为一项时代技术,的确可以“雅俗共赏”。

ai作为一个全面到来的“全民工具”,一定是为我们赋能的,而不是耗能的。

以上。

虚拟教学

动作捕捉设备

虚拟教学