快捷搜索:  www.ymwears.cn  5G  as  5g55  电子  双链接  5g优化案例  5g优化

为什么说难实现AI的极致算法?依图带你领略大数据

数据、算法和计算能力被称为“人工智能的三要素”,如今,面对数据量大、算法策略失效、计算能力不足等新问题,以往的方法已不再适用,依图科技首席技术官、IEEE研究员严水成博士站在人工智能学者和行业实践者的角度,围绕“人工智能三要素”提出了解决当前新问题的见解,如果你想了解更多关于人工智能的知识,请来到新智慧苑爱的朋友圈与大人物们讨论,我是一个学者,也是一个行业的从业者,我想从这两个身份的角度和大家分享一下,这几年来“人工智能三要素”的发展给我们带来了哪些新的机遇。

依图AI的定位

作为依图的首席技术官,我想和大家分享一下依图 AI的定位,实际上,艺图从算法开始,逐步布局智能城市领域,后来,它将业务扩展到智能医疗领域,同时,基于计算能力的考虑,三年前就开始布局芯片,“quest”芯片发布后,我们根据图表完成了从AI软件提供商到AI基础设施提供商和AI解决方案提供商的升级,同时,我们在医药领域也有布局,我们希望通过人工智能技术加快癌症相关药物研发的效率,四年来,人们对“人工智能三要素”的关注方式发生了很大变化,过去只要是人工智能,这个行业就很乐意投资,2017年,行业应该督促人工智能落地,2018年,需要把人工智能的商业模式搞清楚,要使一个好的商业模式回归商业本质,核心是两点:一是要达到精准的极限,二是要达到速度的极限,为了达到精度的极限,由于数据和计算能力的限制,目前的峰值性能已经从学术界转移到了工业界,为了追求速度极限,关键是实现人工智能算法与人工智能芯片之间的相互优化,因此人工智能的研究重点已从训练侧转移到推理侧。

为什么说难实现AI的极致算法?依图带你领略大数据


超大数据环境下的算法策略失效问题

首先,从数据维度来看,大家都在谈论研究大数据,但事实并非如此,现在的数据研究已经分为三个不同的层次:小数据、大数据和超级数据,15年前,当我研究人脸识别时,样本中只有15个人,每个人都有一张照片,当时,我们提出了一些非常奇怪的算法,比如把图像看作一个矩阵来提高二维人脸识别的性能,但在大数据方面,所有这些都没有价值,同样,当我们从大数据转向超大数据时,我们需要处理城市级的应用场景,在这种情况下,我们需要考虑在面对大量数据时,最流行的深度学习策略是否有效?为此,我们做了一些公差实验,按照数据规模分为小、大、超大三个层次,我们采用目前常用的策略来改进深度学习训练,从而优化数据分布,使网络结构更大,更好地优化网络结构等,同时,我们清理数据,事实证明,面对非常大的数据,有些策略是有用的,而有些策略是无用的,例如,在大数据场景下,优化数据分布仍然有效,但在超大数据场景下,收入逐渐趋同,增加网络模型对小数据集的影响不太明显,当数据集很大时,其值越来越大,在小数据集上优化网络结构的效果很好,在超大数据业务场景中,它没有太大的价值。

为什么说难实现AI的极致算法?依图带你领略大数据


大数据的影响力和能力

同样,面对大数据,数据清理也变得毫无价值,另外,在小规模数据的情况下,大网络的价值很小,达不到推广的水平,而在超大规模数据的情况下,其优势非常明显,在数据优化策略方面,我们也在调整性别和种族的分布,大数据和超大数据都是非常有价值的,然而,在数据清理方面,常用的技巧对小数据集有效,但对大数据集没有明显效果,计算能力的变化趋势也很明显,平均来说,第一个版本的NAS每天只需要80多个GPU用于培训,而在Facebook上进行instagram研究则需要近7400个GPU,第一个版本的Bert需要256个TPU,面对如此巨大的计算能力需求,学术界开展有价值、有影响力的工作其实非常困难,因为没有这么大的GPU集群,计算能力远远落后,综上所述,我们可以发现,目前,如果我们追求精度极限,我们需要大的闭环数据集,包括大规模的GPU计算能力集群,这些都是学术界所缺乏的领域,但行业有很大的优势,同时,一些峰值性能好的算法和模型在业界尚未发表,学术界也不为人所知,因此,我们经常在一些学术论文中看到“刷单”的情况,事实上,今天开源数据集的价值远远低于Imagenet。

为什么说难实现AI的极致算法?依图带你领略大数据


数据的算法和数据量增长
目前,学术界所做的实验只能在大数据集上进行测试,事实上,在大数据实验中,大多数有效算法和技巧的“微创新”在大数据集中毫无价值,目前,人工智能领域每年发表学术论文6000余篇,很少有论文能够真正解决商业场景的实际问题,几乎可以忽略不计,为了促进整个生态环境的变化,提高高峰点的绩效,迫切需要学术界和产业界进行深入合作。为了追求速度的极限,人工智能算法和人工智能芯片需要相互优化,由于物联网的快速发展,产生的数据量将迅速增加,在计算速度和计算量急剧增加的情况下,尤其是在计算速度和数据量急剧增加的情况下,另一个维度是随着5g的发展,人们对低时延的期望值普遍提高,除了5g本身的低延迟外,另一个导致延迟的因素是AI算法,如果你想让用户真正体验到低延迟,你还应该在人工智能算法上下功夫。

为什么说难实现AI的极致算法?依图带你领略大数据

5G核心技术交流学习【扫码进群】【扫码回复】:‘ 5G群 ’

华为HCS5GRF工程师资格认证【扫码回复】:‘5G认证‘

咨询客服专员

参与 5G 热评:

    说点什么吧
    • 全部评论(0
      还没有评论,快来抢沙发吧!

您可能还会对下面的文章感兴趣: