4月29日上午,在GMIC2016(全球移动互联网大会)上,百度开放云事业部总经理刘炀发表主题演讲“云上的大数据与人工智能”,介绍了百度大数据和人工智能方面的研究成果,指出大数据、人工智能的发展应用离不开云计算强有力的支持,而大数据和人工智能的进步也将拓展云计算应用的深度和广度, 同时刘炀表示未来将通过百度开放云把大数据和人工智能技术能力开放给行业和用户使用,推动相关技术的普及和应用,推动行业发展。
云计算、大数据、人工智能已成为科技和互联网行业发展的重点领域,作为技术驱动型的百度在这些领域的表现也是亮点频现。在美国麻省理工科技评论的2016年十大突破技术中,百度的语音接口技术上榜,成为唯一上榜的中国企业。刘炀介绍,借助百度的大数据和深度学习技术打造的深度语音识别系统,改变了传统的语音识别模式,使语音接口变得更为实用和有效,人们可以更方便的与身边的设备进行互动。而这只是百度在大数据、人工智能领域研究成果的一部分。
百度大数据广泛应用 人工智能成为技术核心
在大数据方面,刘炀表示百度大数据已突破技术积累期,广泛应用于百度外卖、百度地图、百度金融等复杂业务场景中。在百度外卖业务中,大数据的应用使百度外卖拥有业内效率最高的骑士调度。基于大数据,百度地图可以实现更准确的实时路况、拥堵预测、路径规划等功能,改善用户出行体验。在互联网金融领域,百度与国金证券联合推出国内首只大数据量化基金,通过大数据挖掘和智能化处理,实现描摹用户画像、精准识别网民金融意图、洞察股民情绪、预测行业市场走向等。
今年在世界互联网大会上受到习主席关注的百度无人驾驶汽车,本质上也是人工智能技术综合应用。无人驾驶汽车包含高精地图、语音识别、图像识别、规划行动、分析决策、智能推荐等技术。这些都需要人工智能的应用和支持。百度为研发无人车构建了世界上最大规模的深度学习网络,拥有万亿级的参数、千亿级的样本,目前规模仍在不断扩大。刘炀认为深度学习的突破将会引领人工智能下一个大的浪潮。
而这些大数据和人工智能发展应用的背后,是百度强大云计算能力的支撑。百度的深度语音识别系统每天语音识别和合成请求高达2.4亿次,需要上千台服务器,上千块GPU+FPGA;在精准营销方面,基于百度大数据的全网精准用户画像,需要上万台服务器集群,每天需要处理数十PB数据量,具有上千万标签,并可以达到85%以上的准确率。
所以刘炀在演讲中谈到,大数据和人工智能对于计算的需求远超想象。百度的首席科学家吴恩达也说过“深度学习这台火箭,燃料为大数据,而云计算则是引擎”。随着百度将人工智能提升到公司级战略定位,对于云计算的依赖和需求也将越来越多,百度也在不断加大对于底层云技术的建设和支持。从底层的数据中心到计算、存储、网络和分布式系统,百度均位于行业前列。
开放云夯实底层黑科技 大数据、人工智能对外开放
在数据中心领域,百度自建数据中心并支持模块化建设,大大提高了设计、实施速度。同时重视绿色节能,数据中心使用离线高压直流电,做到99.5%的利用率,冷却也实现自然冷链的工作。电源使用效率(PUE)达到1.22,位居国内第一,并连续两年获得中国数据中心协会的最佳能源节能奖。
在计算领域,百度拥有国内规模最大深度学习异构计算集群,同时也是整机柜方案的领导者,并联合腾讯、阿里以及电信运营商等一起推动整机柜的解决方案。在存储领域使用高密度的存储,对于98%的磁盘故障可以事先报警,50%以上的磁盘故障可以自动修复,保障存储安全。在网络领域百度自研交换机,全部支持万兆的网络接入,数据中心内网支持TB级的跨IDC的数据。
硬件层的规模和技术基础之外,百度在分布式系统等软件层的调度也处于业内领先水平。刘炀指出,百度以网络搜索业务起家,天生是一个大数据公司,承载数十款用户量过亿的产品和超百万企业客户,具有丰厚的技术积累和经验。百度拥有Hadoop单集群1.5万台,并通过在/离线业务混合部署,全部数据中心的CPU利用率可以做到50%以上,远超业界同类水平。为了支持百度开放云、百度网盘和网页搜索等产品,百度支持EB级别的对象存储和EB级别的结构化存储。
最后,刘炀表示只有做好云计算基础领域环节的工作,才能更好的支持人工智能、大数据等上层应用的发展需求。同时百度也将通过百度开放云释放技术的力量,将人工智能、大数据以及其他优秀的解决方案开放给用户和整个行业,开拓大家的想象力并帮助大家实现梦想,推动行业和社会的发展进步。