10月21日消息 在第六届世界互联网大会AI论坛及5G论坛上,百度首席技术官王海峰表示,以深度学习为核心基础的新一代人工智能技术,已经具备很强的通用性,呈现出标准化、自动化和模块化特征,进入工业大生产阶段。
王海峰表示,驱动历次工业革命的核心技术都表现出很强的通用性。如今,第四次工业革命正在发生,人工智能技术趋向标准化、自动化和模块化,进入工业大生产的阶段。
据悉,从2010年开始,百度大脑就开始积累和布局AI基础能力,到如今百度大脑实现了AI算法、计算架构与应用场景的融合创新,成为“软硬一体的AI大生产平台”。目前,百度大脑已开放216项核心AI能力,日调用量突破1万亿次,开发者超过150万,企业用户发布模型超过16.9万个。
王海峰介绍,百度AI大生产平台在算力和数据的基础上,包括深度学习平台、通用AI能力、定制训练平台、多端部署,以及在此基础上形成的技术解决方案,和AI安全体系。
百度飞桨深度学习平台是百度大脑的基础技术底座。AI论坛上,王海峰全面介绍了飞桨平台的技术优势和平台功能。他表示,在智能时代,深度学习框架和平台向下对接硬件、芯片,芯片需要针对深度学习框架进行定制优化,从而达到软硬一体优化的更优效果;向上承接各种应用,起到承上启下的作用,是“智能时代的操作系统”。
在飞桨的基础底座上,百度大脑的语音、计算机视觉、语言与知识等核心技术不断创新突破。
在语音识别方面,百度大脑的流式多级截断注意力模型(SMLTA)使识别准确率提升15%-20%;风格迁移的语音合成技术,仅需20句话就可以制作一个人的专属声音。
百度大脑视觉理解技术在物体检测、人脸关键点识别、人脸活体等多个领域取得成绩。在3D和AR方面,已经实现人脸、手势、环境、肢体多维度的技术突破,可用于一体化人机交互和虚拟形象合成等创新应用。
语言与知识技术中,语义理解是重要的基础。百度大脑知识增强的语义理解框架ERNIE能够持续学习知识,提升效果,快速应用。ERNIE累计学习超过13亿的知识,ERNIE 2.0预训练模型在共计16个中英文任务上超越了BERT和XLNet,取得了SOTA效果。面向任务的理解与交互技术平台已经具备车载交互、地图导航、智能音箱等应用场景的6.8万定制技能,累计交互570亿次。
在机器翻译领域,百度大脑首创了语义单元驱动的上下文感知翻译模型,不仅可以实现端到端实时同声传译,准确率与人类翻译相当,还将时间延迟缩短至三秒。
以百度大脑为核心,以飞桨为基础,以百度智能云为载体,百度AI技术已经在各行各业应用。例如,基于遥感影像数据,研究高精度、高自动化的目标地物检测、土地覆盖和土地利用分类方法,可以辅助国家进行重大工程用地扩张与变化情况的监测工作,并对土地资源的利用进行有效管理与控制;基于视觉技术及深度学习算法构建的智能无土栽培解决方案,将原来农业专家的个人经验数字化、产品化,提升了作物产量,降低了人力成本。
在当天举办的5G论坛中,王海峰谈到5G为AI带来的新机遇:“AI和5G是相互赋能的关系,AI会让5G变得更加智能,更有用武之地,而5G更快速度、更大带宽的特点,也将让人工智能无处不在。”
王海峰认为,当前的人工智能技术不是孤立的,需要基于大数据,需要庞大的模型和很大的计算量,5G可以使云到边缘、到端的连接更近、更紧密,AI将更顺畅、更广泛的落地,AI与5G“双剑合璧”可以优化现有应用、催生更多可能性,推进智能化进程,服务于我们的生活。(完)