8月1日消息 在第四期百度大脑开放日上,百度AI技术生态部高级产品经理娄双双宣布,百度大脑在6-7月新开放与升级的产品能力共22项,包含新能力开放、开发平台的全新升级、以及新硬件的发布等。
在视觉方向,人体分析与车辆识别方向有3项新能力开放包括:手部关键点识别、危险行为识别、车辆分割;3款产品能力升级包括:人体关键点识别、人流量统计、驾驶行为分析。
OCR方向,车牌、表格文字、通用文字(高精度/高精度含位置版)以及行驶证5款产品识别召回率均有不同程度的提升。同时人脸离线识别SDK升级至3.0版本,活体检测与通行全流程耗时低于300ms;人脸识别私有化部署包适配了最新的RTX系列2080显卡,并进一步提升模型性能。
EasyDL定制化模型训练与服务平台在数据标注、模型、服务部署三方面再度更新。在AI模型开发过程中,数据标注往往占据了一半以上的时间和金钱成本,而此次全新推出的智能标注,可节约70%的数据标注成本。例如在开发一个物体检测模型时,以5000张图片样本为例,在启动智能标注后,人工标注约30%的图片,剩余70%的图片机器自动完成标注,也就是说人工仅需标注1500张图片,相当于单模型可节约3000~40000元标注的成本。同时,EasyDL物体检测模型也迎来了进一步的升级,云服务时延和端SDK精度均有大幅提升。
AI模型在端上的落地应用往往伴随着复杂的硬件选型、软硬件适配,耗时耗力。为此,百度大脑本次推出了三款全新的硬件方案:EdgeBoard边缘AI计算盒、EasyDL开发套件(十目)、EdgeBoard全目标抓拍机,为终端应用场景提供最佳实践。EdgeBoard边缘AI计算盒,适用于多路视频、多模型、实时性要求高的本地计算场景,可灵活加载开发者自定义的模型,并联合EasyDL推出了软硬一体方案——EasyDL边缘AI计算盒(EdgeBoard),预置EasyDL专用SDK。
EasyDL开发套件(十目)适用于小型终端设备、单模型实时处理场景;EdgeBoard多目标抓拍机实测可达55FPS,可灵活搭载视觉模型应用于安防监控、工业质检、气象监控等场景。目前,三款产品方案均已在百度AI市场上线。同时,EdgeBoard高性能计算卡本次活动上也面向开发者推出了直减1000元的活动,在边缘高性能计算场景为开发者提供更优惠的价格探索应用。
语音自训练平台在原有搜索模型、输入法模型的基础上,本次进一步支持了呼叫中心语音识别模型的自训练,支持智能客服场景实时语音识别和音频文件转写场景应用。智能创作平台也升级至2.0版本。
在深度学习平台方面,源于产业实践的开源深度学习平台飞桨(PaddlePaddle)此次主要升级的内容包括:核心框架Paddle Fluid v1.5版本发布,PaddleNLP,PaddleCV,发布动态图,训练性能优化;工具组件PaddleHub新增29个预训练模型、发布图学习框架PGL Preview版。
其中,PaddleNLP作为百度大脑工业级NLP开源工具与预训练模型集,具备了中文词法分析、文本情感分类等10项NLP应用任务,并且网络可灵活调整,场景也可高效迁移,具备语义表示模型,可实现工业级的灵活应用。
AI Studio是基于飞桨(PaddlePaddle)的深度学习在线实训与教育平台,面向个人开发者提供在线编程环境、免费GPU算力、海量开源算法和开放数据,帮助开发者快速创建和部署模型,同时提供比赛环境。AI Studio全新功能升级包括:上线图形化编程,可用图形拖拽方式构建模型训练过程,并生成可执行代码方便学习和调整;NoteBook在运行监控等方面也进行了体验升级;在算力方面,GPU下配套环境的CPU升至8核,内存升至32GB。
为了帮助开发者更好地上手和应用深度学习技术, 百度大脑AI Studio亿元算力支持计划也在进一步扩容, 增加更多的计算资源。不论是一人一卡模式,还是远程集群模式,都将为开发者们提供大量的免费算力资源。同时,每年举办10余场赛事的百度AI Studio人工智能竞赛也在火热招募中,总奖金超百万元。
在此次百度大脑开放日上,百度自然语言处理部副总监忻舟为参会的开发者们详解了有关百度大脑NLP技术以及应用实践。
据忻舟介绍,作为百度大脑开放AI能力的重要组成部分,百度大脑语言与知识技术拥有最大的多元语义知识图谱以及最好的中文语义表示模型,目前可提供30+项技术工具,囊括了文本审核、机器翻译、语言生成等多项能力,服务方式多样、灵活、可定制,含有多套场景技术方案。
现场,忻舟还演示了可持续学习语义理解框架ERNIE 2.0和基于此框架的ERNIE 2.0预训练模型。ERNIE2.0可通过建模海量数据中的词、实体及实体关系,学习真实世界的语义知识,目前累计学习超过10亿条知识,已在百度众多产品应用中显现效果。根据测试对比,ERNIE2.0在16个中英文任务上表现优于BERT和XLNet。
另据介绍,此次推出的智能创作平台2.0版本,集合百度的自然语言处理、知识图谱以及大数据技术,可实现自动创作、辅助创作等功能。
具体而言,智能创作平台2.0在创作前,能够提供实时领域热点、地域热点信息,同时对TOP热点事件提供Topic实时热度分析;创作中,能够预置素材数据,提供多模素材推荐,同时进行实时智能纠错;创作后,能够自动审校、自动标签分类,生成自动摘要,提供用词润色建议及多模发布功能。整个创作过程可节约大概80%的时间。(完)