不懂AI的我,是如何搞开发的?

来源:量子位2020-10-14 13:25:14

高达86%,这就是目前市场对「定制开发AI模型」需求的占比。

但在这个过程中,企业用户和开发者往往存在着以下诸多问题:

缺少模型训练经验 数据采集和标注成本较高 模型适配与部署流程非常繁琐 模型优化迭代周期长

那么,是否存在一种工具,能够「一站式解决」上述问题呢?

百度EasyDL了解一下。

简单来说,EasyDL极大降低了深度学习的应用门槛:

把AI开发这件事情,搞得像使用「家用电器」一样简单。 而且训练产出的AI模型质量,如同高级工程师产出的一样专业。

但其实,百度早在2017年底便推出了EasyDL,2018年初正式开放,与此同时提出了一个愿景——Everyone can AI。

那么时隔近三年,这一愿景走到了哪一步呢?

像用家电一样的AI,能有多靠谱?

先来整体看下EasyDL所具有的三大特点:

极简的交互和使用流程,最快15分钟即可完成模型训练; 高精度的训练效果,比如图像分类模型的线上平均准确率在99%以上; 部署方式丰富,全面支持云、端、边部署。 不懂AI的我,是如何搞开发的?

首先是EasyDL的易用性、低门槛。

使用流程只有简单的四步,分别是「创建模型」、「准备数据」、「训练模型」和「部署应用」。

并且,在整个过程当中,都是可视化图形操作,这就大大降低了企业、开发人员的使用门槛。

用百度AI平台研发部技术总监忻舟的话来说就是:

不用一行代码也可以基于需求和数据,定制自己的AI解决方案。

在工业制造的生产质检领域,以「爱包花饰」为例,在监测箱包生产过程中的残留异物(针、金属零部件等)时,使用EasyDL训练箱包质检模型,在完全无需了解AI算法细节前提下,也训练出了准确率90%的模型。

再以「瀚才猎头」为例,几名人力资源专家在不了解AI算法的情况下,使用EasyDL,完成了简历数据的结构化处理和自动分类模型,大大提升了工作人员在简历检索方面的效率。

但简单,并不意味着会忽略掉专业性。相反,二者是「兼容且并行」。

依旧是「瀚才猎头」的案例,作为一家高级管理人员代理招募机构,其储备了200万条不同行业的企业和人才信息。

但一个非常「致命」的问题就是:200万条数据因简历检索的低下,使人才库的利用率不足10%。

而在使用EasyDL之后训练多个模型推进简历数据的结构化处理,仅在「候选人职能」和「候选人职级」两个模型上的识别率便达到了95%以上。

而以关键词搜索的任务中,瀚才猎头以往每天只能找到60-70份合适的简历。但现如今,20分钟就可能达到600-1000份,而且精准度达到了95%。

一言蔽之,百度EasyDL不仅让企业在「定制AI模型」上,使用起来像家用电器一般简单,并且还能像高级AI工程师一样专业。

除此之外,EasyDL还支持公有云API、私有服务器部署、设备端SDK、软硬一体方案等丰富的模型部署方式。

例如在软硬一体方案部署上,EasyDL提供了6款软硬一体方案,支持专项适配与加速,覆盖高中低全矩阵,模型识别速度可提升10倍。

不仅丰富,还非常快——最快仅5分钟即可集成。

而EasyDL这一切的优异特性,离不开其背后的技术硬实力。

EasyDL的能力是如何实现的?

表面上看起来、用起来越是简单的工具、平台,那它背后的设计可能越是复杂。

百度EasyDL也是如此。

平台内部采用了诸多复杂的深度学习算法和工程技术,而这一切,都是为了保证其简单、易用、低门槛的使用效果。

EasyDL之所以能够在模型方面达到高精度,一个重要原因是其基于百度自主研发的深度学习平台飞桨。一站式模型训练和服务体验,则融入了更多百度长期积累的独有技术和工程化能力。

首先,EasyDL预置了百度超大规模数据训练的预训练模型。

在视觉任务中,图像分类训练任务内置百度基于海量互联网数据,包括10万+分类、6500万图片等训练的超大规模视觉预训练模型,平均精度可提升3.24%-7.73%。

在物体检测训练任务方面,内置百度基于800+标签、170万图片,1000万+检测框训练的超大规模物体检测预训练模型,平均精度可提升1.78%-4.53%。

在自然语言处理方面,EasyDL预置了由百度自研、业界效果最好的预训练模型文心(ERNIE),将机器语义理解水平提升到一个新的高度。

EasyDL还提供了自动数据增强、自动超参搜索等AutoML/DL自动化建模机制,对零算法基础的用户降低AI使用门槛。

而且基于飞桨DGC加速机制,通过只传送重要梯度(稀疏更新)的方式来减少通信带宽使用,从而让EasyDL提升了分布式训练效率,相比传统分布式训练方式,有70%以上的训练速度增益。

其次,在数据处理方面,EasyDL建设了EasyData智能数据服务平台。

在数据标注和数据清洗,EasyData提供了11种数据标注模板,5种标准、高级的清洗方案。

EasyData还提供了软硬一体、端云协同的自动数据采集方案,可以在数据采集时,免除繁琐耗时的设备选型、调试和集成开发工作。

最后,在部署部署方面,EasyDL提供了公有云API、设备端SDK、本地服务器部署、软硬一体部署四种方案。

其中,公有云API可以支持弹性扩缩容;设备端SDK目前EasyDL提供了端模型适配服务,支持了15+芯片类型,4大常用操作系统。

而这些,正是EasyDL强大能力的背后硬实力。

Why EasyDL?

因为有需求,这就是问题的答案。

人工智能引领的第四次工业革命正不断地渗透到各行各业,大企业往往具备了一定的人才储备、技术积累。

但相比之下,中小企业在智能转型的过程中,往往处于碰壁的状态,智能化门槛过高,包括高级开发人员成本、技术能力等等。

而中小企业在整个国民经济的发展过程中,却起着举足轻重的作用。

因此,解决这样的问题,便成为了一种「刚需」。

也正是因为这样,EasyDL一经开放,便得到了中小企业的广泛认可和支持。

而在2年多的时间里,EasyDL也一直在持续升级和打磨,使整体的产品体验和功能更加完善。

这也是让EasyDL与其它AutoDL平台相比,具有较为突出的优势,能够获得更好的效果。

不仅如此,EasyDL的更新迭代还在继续。

例如,今年升级的最大亮点,就是五月份全新发布了EasyData智能数据服务平台。

专注在AI开发场景在业内开放了提供一站式的数据采集、数据清洗、数据标注、数据回流的完整解决方案。

内置的超大规模预训练模型也是今年核心的技术亮点升级之一,为提供更高精度的训练效果。

而就在刚刚过去的9月,我们看到EasyDL又进行了一轮大幅升级。

在EasyDL经典版NLP方向新增了定制情感倾向分析、文本分类多标签、文本实体抽取;全新推出表格数据预测分析的ML方向,进一步丰富了模型类型。

数据服务上在已有的智能标注基础上重磅推出多人标注,让数据标注的效率进一步大幅提升。

全新上线模型市场,支持个人或企业将EasyDL经典版训练好的模型发布至市场进行售卖,并在业内首个创新性支持从市场已购买的模型结合数据进行再训练,实现更佳的模型效果。

未来,EasyDL还将继续发力:

除了扩展已有的 CV、NLP、ML、语音识别方向算法类型,还将推出OCR、视频追踪等定制化能力。 持续提升模型效果,提高训练速度,加速模型推理。 在数据、模型、服务等各个方面,持续降低使用门槛。

至此,可以说百度EasyDL离最初的「Everyone can AI」的愿景更加近了一步。

 

责任编辑:云计算观察员

标签: 人工智能

相关文章

要闻

原创

最新

取消