恒达娱乐 > SEO算法 > 斩获23项冠军日均调用破万亿!百度交出年度AI成绩单:语音语言领衔技

斩获23项冠军日均调用破万亿!百度交出年度AI成绩单:语音语言领衔技

admin SEO算法 2020年02月12日

  原标题:斩获23项冠军,日均调用破万亿!百度交出年度AI成绩单:语音语言领衔技术突破,国产自研成大趋势

  这也体现出了AI当前发展阶段——技术仍旧占据核心,但落地以及产业应用正在被放到更加重要的位置。

  语音合成方面,针对风格迁移、音色模拟和情感拟人的三大领域内挑战,百度推出语音合成技术 Meitron ,仅需20句话就可以制作一个人的专属声音。

  此外,作为认知智能的“奥林匹克”,自然语言处理技术(NLP)的进展在今年最为夺目,全球亮点频出。

  代表中国“参赛”的百度,交出了可持续学习的知识增强语义理解框架ERNIE(艾尼),在16 个中英文任务上超越BERT、XLNET,取得SOTA 。

  2019年12月,ERNIE在GLUE上登顶第一,并以9个任务平均得分首次突破90大关,刷新榜单历史,超越微软、谷歌提出的一众国际顶级预训练模型。

  基于语音和语言方面的突破,百度还提出了基于深度注意网络的多轮响应选择匹配模型——DAM,口语理解能力被大幅提升。

  值得一提的是,虽然全球范围内视觉为核心的感知智能已经迈步广泛落地应用期,但在2019年,百度还是秀出了“百尺竿头更进一步”的基础研发实力。

  百度还在CVPR 2019豪夺10项冠军,包括OCR、物体检测、视频理解、目标跟踪等图像与视频技术领域。

  2019年12月,基于百度自主研发的中国首款云端全功能AI芯片“昆仑”的云服务器正式上线万亿次定数的AI运算,提供512GB/s的内存带宽。

  量产了专为远场语音交互打造的百度鸿鹄芯片,100mW 左右平均工作功耗,即可支持远场语音交互核心的阵列信号处理和语音唤醒能力等等。

  而且,百度的算力发展并不仅仅只是单点发展,也已经与算法、飞桨框架连点成线,并交织成了坚实的基础层,形成了协同效应。

  通过芯片、连接、系统和调度的协同设计和技术创新,对AI计算架构进行升级,可以提供百万TOPS的强大算力。

  正在建造的计算集群,基于百度飞桨研发的AI控制系统,设计年均PUE1.15,基础设施能耗降低70%,每个可用区每年节电超过2亿度,相当于10万户居民一年的用电量。

  研发出国际领先、国内第一的云上量子脉冲系统“量脉”,可将量子计算软件指令(逻辑门)转换成控制量子硬件的脉冲序列,算法性能较同类工具实现成倍的提升,是实现量子软硬件连接的关键桥梁。

  在小度助手5.0上,成熟应用了全双工免唤醒能力,实现了“一次唤醒,多轮交互”免唤醒词连续对话,这也是全球领先的技术落地。

  援引第三方机构数据,第二季度小度系列智能音箱出货量位居全球第二、国内第一,同比增长率高达3700%。

  而且技术突破和落地,也进一步打破产品旧边界。作为“音箱”被归类的AI交互硬件,在小度系狂飙突进下,开始真正展现AI时代交互终端的样子——AI音箱不再是音箱。

  在业内“华山论剑”顶会CVPR 2019,百度Apollo公开了国内唯一的纯视觉L4级自动驾驶解决方案——Apollo Lite,能够支持对10路摄像头、200帧/秒数据量的并行处理,单视觉链路最高丢帧率能够控制在5‰以下,实现全方位360°实时环境感知,前向障碍物的稳定检测视距达到240米。

  相比旋转式激光雷达感知方案,视觉感知方案价格低廉且便于获得。并以计算机视觉和AR技术研发了一种增强现实的自动驾驶仿真系统(AADS),使用激光雷达(LiDAR)和相机扫描街景。

  百度与央视合作打造AI虚拟主持人小灵,亮相央视2019五四晚会;与澎湃新闻合作打造了第一个真人形象的虚拟主播早晚新闻栏目;与浦发银行合作打造了业内首个“金融数字人”。

  通过对视频的视觉、语音、文本的多模态知识解析,在多元异构知识图谱上建立关联,并通过计算推理,建立对视频的深度语义理解,大幅度提升视频理解效果。

  利用3D视觉技术,可以对茶杯的位置进行检测和追踪。通过机器人运动规划和控制,可以对工作空间进行碰撞检测,避开障碍物。完成实时规划运动后,可自动生成倒茶轨迹。语音语义联动技术解析,更是让机器人像“人”一般,听得懂,说得好,做得准。

  最后,有技术、有落地应用之外,百度更宏大的雄心也徐徐展露——基于技术与应用优势,百度希望更进一步:打造平台,打造生态,成为AI世界的底座。

  百度大脑开放平台已经在语音、视觉、语言等方面实现全面升级,具备深度学习框架、场景化AI能力、定制化训练平台到软硬一体模组和解决方案等。

  自2016年以来,百度已开放228项AI能力,开发者数量超过150万,日均调用量突破1万亿次,语音、人脸、NLP、OCR调用量中国第一,是业内最全面、最领先、服务规模最大的AI开放平台。

  援引IDC最新报告,百度飞桨与谷歌、Facebook名列前三,领衔中国深度学习平台市场,也是市场份额前五中唯一的国货。

  Apollo自动驾驶开放平台已经汇聚了全球156家生态合作伙伴;在全球,有97个国家超过3.6万名开发者使用Apollo开源代码,开源代码数量超过65万,已成为全球最强大、最开放、最活跃的自动驾驶平台。

  而且开放能力进一步打破边界,在刚召开的首届Apollo生态大会上,百度Apollo拓展裂变成三大平台:自动驾驶开放平台、车路协同开放平台,智能车联开放平台,成为中国自动驾驶基建国家队代表。

  小度技能开放平台上,技能开发者数量已经超过3.7万人,可提供包括游戏、效率工具、网络电台、直播、儿童教育、智能家居等3500多种技能支持。合作伙伴数量已经超过500家,可以控制的IoT智能家居设备已经超过了7000万。

  此外,百度还开源了中国首个边缘计算框架BAETYL、自研底层区块链技术,并发布了多个工业级的领域数据集,如大规模自动驾驶数据集、街景图像数据和文字场景数据集、视频精彩片段、场景解析、机器阅读理解、中文句子及相应的开放域信息提取事实数据集等等,来促进算法研究,推动AI发展。

  正如百度董事长兼CEO李彦宏所说:“作为一家平台级企业,成就他人、造福社会,这是百度创始初心与能力之所在,更是百度在行业发展关键时刻责无旁贷之所在!”

  正是基于如此,百度才能够通过百度智能云的“云+AI”能力,为各行各业大规模输送百度的AI技术成果与平台能力,成效也非常显著。

  根据IDC在11月底发布的中国AI云服务市场报告,百度智能云在AI技术、市场和商业上处于中国领先地位,超过了阿里云、AWS等一众厂商。

  百度CTO王海峰感慨,百度在2019年提出“人工智能进入工业大生产阶段”,如今他们已经探索了AI进入“工业大生产”的真实路径,推动AI迈入自动化、标准化和模块化的新阶段,并与百度业务以及各行各业的生产实践深入结合,加速产业智能化进程。

  成绩单中披露,2019年“百度 AI 寻人”平台,用户发起照片比对超过了36万次,9000多个走失者与家庭重新团聚。

  百度还发布了听障儿童无障碍阅读计划,推出了全球首款听障儿童AI手语翻译小程序,能将绘本文字翻译为手语,帮助听障儿童实现无障碍阅读。

  此外还将AI应用在了台风路径查询、濒危土家语保护、改造盲人按摩院等方面,进一步发掘AI价值。

  早年围绕这一技术发展起来的第一波AI独角兽,也已经在想办法向更多的方向拓展。旷视发力IoT供应链,依图做起了芯片,而商汤在教育、AR、自动驾驶方向频频发力等等。

  与此形成对应的是,NLP方向突破频频。谷歌的BERT直接催生出了更多的变体,机器在自然语言处理与语义理解上更为突出,GPT-2的问世也进一步彰显出了整个方向的创造力与活力。

  但2012年ImageNet石破天惊开始,感知智能的进展要遥遥领先于认知领域,直观类比来说,感知就像一个人类能考到95分的试卷,而认知领域,够到及格还挑战连连。

  这是对前些年人工智能领域“”的最直接回应,AI发展理性回归,从资本方到企业,整个行业的参与者都在要求AI展示“降本增效”,来转化成线年的百度,恒达登录在落地与AI生产力转换方面再明显不过。

  最典型如自动驾驶领域有L4级视觉感知解决方案Apollo Lite和增强现实的自动驾驶仿真系统,对于自动驾驶落地,全球都在要求进入“平民”时代,依靠堆高精尖传感器的“贵族”玩法,市场空间越来越小。

  国际上,Waymo模式遭遇质疑和重估,摩根大通将其估值调低40%,而在货运领域自动驾驶落地则热火朝天,两种不同形态一对比,才知道“看不见的手”想要的不再是遥远的迷人图景,它想要的是——少废话,证明价值吧。

  但现实给出的种种反馈都颇为直接地展现出,在给出这一结论的时候,要用将来时态。从现在到将来缺了什么?

  王海峰在2019年提出观点称,前三次工业革命的核心技术都具有很强的通用性,呈现出标准化、自动化和模块化的工业大生产特征。

  前些年的人工智能落地,都体现在一个case接一个case的模式,现在进入工业大生产阶段,则要求人工智能体现出更加通用特征,一个产品能够处理多个case,人工智能的能力要标准化、自动化和模块化。

  百度的成绩单中,百度大脑、飞桨、小度助手、Apollo等平台,都是百度对这一趋势给出的回应。

  飞桨、Apollo等开放平台被国际知名第三方机构波士顿咨询,作为中国AI发展的代表,并在全球范围内与谷歌相提并论,认为开放平台正是巨头优势和推动智能化变革的关键。

  毫无疑问,将人工智能转化为生产力需要生产工具。谁提供的生产工具使用的越多,谁就能在生产力转化中占据上风,毕竟这是人工智能驱动的世界底座。

  伴随着2019年人工智能落地提速,大公司大平台争夺“底座”愈加激烈。TensorFlow和PyTorch展开“厮杀”。前者推出2.0版本,后者将目光也进一步强化端侧部署,各不相让。

  百度飞桨也在2019年迎来多次进化,推出多端多平台部署的高性能推理引擎Paddle Lite、发布超大规模深度学习模型训练技术等等动作,也为其更好地展开竞争提供了支撑。

  在人工智能技术产生商业价值的同时,如何更好地利用人工智能技术也成为世界范围内被广泛讨论的话题。

  在学界,有今年3月斯坦福大学正式成立以人为本AI研究院,李飞飞担任联合主任,推动人工智能研究、教育、政策和实践,以改善人类状况。在业界,Facebook、谷歌等科技巨头在AI应用方面的做法也屡遭抗议与审查。

  国内也不例外,关于AI伦理的探讨、探索也在展开。在百度的成绩单中,AI伦理、安全以及社会责任都被着重强调,并给出了探索成果。

  一方面是打造了完整的AI安全体系,另一方面在AI向善方面落地:“百度 AI 寻人”平台帮助超过9000个走失者与家庭重新团聚。

  此外,另一巨头腾讯,也在AI时代变革思考后,把“科技向善”正式写入公司使命和愿景,体现了对新时代伦理的重视。

  全球范围内,谷歌的AI军用代表事件则内外广受争议,Facebook年初开始的数据泄露事件则被批判至今……AI时代面临的新伦理、隐私边界,并非说说而已。

  在百度成绩单中,完全自主研发的“百度昆仑云服务器”,让中国AI跑在自主可控的AI芯片上,与飞桨、ERNIE等国产算法形成了软硬件一体的核心竞争力。

  而且,百度的努力也不仅仅体现在自身体系之中,飞桨还与华为麒麟、寒武纪等国产芯片深度合作,打通深度学习框架与芯片AI算力,提升中国的AI竞争力。

  而且更进一步,所有中国AI公司、科技公司,经此一役,已经明白“原创”、“自主”和“脱钩方案”的必要性和重要性。

  AI造芯浪潮复兴,依图等算法公司深入AI芯片腹地,联想等公司也推出自主可控防断供方案,国家层面则在底层技术和基础科研方面,前所未有重视。

  今年是百度创立20年,过去20年中,从人才角度而言,国内以技术著称的百度,直接和间接培养了大批人才,成为名副其实的技术领域的“黄埔军校”。

  根据百度成绩单,百度AI已经形成了囊括师资培训、学生赛事、课程共建以及教材出版等多个维度产学融合生态。

  推出了“全国高校深度学习师资培训班”、“飞桨博士会”、“AI快车道”、“黄埔学院”、“在线深度学习集训营”等项目,一共培养1000名专业教师,助力200+高校开设深度学习课程,为近1000家企业提供技术和应用培训。

  而硬件方面,百度上线AI Studio 教育版,这背后是价值超过千万人民币的上千张GPU卡,作为师资培训配套“教具”,免费提供给高校使用等等。

  虽然百度人才培养模式,更多出于“底座”雄心,但客观而言,一定会加快中国AI技术进一步普及,以及更多人才带来星火效应。

  。重视基础科研,自然会体现在知识产权能力上。国家工业信息安全发展研究中心12月发布的《人工智能技术专利深度分析报告》中给出例证,百度专利申请数量在国内排名第一,达到5712件,超过第二名近1600件。

  在中国专利申请数量超越美国方面,可以说是当为头功。也算是作为国产AI第一大厂的实力和担当。

  回顾2019年,正如王海峰所总结的那样,百度AI打造了扎实的底座;推动了真实的改变;创造了值得信赖的未来。

  当然,AI突破还在继续、AI落地也还在继续,从这份百度成绩单中我们也能窥见到中国AI领域的一个缩影,让更多人了解AI,也能给大小公司的AI之路提供参考,知晓智能时代变革如今身处何处、未来又走向何方。

标签: