本篇文章2654字,读完约7分钟
上海新华联国际中心【科技在线】最近,在奥地利召开的机械与声音国际峰会interspeech 2019上,国际声纹识别权威大赛voxcelebspeakerrecognitionchallenge ( vox src )公布了新的结果,中国声纹识别技术在国内外众多强队中脱颖而出。
此次参赛队伍不仅包括约翰斯·霍普金斯大学、法国国家新闻自动化研究所、清华大学、中山大学等国内外知名大学、研究机构,还包括平安科技、nec、君林科技等各大公司。 迄今为止,基于图的人工智能技术不仅在视觉感知、自然语言理解等行业处于世界领先地位,声纹识别技术也达到了世界水平。
声纹识别是一种通过声音判断说话者身份的技术。 如果说语音识别是让机器评价“说了什么”,那么声纹识别就是评价“谁说的”,处理生物认证的确认和识别。 显然,采用基于端到端深入学习的方法进行声纹识别,拥有大量的声纹数据样本,具有不容置疑的特征。
声纹识别的应用前景非常广阔,例如利用高端智能手机的锁屏、声控安全门、汽车声控锁等声纹识别技术,支持智能扬声器、智能语音助手等个性化服务 例如,比较家里的老人和孩子,推荐不同的曲子、信息。
但是,由于声纹识别技术本身难度较大,这些应用诉求大部分还处于探索阶段。 这也是很少能够自动识别目前市面上说话者的智能语音APP交流的原因之一。
在声纹识别行业,voxcelebspeakerrecognitionchallenge ( vox SRC )是影响力和权威兼备的国际评价。 与通常的声纹识别评价不同,voxsrc使用的数据量大,来源多样,从会场采访、室外多人对话等实际场景中收集,包含各种噪声和杂音,对算法性能要求非常高。 此外,该竞赛的判断非常严密,因为其结果已得到学术界和工业界的认可。
成立7年来,图中显示在视觉感知、自然语言解决、语音识别、智能决策等多算法行业发展迅速,同时独占鳌头。 在这次全球声纹识别权威大赛voxsrc中的夺冠,是中国独有的ai技术能够领先世界的另一个说明。
照片显示,此次记录的声纹识别精度水平可以满足在线交易支付的动态声纹密码、个人账户注册的声纹动态密码注册等基本智能声纹APP应用的诉求。 试想,社会保障局如果设立声纹认证系统,将实现安全的远程认证,新闻多跑,群众少跑,给老百姓的生活带来很大的便利。 随着技术的成熟和融合,声纹识别技术逐渐融入我们的日常生活,将产生巨大的应用价值。 中国自研的人工智能技术也以推动和持续引领全球技术的快速发展,成为领域的标杆为目标。
近年来,随着人工智能相继推出优越政策,ai技术迅速发展成熟,在巨大的市场诉求下,中国ai产业发展迅速。 相关数据显示,全年中国人工智能市场规模约为238.2亿元,增长率预计将达到56.6%,2019年市场规模将接近280亿元。 在飞速发展的人工智能产业中,计算机视觉行业尤为火热。 不仅通过图的声纹进行识别,商汤、玩耍、wimi全息图的计算机视觉也受到了特别关注。
商汤科技成立于年,是一家致力于国内计算机视觉和深度学习原创技术的创新科技企业,提供人脸识别、语音技术、拷贝识别、人脸识别、深度学习等一系列人工智能产品和处理方案,为各行业客户提供智能化业务系统 作为世界领先的人工智能平台企业,商汤科技是中国科技部指定的国家新一代人工智能视觉开放创新平台。 另外,商汤科技还是全球有价值的ai创新公司,企业总融资额超过16亿美元,估值超过45亿美元。
商汤科技的市场占有率居众多垂直行业首位,涵盖智能城市、高端智能手机、互动娱乐和广告、汽车、金融、零售、教育、房地产等多个领域。 目前,商汤科技与国内外700多家世界知名企业和机构合作,包括美国麻省理工学院、高通、NVIDIA、本田、阿里巴巴、苏宁、中国移动、银联、万达、华为、小米、oppo、vivo、微博等。
此次商汤集团智能视觉国家新一代人工智能开放创新平台将在四个方面发挥核心使命,通过超计算系统、培训系统、智能视觉工具链等核心基础的研发、数据系统的构建,以基础研究和核心技术与国际同步保持研发水平; 实现智能视觉基础技术和共性支撑技术的突破,促进智能视觉技术与多领域的快速结合,产业赋能; 通过人工智能国际化人才体系的建立和国际化人才的培养人工智能的赋能,创造以大众创空期间孵化器为首的大众创业、万众创新的生态环境,促进新旧动能的转换。 而且,商汤集团将成为在粤港澳海湾地区建设科技创新新高地、推进科技全球化布局的指导力量。
国内另一家以全息视觉为诱惑的公司——微局,在ai视觉行业也很突出。 微全息图集中在计算机视觉全息云服务上,微全息图是全息计算机视觉ai合成、全息视觉演示、全息交互软件开发 涵盖了全息arsdk支付、5g全息通信软件开发、全息人脸识别开发、全息ai人脸交换开发等全息ar技术的多个环节,是全息云综合技术方案提供商。
全息图十分重视基础技术的研发,多年来在计算机视觉行业的耕耘和积累,全息图已经完成了从0到1的技术沉淀、研磨,微美的ai视觉技术成熟落地,各项技术指标也达到了领域的领先水平 技术成熟后,微美重点规划了1到n的落地APP,其中机器人是规划的重要一环。 微云产品布局的商业应用场景主要集中在家居娱乐、光场电影院、演艺系统、商业发布系统、广告展示系统5个专业行业。
微光全息图像解决功能定期进行优化和改进,包括全息ai人脸识别技术和全息ai人脸变化技术两大核心技术。 视频解决和识别技术的飞速发展,微美基于图像检测、识别、模板匹配、图像动态融合和交换的全息ar广告和全息成像服务目前在领域处于领先地位。
微云信息技术的研发旨在满足顾客的诉求和自身业务的快速发展,以计算机图形图像解决技术为基础,以ar全息技术为核心,各环节技术成熟。
另外,我国计算机视觉的快速发展有着不同于国外的应用市场。 根据idc市场跟踪,中国计算机视觉技术出口规模较大的三个领域是政府、金融和网络。 国外的计算机视觉技术在成本、机器人(和机器视觉)、智能驾驶领域是最重要的输出。 但是,有业内人士指出,随着我国计算机视觉的快速发展,它也将在越来越多的领域和各方面深入融合,这意味着计算机视觉市场仍有很大的潜力。
在这样的背景下,聚焦于计算机视觉行业的商汤、玩视、wimi全息图等公司备受期待。 随之,我国人工智能的快速发展也将围绕计算机视觉等核心行业展开,在人工智能相关政策的推动下,计算机视觉也将继续满足各行业的诉求,推进产业转型升级。