新智元报道
编辑:Q
【新智元导读】1024开发者节大会上,讯飞听见发布「智慧办公服务平台」,让办公不止于「听见」。
智能语音,一直被认为是人工智能时代各种终端的「入口」,长期以来都是各大公司的「必争之地」。
在刚刚过去的1024开发者节上,科大讯飞(002230,股吧)向我们展示了虚拟人交互,多模态等多种前沿技术的落地应用,更是将400多项能力开放给数百万开发者使用,其中就包括多项科大讯飞深耕多年的智能语音技术。
在大会的现场,讯飞听见同传为大会提供了实时语音转写翻译服务,为远程观看的观众提供更贴心的双语字幕。同时,诺贝尔奖得主Michael Levitt、国际人工智能联合会议主席Michael Wooldridge在发表主题演讲时,通过讯飞听见同传提供的出色同传服务与现场观众更好的交流。
通过多年来无监督训练、多模态融合、人机协同进化等核心技术的提升,科大讯飞在最擅长的语音方面有了质的飞跃:模仿一个人的声音,已经从最初的一周时间,到后来的一天时间,再到之后的3个小时,而现在则发展到仅需要一句话即可完成模仿。甚至通过一句话,AI程序就能做出用户画像,大致判断出年龄、性格、喜好等特点。
此外,在语音识别和翻译领域,现在用100小时的训练就可以达到此前1万小时的训练效果。
智能语音领域的「先行者」
根据数据显示,2020年中国的人工智能软件及应用市场规模达272亿元人民币,预计未来三年将继续保持高速增长的态势。
来源:易观分析的《中国智能语音转写工具行业洞察2021》报告
在语音识别和智能语音领域,科大讯飞一直处于全球领先的行业地位。作为人工智能国家队,科大讯飞在「让机器能听会说、能理解会思考」这条技术道路上坚持攀登21年,在26日发布的第三季度报告中,前三季度营收108.68亿元,同比增长49.2%。
对于智能语音领域来说,目前语音转写服务是重要的一环。在易观发布的《中国智能语音转写工具行业洞察2021》报告中,「讯飞听见」的品牌知名度、用户好感度等均表现抢眼,在品牌知名度上更是以90%的成绩位列榜首。
来源:易观分析的《中国智能语音转写工具行业洞察2021》报告
讯飞听见作为科大讯飞语音转写及翻译的重要业务承接,核心功能就是语音转文字和翻译,与其他类似竞品相比,有很多独有的功能,更加考虑到用户需求的方方面面。
在讯飞听见的网站、APP上可以上传音频和视频,并在提交后快速转写为文字,转写准确率最高达97.5% ,还可以对转写结果实时编辑,并支持一键导出word、txt、链接等多种形式,讯飞听见智能云更是通过「可信云」评估,录音文本全程加密处理,全程保证音频内容的隐私安全。
此外,转写成功后还支持「拖动音频定位文字」或者「点击文字定位音频」,极大的提高了效率;现在还支持语气词过滤,让人工干预的环节更少。
找翻译的过程也同样简单,讯飞听见官网、APP现在支持两种翻译模式,上传文档后,既可以选择快速机器翻译,也可以选择不同等级的人工翻译,满足不同用户细粒度的需求。
对于转写来说,讯飞听见目前已经支持10种国家语言、2种少数民族语、12种中文方言转写服务;对于翻译来说,支持9国语言的多语种翻译。
目前,讯飞听见的录音转文字、在线云会议成为C端市场的重要功能,「讯飞听见」网站和APP是重要入口。
不止于「听见」,更是智慧办公平台
「讯飞听见」在成立之初依托于科大讯飞深耕多年的自然语言处理、声纹识别、语音识别、翻译等核心技术,以转写和翻译为技术核心。在本次1024开发者节大会上,科大讯飞副总裁、听见科技总经理王玮宣布讯飞听见正式发布”智慧办公服务平台”,并向AI+办公时代全面迈进。
改版后:讯飞听见官网首页
www.iflyrec.com
讯飞听见网站在本次「智慧办公服务平台」发布后,将以「智慧办公」、「语音语言服务」两大版块为核心,将原有的语音转写服务升级为以转文字、云会议、拍字幕、找翻译、智能硬件、行业解决方案等为核心的智慧办公系列产品和服务平台,可满足多场景、多终端、多形式的办公需求,致力于全方位提高知识管理的效率。
在云会议的场景中,除了超高的语音识别率之外,讯飞听见会议还支持实时字幕、实时翻译、中英文发言随意切换、会后自动生成会议记录、一键区分发言人、按句回听等实用功能,助力高效整理会议内容。
对于自媒体行业的从业人员来说,添加字幕是个非常费时的工作,通过「讯飞听见字幕」功能,既可以智能生成时间轴添加时间码,也可以快速翻译添加双语字幕。
?
除此之外,对于在线培训行业,也可以一键压缩并导出带字幕视频;综艺节目的后期编辑也可以通过多格式字幕文件对接各种专业视频剪辑工具,满足各种定制化的需求。
除了在录音/语音转写文字、云会议、同传翻译、字幕等领域充分利用自身「大转写」技术,讯飞听见更是在C端硬件产品上陆续推出高性价比的智能录音笔A1/B1/H1、智慧屏、智能会议系统等产品,并可以为企业提供定制化的AI+办公整体解决方案(具体可见文末视频号演示)。
从最初的翻译和转写,到现在的在线会议、自动添加字幕、多语种翻译等功能,讯飞听见已经服务超过1900万客户,赋能各行各业,累计转写时长超7000万小时。
本次“智慧办公服务平台”的发布,从业务类型上展现了AI语音转写翻译的功能整合及生态链路完善,并向AI+办公方向全面迈进。
今年8月,Facebook最新推出了一个VR版的开会应用Workrooms,每个人都能用自己的虚拟形象,和同事坐在虚拟桌前一起开会。或许不久的将来,讯飞听见也能通过自身积累的底层技术,实现智慧办公3.0的「元宇宙」时代。
?
AI 有速度,科技有温度
在生态的打造方面,讯飞听见今年表现强劲;在业务发展上,也有很大的突破:2021年初,科大讯飞副总裁、听见科技总经理王玮代表科大讯飞与全国人大信息中心进行战略签约,这也是全国人大首次与人工智能服务企业进行深度业务合作。
而在社会责任,无障碍方面,讯飞听见也一直致力于无障碍沟通建设上。
技术发展的最终意义,归根到底还是让人们拥有更美好的生活,而讯飞听见的使命,除了让办公更高效,让生活更简单,最重要的更是用人工智能建设美好世界。
讯飞听见联手中国聋人协会发起的「听见AI的声音」公益活动已经迈入第三年,由讯飞听见持续为听障人士提供终身免费转写服务和云会议服务,帮助他们更好地工作和生活,与世界沟通。截至目前,讯飞听见已为听障人士提供2800万分钟的无偿服务。
今年,讯飞听见为听障人士提供的关爱权益也在升级:除了讯飞听见APP为所有听障人士免费提供实时语音转文字服务之外,还新增永久免费开放「讯飞听见会议服务」(含会中实时转写及翻译),进一步助力办公学习无障碍。
此外,讯飞听见还联手B站推出了「无障碍直播间」,首次采用实时AI字幕,单日使用AI实时字幕人数突破127万,让更多听障人士也能享受直播赛事的热情与激动。
越来越多的科技公益,正不断用技术改善这个世界,而讯飞听见也让越来越多的温暖,传递给每一个人。
未来,期待更多像讯飞听见一样的人工智能企业,让更多的前沿技术持续落地,让算法和代码助力每个人实现梦想。
点击「阅读原文」,下载讯飞听见APP,感受AI语音转写的强大 。
本文首发于微信公众号:新智元。文章内容属作者个人观点,不代表和讯网立场。投资者据此操作,风险请自担。
文章内容来自网络,如有侵权,联系删除、联系电话:023-85238885
参与评论
请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。
评论区