科大讯飞刘庆峰:人工智能未来会像水和电一样,无所不在!
原创
2015-12-22 23:53:35

编者按:1956年最热的两个月,美国汉诺斯的达特茅斯学院中,一些科学家们正聚在一起,讨论着看似对人类“无关痛痒”的话题:以机器模仿人类的学习及其他方面的智能。大家最终没有达成共识,讨论的内容却诞生出一个新名词——人工智能。那年,也成了人工智能元年。

60年的时光,人工智能的发展经历着并不被众人所知的起伏。而在这个被称为“人工智能之年”的年份里,有人在嘈杂的人群中静静讲述,有一天,人工智能将会像电影《超体》中的露西一样,无处不在!


    【钉科技报道】12月21日,世界领先的语音交互及人工智能(英文简称A.I.)科研公司——科大讯飞,在北京国家会议中心召开了以“A.I.复始,万物更新”为主题的2015年年度发布会。作为被称为“人工智能之年”的2015年的收官大会,其内容异彩纷呈,可以算得上是中国人工智能领域一场具有标志性意义的大会。

    人工智能的发展经历了什么样的历程?有哪些人工智能产品能为我们的工作、生活、学习带来帮助?「讯飞超脑」为代表的科大讯飞人工智能技术,获得了哪些创新性、革命性的技术突破?以开启人工智能新纪元为目标的科大讯飞都做出了解答。

    复始·更新:60年,一个轮回


   刘庆峰介绍,1956年的达特茅斯会议是人工智能研究的历史起点,至今正好是一个60年甲子。在这60年的发展过程中,伴随着计算机技术和民用科技突飞猛进的发展,人工智能研究本身经历了两次波峰与波谷,而从2006年起始至今愈发升温的人工智能热,是第三次人工智能浪潮,而60年甲子的当下,正处于人工智能爆发的前夜。

    在这第三次浪潮中,中国、美国和欧洲,不约而同地将人类大脑研究上升为国家战略科研高度,而以科大讯飞为代表的中国科学家与产业势力,也是历史上第一次与西方的同行们同步前进,共同推动人类科学技术的前沿探索。
    刘庆峰表示,人工智能未来会像水和电一样无所不在。而在人工智能的三个层次——计算智能、感知智能和认知智能之中,前两者机器的能力已经超越人类,让机器实现认知智能是目前人工智能科研的焦点,这也是人区别于动物的最本质能力。
    而从人类自身的发展来看,产生认知智能的标志是语言的广泛使用。所以,在第三次人工智能浪潮中,世界上众多的科学家都不约而同地从“自然语言理解”这个研究方向上,寻找人工智能的突破口,亦即从语音与语言入手实现机器的认知革命。而科大讯飞也正是从这个方向上取得了令世人瞩目的成就。
    讯飞超脑正在认知智能方向不断突破

    从1998年成功研发出可实用的中文语音交互系统开始,至2014年发布“讯飞超脑”的这17年间,科大讯飞取得了让行业和科技界瞩目的一系列科研成就与产业化成果。

    科大讯飞的这些成果中,包括获得NIST全球语种识别比赛的冠军,JWSLT机器翻译评测冠军,在国内替代人工进行英语口语测试与普通话级别考试,并在教育、车载、家居、通信、硬件和国家安全等众多领域的产业化高速推进。这个过程中从一家大学生创业公司,成长成为目前市值超过500亿的中国高科技公司。

    AIUI正式发布,讯飞超脑全新升级


    在产品发布环节,刘庆峰首先定义了认知智能的三大核心支撑能力:人机交互、知识管理与推理学习。而随后科大讯飞发布的讯飞超脑2.0科研项目,正是围绕这三方面持续展开,不但赋予机器“能听会说”的能力,还能赋予机器“能理解会思考”的能力。
    而在讯飞超脑的产业化应用产品层面,年会发布了对科大讯飞具有里程碑意义的人机交互新产品——AIUI。刘庆峰认为,在实际上已经到来的“万物互联”时代,客观上对人机交互提出了更高的要求。但是,一方面目前大多数设备没有屏幕并且与用户之间有一定的距离,另一方面随时随地的多方交互的需求越发明显。于是,科大讯飞又在此次大会上定义了“万物互联”时代的人机语音交互标准,其基本能力应该包括三方面:远场识别、全双工、多轮交互。
    AIUI集成了包括双全工技术、麦克风阵列技术、声纹识别技术、方言识别、语义理解技术和内容服务等——科大讯飞一些系列尖端科研成果和完善服务,代表业界最高水准的技术产品。开发者将可以一键获取解决方案,通过集成麦克风阵列、集成SDK以及定制云端服务等方式。
    更自然的人机交互是:听得懂方言

    

    年初,山东大汉被车载语音导航逼疯的消息传播甚广。一个普通话不标准的山东人,在环境嘈杂的车上,远距离与不那么智能的导航交流,产生的结果就是让人抓狂的识别与交互。而本次发布会上,科大讯飞通过远场抗噪、方言识别、全双工交互、多轮对话、纠错等系列技术,成功打破了“山东大汉的困境”。

    科大讯飞通过定位、麦克风波束形成、回声消除、抗混响、唤醒一系列技术形成的系统解决了远距离识别问题。其次,科大讯飞实现了人机对话控制由单工(如手机语音助手的按一下说一下)转变成全双工(人和机器可以像打电话那样同时听和说)的交互转变。

    多轮交互实现了机器对上下文连贯理解,使得人机交流不再是单调的一问一答,而是可以连续交流。再加上对话纠错机制,人可以随时纠正对话中双方的错误,使说过的话不再是覆水难收。通过以上一系列技术形成的系统,极大降低了环境、说法、习惯等对人机交互的干扰,实现高度自然的人机交互体验。

    全学科阅卷+智学网,讯飞超脑助力教育升级


    老师“忙”于改作业、判卷子、备授课,事倍功半;学生“盲”于做作业、找补习、问问题,低效重复;而教育资源“茫”,数量多、来源广,选择难,杂乱无章更是给教学带来极大困扰。刘庆峰用“忙”、“盲”、“茫”这三个字道出了教育面临的窘境,而科大讯飞目前的技术进展正是解决以上问题的良方。
    刘庆峰表示,在讯飞超脑的应用层面,教育产业也是科大讯飞将自身科研成果产业化最成功的领域之一。目前,全国已经有31个省市的8000万师生在使用科大讯飞面向K12教育所推出的高科技教学与考评产品,有效解决了之前的教育行业困境,不仅实现了语音与文字的识别、合成与分类,并且实现了智能批改、全科阅卷、资源库自动建设等真正具备“人工智能”的产品目标,为中国的整个教育体系实现梦寐以求的个性化教学提供了有力支撑。
    正是在此基础上,作为科大讯飞的to C教育产品——智学网与E听说具备非常可观的市场价值。
    目前,科大讯飞中文作文机器阅卷技术在2015年合肥、安庆中学会考上已经取得应用,人机阅卷对比结果显示机器阅卷已经相当准确!
    智学网秉承“基于大数据的发展性评价及教与学分析”的理念,以考试为切入点,可在线辅助老师完成出卷、阅卷、统分,将老师从繁琐重复的阅卷工作中解放出来。同时,机器阅卷过程的全数字化,实现对学生答题数据的收集,通过对数据的分析,生成面对学校、班级、学生不同版本的专业化评测报告,以便老师进行针对性的教学,进而促进学生实现个性化的学习,极大提升学习效率。

    讯飞听见:“即时语音转写”开启知识管理新时代


    在发布会现场,科大讯飞全球首次将演讲人董事长刘庆峰的演讲同步转写成文字在大屏幕显示,敢于接受现场数千参会者和数千万观看视频直播观众的检验,并接受五名高级速录师的挑战。现场识别正确率达到99%以上!这也标志着科大讯飞又一次在业界率先实现了演讲和会议场景下的语音转写技术突破。

    针对大型会议、现场采访、个人交流等场景下的内容整理需求,科大讯飞集成了单麦克解混响技术、阵列解混响技术、口语化识别等众多最新研究成果,全球首发智能“软件+硬件+服务”于一体的语音科技产品——讯飞听见,包括手机App(录音宝)、PC端网站(www.iflyrec.com)、智能硬件(录音笔)。
    PC端网站能够实现双屏智能编辑、角色自动分离、音频精准定位、快速按句回听、发言实时上屏、格式多种多样等功能,手机APP录音宝则能解决常见的录音回听不方便、导出录音复杂、录音文件无法重命名等问题。同时,听见录音笔既增强了传统录音笔的录音音质、播放效果,更配备智能语音转文字服务,三者的结合实现了“软件+硬件+服务”的完美统一。
    刘庆峰表示,实际上,音文转写是当下都市生活的一种经常性需求,在正式发布之前,录音宝产品已经有了超过100万的用户就是这种需求的证明。而随着流媒体的不断演进与普及,相信,在未来的图文直播时代,科大讯飞的音文转录产品的价值将会更加凸显。
    录音宝、录音笔与讯飞听见网这三款新锐产品,将与讯飞输入法(2.8亿用户)、灵犀语音助手(1.2亿用户)、DingDong智能音箱(2015年市场份额最大的WiFi音箱)、智学网、E听说一道,构成科大讯飞的To C产品线第一阵营,而科大讯飞还将继续在To C业务的条线上,推出受市场欢迎的高科技产品。


    在实际上已经到来的“万物互联时代”,语音为主,触摸、图像、手势为辅,将成为人机交互的新常态,而在这种人类生活的新常态中,人工智能技术的突破是用来延伸人类能力而非替代人类的。人工智能将使人类更幸福、更富想象力和创造力。

最新文章
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512