研究& Innovation

院长系列讲座揭示了人工智能的未来已经来临

微软的博士。王学东黄解包hololens 2,用在自己声音的人的讲话翻译成60种语言的能力的虚拟现实设备,实时

设想一个医学上更加精确与全息图的帮助下一个世界,让医生以数字“看”到病人体内的过程中。一个世界里,你可以给完美的日语主题演讲,在你自己的声音,在任何地方,在任何时候,即使你不懂日语。

可以ESTA声音好像​​有些遥远的未来的东西,但在2019和SES院长的系列讲座,由院长主持 牛仔祖 10月17日,博士。王学东黄放心200多名教职工,学生和工作人员组成的听众说“所有这些技术存在的今天。未来就在这里。“

通过工程与科学学院谢弗在太阳城网站网址主办的,黄的扣人心弦lecture-“打破壁垒艾人际交往,hololens超越” -revealed人工智能型富集的未来。

黄,在微软云技术微软研究员AI,成立该公司的语音技术集团于1993年本集团于1995年ESTA科技所带来的语音识别到大众市场推出该公司的语音应用程序编程接口(SAPI)的允许的语音识别和语音合成的个人计算机上。只是从那之后,他的野心一路飙升。

黄建始他的演讲有鸡还是先有蛋的命题:我们知道,语言使我们有别于其他动物;但我们更聪明,因为我们有语言,或语言我们有我们这么厉害,因为?黄左语言的起源人类学家,并于未来而不是看着语言和人工智能与微软的hololens 2的演示,虚拟现实设备以弥补AIMS这一差距的数字和物理世界之间。

“语言是皇冠上的明珠最重要的是我们已经完成了,说:”黄。 “所以,[它遵循]语言将在AI扮演一个重要组成部分。”

黄灵感来自简单的花岗闪长岩的石头,刻在公元前196年举行的关键就在破译天书:著名的罗塞塔石碑。而ESTA神器让古埃及历史上被解锁,今天黄旨在进一步打破语言障碍,在更大的规模随着hololens揭幕2 - 一种技术,它可以转换单一的任何的讲话为60种语言,在他们自己的声音,在实时性。

“我们正在利用AI来实现这一目标之前从未想到的东西”表示,黄。

该装置戴在头上,眼睛,耳朵,让用户有面对面的面对面交谈与多人讲不同的语言是谁,甚至分散注意力的背景噪声。另外,设备占串扰,分配给听写单个扬声器。这可以在任何地方使用,从一个嘈杂的虚拟会议室开会。甚至更多,该器件可集成转录的显示随着全息图,这可能代表来自复杂的机械装置,任何正在研究在课堂上,一个设置在舞台上,甚至化身。

利用机器学习与网络作为整个微软的搜索引擎Bing抓取的索引开始hololens 2的发展。在总三万亿字进行处理。

“从电脑阅读三万亿字;我不认为一个human've做到这一点,“黄说。在另一方面,我补充说,“这只是令人惊讶地看到人们如何理解言语随着越来越少的数据。”

在中国湖南和清华大学的毕业生,黄获博士学位。毕业于爱丁堡大学,其中有经验丰富的语言障碍第一手的深刻影响电气工程。

“我很痛苦其中的一个学生,因为我们有梦幻般的苏格兰教授凭借强大的苏格兰口音,和我没有任何线索,”黄回忆说。

同时,我不得不提到他的“苏格兰 - 中国口音”是被转录到他的PowerPoint演示文稿相当精确。当我问观众选择另一种语言,有人叫了一声,“中国人”“已经从下拉普通话的下拉菜单中选择,并出现在屏幕上,我口述的新角色。

同时,从观众留下深刻印象窃窃私语起来。那些不能阅读中国询问他们的邻居的翻译,是谁转发,近点上,一个复杂的壮举考虑到东部的这一措辞不同意句法或语法有了浪漫的语言起源。这里是有形的AI,在行动上,在礼堂。如果我以前是没有观众的全部注意力,我现在有它。

相比黄敏锐的智慧,AI的能力,推理和意义的决策,任务,迄今为止,只有人类可以做到的。 “我们的理解演讲,并捕捉到什么是说,和计算机视觉能力,是所有的感知水平,”我解释道。 “大多数的我们所取得的进展是在智能感知不可用。”

黄的演讲深深吸引观众已经具有人工智能实力雄厚的投资。超过十年前,六个指定史蒂文斯 基本战略支柱 这的Encompass许多人认为将领先的技术和创新的研究至关重要的未来。其中一个战略支柱的是人工智能,机器学习和网络安全。

跨学科 太阳城网站网址人工智能 (SIAI)成立于2018年,在史蒂文斯汇集来自所有学术梯队单位超过50名成员(工程,业务,系统,艺术和音乐)研究了各种人工智能和机器学习应用。 SIAI希望扩大其研究和分析通过实体产业合作方面造成的影响,政府,基金会和其他学术伙伴。

至于黄,我预计在这一个AI将来会具体改变商业世界。

“其中一个在企业世界上最重要的功能,”他说,“是的会议。随着微软语言转录服务,这正在发生变化。只需使用麦克风和视频会议,我们可以做的转录。无限的词汇正在发生的事情,我们可以看到因为所有的话不断在网站上公布。“

我打了微软的Azure语音系统,其中的视频演示,使用麦克风和摄像头,可以录制多达八人在会议室的谈话,分配的话通过语音识别每个扬声器,并提供真实关闭语言障碍时间翻译。

远离好莱坞的反乌托邦如果机器拿过来,黄的愿景是机器,帮助专业人士变得更加有效,在他们的工作更富有创造性的。

“我们来这里是为了帮助每一个人,每一个组织实现更多,说:”黄。 “我们希望我们的合作伙伴取得更大的成功;我们不是想取代他们的工作。微软已经没有能力了解什么是电子邮件或在会议上发生的事情。我们仍然需要这种理解人类。平移AI是真实的; AI的理解是人。“

“爱是不会改变一切ESTA社会”表示,黄。 “大多数的进展,我们提出在智能感知不可用。运用知识推理能力,了解相关情况的出路。我不知道如果这会在我的有生之年发生。但敏锐的情报是真实的,就在这里。“