研究& Innovation

院长系列讲座揭示了人工智能的未来已经来临

微软的博士。王学东黄解压缩hololens 2,用在他们自己的声音任何人的讲话翻译成60种语言的能力的虚拟现实设备,实时

SES Dean 牛仔祖 and Microsoft’s Dr. Xuedong Huang

设想一个医学上更加精确与全息图的帮助下一个世界,让医生以数字“看”到病人体内的过程中。一个世界里,你可以给完美的日语主题演讲,在你自己的声音,在任何地方,在任何时候,即使你不懂日语。

这听起来像一些遥远的未来的东西,但在2019和SES院长的系列讲座,由院长主持 牛仔祖博士。王学东黄放心200多名教职工,学生和工作人员组成的听众说:“所有这些技术存在的今天。未来就在这里。”

通过在太阳城平台,黄的迷人lecture-“打破人际交往障碍爱,hololens,超越”的工程和科学的舍费尔学校组织-revealed人工智能型富集的未来。

黄,在微软云和AI微软技术研究员,目前该公司的语音技术组在1993年这一群体带来了语音识别的大众市场,于1995年引进该公司的语音应用程序编程接口(SAPI)的这项技术允许语音识别和语音合成的个人计算机上。他的野心从那以后只猛增。

黄建始他的演讲有鸡还是先有蛋的命题:我们知道,语言使我们有别于其他动物;但我们更聪明,因为我们有语言,还是我们的语言,因为我们是如此聪明?黄左语言的起源人类学家,而是看着语言和人工智能的未来与微软的hololens 2的演示,虚拟现实设备,旨在弥合物理世界和数字世界之间的差距。

“语言是我们完成了最重要的皇冠上的明珠,”黄说。 “所以,[它遵循]语言将在AI扮演一个重要组成部分。”

黄的灵感来自一个简单的花岗闪长岩的石头,刻在公元前196,即持有钥匙破译天书:著名的罗塞塔石碑。而这件神器让古埃及历史上被解锁,今天黄旨在进一步打破语言障碍,在更大的规模与hololens揭幕2 - 一种技术,它可以在任何人的讲话翻译成60种语言,在他们自己的声音,在即时的。

“我们使用人工智能来实现的东西,以前从来没有想到,”黄说。

该装置戴在头上,眼睛,耳朵,使用户能够有面对面的面对面交谈与多人谁是讲不同的语言,甚至用分散注意力的背景噪音。该设备还占了串扰,听写分配到各个扬声器。这可以在任何地方使用,从一个嘈杂的会议室虚拟会议。甚至更多,该设备可以与全息图的显示器,其可以从一个复杂的机械装置正在研究在课堂上,对一个阶段,或者甚至化身的一组代表什么的转录集成。

机器学习是用在hololens 2的发展,随着整个网络的索引开始通过微软的搜索引擎Bing作为抓取。总共,三万亿字进行处理。

“电脑已经阅读三万亿字;我不认为人已经这样做了,”黄说。在另一方面,他补充说,“这只是令人惊讶地看到人类可以如何理解讲话少得多的数据。”

湖南的毕业生和在中国清华大学的大学,黄获博士学位。在爱丁堡,在那里他经历了语言障碍第一手的深刻影响大学电气工程。

“我是那些遭受的学生之一,因为我们具有很强的苏格兰口音梦幻般的苏格兰教授,和我没有任何线索,”黄回忆说。

同时,他称他的“苏格兰 - 中国口音”是被转录到他的相当精确PowerPoint演示文稿。当他要求观众选择另一种语言,有人喊道:“中国!”他选择了鸳鸯从下拉菜单,新的人物出现在屏幕上,因为他决定。

一次,印象深刻窃窃私语观众产生。那些谁也无法读中国询问他们的邻居对翻译,谁转述,它几乎被喷滴,一个复杂的壮举考虑到东部的语言不共享浪漫的语言语法或语法的起源。这里是有形的AI,在行动上,在礼堂。如果他以前没有观众的全部注意力,他现在有它。

黄相比较敏锐的智慧,AI的能力,推理和意义的决策,任务,迄今为止,只有人类可以做到的。 “我们的理解能力的演讲,并捕捉到什么是说,与计算机视觉,是所有的感知水平,”他解释说。 “大多数时候我们已经取得的进展是在敏锐的智慧。”

黄的演讲深深吸引那些已经获得AI很强的投资对象。比十年前多,史蒂文斯指定6 战略基础支柱 这包含了许多领先的研究认为是技术和创新的关键未来。这些战略支柱之一,是人工智能,机器学习和网络安全。

跨学科 太阳城平台人工智能 (SIAI)成立于2018年把所有学术单位50多个教职员工一起在史蒂文斯(工程,业务,系统,艺术和音乐)研究了各种人工智能和机器学习应用。 SIAI希望扩大其研究和分析,通过合作与产业实体,政府,基金会和其他学术合作伙伴的影响。

至于黄,他预计,在未来,AI会专门改造的商业世界。

“在企业世界上最重要的功能之一,”他说,“是的会议。与微软的语言转录服务,这正在发生变化。只需使用一个会议麦克风和视频,我们可以做的转录。无限的词汇正在发生的事情,因为我们都能够看到曾经发布在网络上的所有的话。”

他通过提供真实扮演微软的Azure语音系统,其中,使用麦克风和摄像头,可以录制多达八人的谈话在会议室,指派话通过语音识别每个扬声器,和关闭语言障碍的视频演示时间翻译。

远离好莱坞的反乌托邦,其中机器拿过来,黄的愿景是机器,帮助专业人士变得更加有效,在他们的工作更富有创造性的。

“我们来这里是为了帮助每一个人,每一个组织,以实现更多的,”黄说。 “我们希望我们的合作伙伴取得更大的成功;我们不是想取代他们的工作。微软已经没有能力来了解什么是电子邮件或在会议上发生的事情。我们仍然需要为理解人类。平移AI是真实的;了解艾人。”

“AI会在这个社会改变一切,”黄说。 “大多数时候我们已经取得的进展是在感知智能。运用知识推理能力,了解相关情况的出路。我不知道如果这会在我的有生之年发生。但敏锐的情报是真实的,就在这里。”