Google和Microsoft正在推出令人印象深刻的AI自动功能

时间:2020-06-10 15:40:28来源:
导读当社交疏远开始时,视频通话很快就跌落为人际交流的基本方法。该工具与面对面会议不同,只是简单地看到其他面孔,使典型的纯音频电话会议显

当社交疏远开始时,视频通话很快就跌落为人际交流的基本方法。该工具与面对面会议不同,只是简单地看到其他面孔,使典型的纯音频电话会议显得过时了。然而,如今,经过几个月的距离,视频通话的新颖性逐渐消失,烦人的怪癖变得更加明显。背景中的吠叫犬并不像从前那样可爱,在头脑风暴期间用皱巴巴的袋子进食而又不使麦克风静音的任何人都应该进入复仇者联盟安置超级反派的大型监狱之一。

但是现在,微软和谷歌等公司正在加大AI驱动的力度,以消除视频通话期间令人讨厌的背景噪音。实际上,谷歌才刚刚开始向某些G Suite企业客户推出其降噪功能,并且它将在未来几个月内吸引更多用户。

本周,谷歌向Venture Beat演示了其开始实施的降噪技术的演示。示范令人印象深刻。演示者,G Suite产品管理总监Serge Lachapella经历了各种不同的声音,包括拍手声,袋子起皱声,甚至用金属六角扳手敲打玻璃杯。当他打开消除噪音功能时,他的声音听起来有些沉闷,但过一会儿便消失了。然而,更重要的是,分散注意力的声音几乎完全消失了。

Lachapella使用的是Blue Yeti麦克风,这是播客和彩带相当普遍的套件,但不是硬件能激发魔力。取而代之的是,Google依赖于基于云的AI算法,该算法可以分析音频并在留下您的单词的同时撬开令人讨厌的干扰。

这与我们通常在耳机术语中使用“降噪”一词不同。在这种情况下,耳机会产生声波,从而在试图进入您的耳朵时从物理上消除噪声。在Google的情况下(以及其他公司也在尝试相同的事情),机器人正在分析音频并将信号中的噪声去除,然后再将其传输到耳机或扬声器。

Google对语音识别并不陌生。Google助手多年来一直在监听和解析单词,而就在去年,该公司推出了令人惊讶的准确实时转录功能,该功能可实时以纯文本形式复制对话。Google通过其新的AI来利用该技术。借助消除噪声功能,计算将在云中进行,而不是在用户设备上进行,因此它对本地处理器的负担不会超过占用大量资源的视频通话费用。

该功能默认情况下会在向用户开放时打开,这意味着您可能有一天会注意到背景声音消失了。如果您喜欢未过滤的音频,则可以进入设置并将其关闭。在某些情况下,您可能想要这么做。例如,唱歌可能会通过过滤器,而背景音乐可能不会。

最新文章