您的位置:首页 >房产频道 > 科技 >

谷歌可以通过Live脚本应用帮助听力损失的人互相交流

导读 倾听是我们与周围世界联系的关键意义之一。它不仅帮助我们理解信息,而且使我们能够有效地回应信息。但很多时候,衰老、传染病和耳部感染、

倾听是我们与周围世界联系的关键意义之一。它不仅帮助我们理解信息,而且使我们能够有效地回应信息。但很多时候,衰老、传染病和耳部感染、活动或意外都会影响人的听力。

所以这样受伤的人不能交流,可以联系身边的人。虽然一些设备,如人工耳蜗和其他辅助设备,可以用来帮助这些人,但它们并不容易使用。谷歌希望改变这种情况。

今年早些时候,这家科技巨头推出了一款名为Live script的应用程序,它可以让人们通过实时转录和对话与周围的世界建立联系。这个应用程序可以用于安卓设备,它使用了很多工具(包括硬件和软件),使人们能够跟踪他们本可以排除的通信。

谷歌产品经理萨加尔萨夫拉(Sagar Savla)7月10日在东京举行的人工智能大会上发表演讲时表示:“它在现实世界中带来字幕,帮助你理解来自世界各地的评论。会上,Savla不仅讲解了应用背后的技术,还提供了Live Transcibe应用的现场演示。

那么这个应用程序是如何工作的呢?

该应用程序易于使用。它使用手机的麦克风来听个人语音,分析音频,然后转录语音并向用户显示相关文本。该应用的核心是三个复杂的机器学习模型,用于分析单词和上下文的声音。第一个模型虽然叫声学模型,把声音转换成音素波形,但是第二个模型叫发音模型,把音素转换成单词。第三个也是最后一个模型——也叫语言模型——,然后加入单词的上下文来理解整个对话。

“它知道背景。因此,如果你说的是在纽约买一件新泽西的衣服,它实际上理解大写,并使球衣变小,这样它就知道你说的是衬衫,而不是地方,”Savla补充道。

这个应用程序的有趣之处在于,它已经在全球150个地方提供,它可以实时转录多达70种不同的语言,包括印地语、葡萄牙语、西班牙语和西班牙语。此外,Live script app还可以识别40种不同的音效,比如汽车鸣笛、鼓掌、音乐、掌声、人们对你大喊大叫、汽车飞驰、婴儿啼哭。

本应用的使用案例不限于听力受损者。学生和记者也可以使用实时转录应用程序做笔记。用户还可以在他们的设备上复制和保存三天的对话记录。

免责声明:本文由用户上传,如有侵权请联系删除!