语音控制无处不在

人们的笑柄短短的 10 多年前，自动语音识别是现在对即将成为人们的主要手段与本金的计算设备进行交互。

语音控制电子时代的预期，麻省理工学院的研究人员建立了一个低功率芯片专门用于自动语音识别。而运行语音识别软件的手机可能需要大约 1 瓦的功率，这种新型芯片需要 0.2 至 10 毫瓦，取决于它已认识到的单词的数量之间。

在实际的应用程序，这可能被转换为电能节约 90 至 99%，可以使语音控制实际的相对简单的电子设备。这包括功率受限的设备，必须从他们的环境中获取能量或电池充电之间去几个月。这种装置形成了所谓的”的事情，互联网”的技术骨干或物联网，是指车辆、家用电器、民用工程结构、制造设备、甚至牲畜将很快有传感器的想法那报告信息直接到网络服务器，协助维护与协调的任务。

“语音输入，将成为一个自然的界面，用于许多可穿戴式应用程序和智能设备，”说南塔卓，万尼瓦尔布什教授的电气工程和计算机科学在麻省理工学院，其集团开发出新的芯片。”这些设备的小型化将需要不同的接口比触摸或键盘。它将嵌入的语音功能本地保存系统能耗相比于在云计算中执行此操作的关键。

“我不认为我们真的开发这项技术对于特定的应用程序，”添加迈克尔价格，带领的芯片的设计作为麻省理工学院研究生电气工程和计算机科学与现在工程模拟设备的芯片制造商。”我们试图到位基础设施，以提供更好的取舍对系统设计器中比它们本来用以前的技术，无论是软件或硬件加速”。

价格、卓和吉姆玻璃，麻省理工学院的计算机科学和人工智能实验室的高级研究科学家描述中提出的价格上周国际固态电路会议的新芯片。

轨枕尾迹

今天，表现最好的语音识别器，像许多其他先进的人工智能系统，基于神经网络、虚拟网络的简单信息处理器大致仿照人类的大脑。新芯片电路的大部分被涉及尽可能高效地实现语音识别网络。

但功率效率最高的语音识别系统很快会耗尽设备的电池，如果它跑了，不用中断。因此，该芯片还包括监测环境的噪声，以确定是否有语音电路的简单”语音活动检测”。如果答案是肯定的芯片激发了更大、更复杂的语音识别电路。

事实上，为实验目的，研究者的芯片有三个不同的语音活动检测电路，具有不同程度的复杂性，因此，不同的电源要求。电路是大多数能量的使用效率取决于上下文，但在模拟各种条件下的测试中，最复杂的三个电路导致最大的电力节约系统作为一个整体。尽管它消耗几乎三倍于功率作为最简单的电路，它生成的少得多的误报;简单电路经常咀嚼通过节省的能源通过貌似激活其余的芯片。

一个典型的神经网络由数以千计的处理”节点”的只有简单的计算能力，但密被连接到彼此。在类型通常用于语音识别的网络中，节点被排成层。语音数据被送入底层的网络，其节点处理，并将它们传递到下一层，其节点处理，并将它们传递到下一层，等等的节点。最上面一层的输出指示语音数据表示一个特定的语音的概率。

语音识别网络是太大，容纳在芯片板载内存中，这是一个问题，因为去片外数据是更多的能量密集比检索从当地的商店。所以麻省理工学院的研究人员设计集中在最小化的芯片已经从片外存储器中检索的数据量。

带宽管理

在神经网络中间节点可能会接收来自十几个其他节点的数据和将数据传输到另一个打。每个这些两打连接有关联的”重量，”一个数字，指示如何突出通过它发送的数据应该考虑接收节点计算。新芯片内存带宽最小化的第一步是进行压缩与每个节点相关联的权重。数据被解压缩只后他们就带片上。

该芯片还利用这一事实，语音识别，波浪状的数据必须通过网络传递。传入的音频信号被分成 10 毫秒的时间增量，每一种必须分别进行评价。麻省理工学院的研究人员芯片带来一个单一节点的神经网络在一段时间，但它将数据从 32 连续 10 毫秒的时间增量通过它。

如果一个节点有一打，然后 32 刀结果输出 384 的输出值，该芯片在本地存储中。其中的每个必须加 11 其他值时喂到下一层的节点，等等。所以芯片总是需要相当大的板载内存电路及其中间体的计算。但它只有一个压缩的节点从提取片外存储器在一段时间，保持其功率要求较低。

“下一代的移动和可穿戴设备，这是关键，使语音识别在超低的功耗，”玛丽安澎湃，微电子在比利时鲁汶天主教大学的教授说。”这是因为那里是一个明显的趋势，对外形更小的设备，如手表、耳塞或眼镜，需要一个用户界面，可以不再依靠触摸屏。语音提供接口非常自然的方法与此类设备。

研究是通过 Qmulus 项目，麻省理工学院与广达电脑的合资和资助的芯片是通过台湾半导体制造业公司大学航天飞机原型。

语音控制无处不在

相关新闻