如何机器学习可以帮助语音障碍

没有人的本能比言语更为基础，然而，对于许多人来说，谈话可以征税。在14个工作年龄的美国人患有语音障碍，往往与不正常的声音行为-其中一些可能会导致声带组织的损害，并导致形成结节或息肉，干扰正常的语音生产。

不幸的是，许多行为基础的语音障碍没有得到很好的理解。特别是，肌肉紧张性发声障碍患者（MTD）经常体验声音质量恶化和声带疲劳（“疲倦的声音”）在任何明确的声带损伤或其他医疗问题的情况下，使病情难以诊断和难治。

而来自麻省理工学院计算机科学和人工智能实验室（CSAIL）和马萨诸塞州总医院（MGH）认为，通过机器学习更好的理解疾病如MTD是可能的。

利用在MGH语音中心的研究人员开发出一种可穿戴设备采集到的加速度数据，研究人员证明，他们可以检测患者和对照组之间的差异最大。同样的方法也表明，接收语音治疗后，受试者表现出的行为，MTD更多类似的控件。

“我们相信，这种方法可以帮助发现疾病，是由声带滥用加剧，并有助于实证测量声音治疗的影响，“麻省理工学院的博士生Marzyeh Ghassemi，谁是第一作者在相关论文，她在上周的机器学习（保健mlhc）会议在洛杉矶举行。“我们的长期目标是为这样一个系统，以提醒患者，当他们使用他们的声音的方式，可能会导致问题。”

论文的共同作者包括John Guttag、麻省理工学院电气工程和计算机科学教授；Zeeshan Syed，首席执行官的机器学习启动健康[在]的规模；和医生Robert Hillman、Daryush Mehta和杰拉德·范斯坦马萨诸塞总医院。

它是如何工作的

现有的方法来应用机器学习的生理信号往往涉及监督学习，其中的研究人员刻意的标签数据，并提供所需的输出。除了是耗时的，这种方法目前不能真正有助于分类的话语，正常或不正常的，因为目前还没有一个很好的理解加速度计数据和语音误用之间的相关性。

因为著名的团队不知道什么时候嗓音误用的发生，他们选择使用无监督学习，那里是无标记数据在实例级。

“发声障碍的人并不总是滥用他们的声音，和没有疾病的人也偶尔会滥用他们的声音，”Ghassemi说。“在这里的困难的任务是建立一个学习算法，可以确定什么样的声带运动是突出的科目与一个障碍。”

这项研究分为两组：已被诊断为语音障碍的患者，和一组无障碍的对照组。每一组都在他们的日常活动，而戴在他们的脖子上的加速度计，捕捉他们的声带运动。

研究人员以两组数据，分析了超过1亿1000万“声门脉冲”，每个代表一个打开和关闭的声带。通过比较集群的脉冲，团队可以检测患者和对照组之间的显着差异。

研究小组还发现，在语音治疗患者声门脉冲分布较为相似的控制。根据Guttag的说法，这是第一个这样的研究使用机器学习提供语音治疗的积极作用的客观证据。

“当一个病人来治疗，你可能只能够分析他们的声音20或30分钟，看他们在做什么错误和他们实践更好的技术，”Susan Thibeault说，在医学和公共健康的他并没有参与这项研究的威斯康星大学医学院外科病区教授。“一旦他们离开，我们真的不知道他们在做什么，所以很令人兴奋的认为，我们最终可以给患者可穿戴设备，使用圆形的时钟数据，以提供更直接的反馈。”

展望未来

一个长期的工作目标是能够使用的数据，不仅改善那些有语音障碍的生活，但可能有助于诊断特定的疾病。

该研究小组还希望进一步探讨为什么某些类型的声音脉冲在患者中比对照组更常见的潜在原因。

“最终，我们希望这项工作将导致智能手机为基础的生物反馈，”Hillman说。这种技术可以帮助声音疗法最具挑战性的一点：让患者实际上使用他们在日常生活中在治疗中所学到的更健康的声音行为。”

该研究的资助，部分由英特尔科技大数据中心，声音健康研究所，国立卫生研究院（NIH）国立耳聋与其他交流障碍研究所和生物医学信息学研究，培养国家图书馆。

如何机器学习可以帮助语音障碍

相关新闻