IEEE trans:用神经网络方法自动评估多发性硬化症患者的口腔轮替功能

时间:2021-05-24 06:02:12   热度:37.1℃   作者:网络

多发性硬化症(MS)是最常见的一种中枢神经脱髓鞘疾病。本病急性活动期中枢神经白质有多发性炎性脱髓鞘斑,陈旧病变则由于胶质纤维增生而形成钙化斑,以多发病灶、缓解、复发病程为特点,好发于视神经、脊髓和脑干,多发病于青、中年,女性较男性多见。运动性语言障碍称为构音障碍,很可能是MS最不常见的临床症状之一。共济失调、痉挛和混合共济失调痉挛性构音障碍是多发性硬化症中最常见的构音障碍亚型,其原因是小脑和锥体束受累。失调型构音障碍(小脑系统障碍,主要表现元音辅音歪曲较轻,主要韵律以失常为主,声音的高低、强弱、呆板、震颤、初始发音困难、声音大、重音和语调异常、发音中断明显)痉挛型构音障碍(中枢性运动障碍,一般表现为说话费力,音拖长,不自然的中断,音量、音调急剧变化、粗糙音、费力音、元音和辅音歪曲、鼻音过重)。

构音障碍的严重程度归因于神经系统疾病的总体严重程度。这一观察结果提供了一个机会,可以考虑将客观的语音评估作为监测多发性硬化症疾病进展的潜在生物标志物。语音评估快速、无创、价格低廉、易于应用,甚至可以通过患者家中的智能手机应用程序实现完全自动化和远程监控。口语发音是运动言语评估的一个传统组成部分,它测量言语发声者的运动能力并揭示其运动局限性。被认为是对构音障碍进行鉴别诊断以及确定言语运动控制功能障碍严重程度的一种重要的言语范式。口腔轮替功能 (DDK)的评分用两个指标量化。DDK速率通过分析每次音节发声的次数来确定发音速度。DDK规则性是指通过测量音节之间距离的标准偏差来测量时间上的不规则性。

Fig. 1. - Example of voiceless and (top) and voiced (bottom) AMR task with zoom to the oscillographic sound pressure signal and its respective spectrogram for two syllables with highlighted positions of burst and vowel occlusion by hand labels. An exemplary HC speaker (top) performed syllable repetition at a fast tempo (DDK rate = 8.1 syll/s) and stable regularity (DDK regularity = 3.7 ms), whereas the exemplary MS patient manifested slow velocity (DDK rate = 5.9 syll/s) and irregularity (DDK regularity = 60.5 ms). MS = multiple sclerosis, HC = healthy controls.

清音和(上)和浊音(下)AMR任务的示例

通常使用两种类型的DDK任务。交替运动速率(AMR)是指单个音节的快速重复,如/ta/,而顺序运动速率(SMR)是指音节序列的快速重复,如/pa/-/ta/-/ka/。与AMR相比,SMR由于双唇辅音等的连续重复,执行起来更具挑战性。因此,SMR任务通常用于评估具有顺序规划的障碍,如言语失用症或小脑共济失调。先前对多发性硬化症(或共济失调性构音障碍)的研究只考虑了无音辅音的AMR/SMR任务。本研究开发了一种基于CNN的分割算法,允许从不同类型的AMR和SMR范式中准确检测音节。

120名患者(89名女性),平均年龄44岁(标准差11岁),根据McDonald标准被诊断为多发性硬化症。94例患者被诊断为复发缓解型多发性硬化症,15例继发进行性多发性硬化症,3例临床孤立综合征和8例原发进行性多发性硬化症。所有患者在试验前至少30天内无复发。此外,60名志愿者(44名女性),平均年龄44岁,无神经或通讯障碍病史,被纳入健康对照组。使用扩展残疾状态量表(EDSS)评估患者的临床严重程度,该量表评估八个功能系统:锥体、小脑、脑干、感觉、肠道和膀胱、视觉、精神和其他功能。每个领域得分从0(无残疾)到6(最大残疾);由于存在痉挛性共济失调性构音障碍,锥体和小脑亚核在本研究中具有重要意义。根据每个功能系统和行走的评分,获得0(正常检查)到10(MS死亡)的综合EDSS评分。

构音障碍的严重程度和类型是由两位有运动性言语障碍经验的言语病理学家根据Darley等人概述的感知标准,采用元音延长、DDK任务和阅读文章的发音模式进行感知评估的。30例MS患者可感觉到的构音障碍主要表现为痉挛和共济失调,主要表现为语速慢、语速不规则、发音不准确、发音紧张、声音嘶哑和不自然的词重音表达。语音录音是在一个安静的房间里进行的,环境噪音很低,使用头戴式电容话筒(Beyerdynamic Opus 55,Heilbronn,Germany),距离每个受试者的嘴大约5厘米。语音信号采样频率为48khz,分辨率为16位。每位参与者被要求在每次呼吸中尽可能快而准确地重复音节/ta/、/da/、/pa/-/ta/-/ka/、和/ba/-/da/-/ga/。每个四音节重复任务被执行两次。多发性硬化症患者的舌头功能明显比嘴唇功能受到更大的影响。

为了调整算法并获得评估其可靠性的反馈,对所有类型的AMR/SMR任务以及MS组和对照组中随机选择的15.6%的话语(即224个话语)进行了手动音节注释。在每个音节的发声过程中,对辅音(/p/、/t/、/k/、/b/、/d/、或/g/)的初始爆发和元音/a/的咬合两个事件的位置进行注释。时域由于其较好的分辨率而被优先用于突发事件的描述。在频域中,爆发的特征是在整个频率范围内出现一个或几个时间窗的中度激发。频率域用于识别元音的咬合,其中基本频率的能量以及前三个共振峰频率缓慢减弱。第二共振峰元音偏移量被认为是咬合发生的最佳指标。使用R—CNN算法进行评估。

Fig. 2. - Scheme depicting the process of data pooling, preparation of training/validation subsets and training of the CNN based on Restnet-101 topology with implemented Faster-RCNN data object model, as well construction of the CNN input and achieving the final classification result.

算法流程图

基于CNN的方法的总体平均分类准确率为97.8%,MS和HC的分类准确率分别为96.6%和98.9%。无声AMR/SMR范式的平均准确率为99.6%,略高于有声AMR/SMR范式的平均准确率96.0%。尽管70%的MS患者构音障碍的严重程度不明显,只有30%的MS患者构音障碍的严重程度轻微到中度,但我们发现在所有不同类型的调查任务中,DDK的速率和规律性都有显著改变。本文是关于MS患者口腔分诊的最大患者数量的研究。引入模型的能力使MS和HC受试者的分类准确率高达74%,证实了口腔分诊对多发性硬化症运动言语评估的重要性。由于多发性硬化症中构音障碍的估计患病率为40-60%,这种分类准确率非常有希望,甚至可以与以前使用多种类型的言语任务获得的79%的准确率相比较。

MS患者的DDK速率较低,这与先前的研究结果基本一致,即痉挛性和共济失调性构音障碍患者的AMR和SMR较低。在所有任务中,健康对照组的AMR和SMR任务之间的DDK率没有差异。MS患者在两种SMR模式中都较慢,但在浊音SMR中较慢,表明浊音和清音辅音的发音异常可能存在差异。在MS中,有声AMR的平均表现低于无声SMR任务。

本研究为口腔轮替功能 的自动评价提供了一种新的方法。AMR和SMR任务有助于鉴别诊断,并可作为疗效和疾病进展的指标。

K. Rozenstoks, M. Novotny, D. Horakova and J. Rusz, "Automated Assessment of Oral Diadochokinesis in Multiple Sclerosis Using a Neural Network Approach: Effect of Different Syllable Repetition Paradigms," in IEEE Transactions on Neural Systems and Rehabilitation Engineering, vol. 28, no. 1, pp. 32-41, Jan. 2020, doi: 10.1109/TNSRE.2019.2943064.

上一篇: Nat Med:XCR1+1型常规树突状...

下一篇: Neurology:自体造血干细胞移植,...


 本站广告