加拿大的Klick科研人员在顶级健康杂志《梅奥诊所文集:数字健康》上发布了一个AI大模型,只需要听一段6—10秒的语音,就能诊断是否患有2型糖尿病(T2DM)。
目前糖尿病的主要检测方式依赖于血糖测量,但这种方法需要获取血液样本对患者会造成创伤,同时还需要专业设备成本非常高。为了解决这一检测痛点,加拿大知名健康科技公司Klick科研人员提出了AI模型检测方法。
研究人员收集了267名志愿者的语音样本,然后通过AI模型了进行了详细检测,结果显示,AI准确地识别出了2型糖尿病,其中,女性准确率89%,男性准确率86%。还发现,“音调”和“音调标准差”是诊断2型糖尿病的主要特征之一。
这个研究与前段时间Meta提出的使用MEG(脑磁图)重构人类大脑成像过程类似,都是借助人类的生物体特征,来观察其抖动数据变化确定结果。
论文地址:https://www.mcpdigitalhealth.org/article/S2949-7612(23)00073-1/fulltext
构建数据集
研究人员共招募了267名自愿者,其中79名女性和113名男性是非糖尿病患者,18名女性和57名男性被诊断为2型糖尿病患者。
参与者的糖尿病诊断是基于美国糖尿病学会的诊断标准,由医生确认。同时没有神经系统或语言障碍史,也没有吸烟历史。
参与者使用智能手机应用程序录制固定语句“你好,你好吗?我现在的血糖水平是多少”,录制时间为2周,每天最多6次,总共收集了18,465段语音样本。
数据分割,提取特征
由于年龄和体重指数等因素会对语音数据产生影响,研究人员根据参与者ID将数据分割成年龄和体重指数匹配的数据集,用于模型训练和统计分析,这有助于AI模型能够学习到糖尿病语音的真实变化。
训练集占所有2型糖尿病患者的50%男性和61%女性。剩余数据作为测试集,用于测试训练好的AI模型。
接着研究人员从每个语音样本中提取了14个声学特征,包括音高、音强、谐波噪声比、声响、声抖等。特徵提取使用的是Parselmouth,这是Praat语音分析软件的Python接口。
可从原始语音信号中提取能反映语音变化的数值特征,为后续的模型训练和预测提供输入。
选择模型
考虑到相关工作中使用的模型,研究人员选择了逻辑回归、朴素贝叶斯和支持向量机等模型。通过5折交叉验证在训练集上评估了这些模型的性能,从而找到最佳模型。
对女性而言,含3个特征的逻辑回归模型效果最好;男性,含2个特征的朴素贝叶斯模型效果最好。
逻辑回归模型可以估计不同特征对结果的贡献程度;朴素贝叶斯模型在小样本场景下效果较好。然后使用最佳模型,在构建的训练集上进行预训练。
模型测试数据
使用训练好的AI模型对测试集的数据进行预测,得到每个样本属于2型糖尿病的概率。根据预先确定的概率阈值,将样本预测为2型糖尿病或非糖尿病。
同时使用测试集的数据计算模型的精确度、敏感度和特异度等评价指标,还可以绘制ROC曲线等来全面的评估模型的预测性能。
此外,研究人员还将年龄、体重指数等信息融合到预测结果中,可以提高模型的准确度。
例如,对女性平均语音预测结果和体重指数患病率,对男性平均语音结果与年龄、体重指数患病率。这种集成模块通过组合多个信息源,可以弥补单一模型的缺陷,增强模型的预测能力。
测试结果显示,对女性,语音结果与体重指数的2型糖尿病患病率相结合,在测试集上达到了0.89的准确率、0.91的特异度和0.71的敏感度。
对男性,语音结果与年龄和体重指数的2型糖尿病患病率相结合,在测试集上达到了0.86的准确率、0.89的特异度和0.75的敏感度。
研究负责人Jaycee Kaufman表示,我们在研究过程中确定了2型糖尿病患者语音的变化, 这对于AI大模型检测、筛选2型糖尿病有非常高的应用价值。
语音评估的方法有助于2型糖尿病的早期干预和管理,同时减轻疾病的负担改善医疗效果。
文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。
奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。
“以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。
华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。