随着检验仪器和技术的日新月异,大量的数据从每一台检验仪器中源源不断地产生,检验科宛如一个数据「工厂」,但这些数据却如原始资料一样未被有效利用,仅仅作为结果数据回传到临床但缺乏临床意义的解读,常常会让人产生「如入宝山而空手回」的遗憾。
研究者分析检验数据的难点在于难以掌握数据分析技术。传统提出假设做单因素验证关联性的研究方法效率有限,数据利用的深度停留在人工观察的阶段。也有研究者注意到人工智能机器学习广泛应用于各行各业,但在检验领域尚属于起步阶段。
作为这方面的探索者,中山大学附属第一医院检验科陈培松博士从 2019 年开始便利用机器学习探索数据挖掘在检验科的应用。当时陈博士接手了一个肺癌的筛查课题,使用传统统计方法比较局限,陈博士便自学了 R 语言,通过构建决策树模型取得了良好的分析效果。但陈博士觉得,R 语言对新手不太友好,用起来会有种种困难,大大拉长了科研周期。
2020 年,贝克曼库尔特与深睿医疗联合发布中国检验行业具备 AI 算法的大数据科研平台——DxAI 智研平台,当时陈博士和临床医生共同开展了一项评估低覆盖度全基因组测序(LCWGS)方法在卵巢癌诊断的可用性研究,并应用 DxAI 智研平台进行相关数据分析,逐渐对平台有了更深入的了解与体验。
一键生成模型
提升医学研究效率
DxAI 智研平台是一款不用「敲代码」的机器学习工具,并将机器学习模型的诸多步骤可视化为可交互界面,在 14 种 AI 机器学习算法全方位支持下,一键即可快速生成机器学习预测模型,同时实现一站式管理科研课题,帮助研究者提升研究效率。
陈博士使用 DxAI 智研平台对患者病理学和 FIGO 进行分期总结,结合临床指标的差异性分析和Spearman 相关性分析,探索常见的肿瘤标志物和 LCWGS 指标之间的相关性,并使用了 DxAI 智研平台内置的 Delong 检验比较卵巢恶性肿瘤风险算法(ROMA 指数)和恶性肿瘤风险算法(RM 指数)之间是否有显著性差异,通过 DxAI 智研平台实现数据的可视化分布(如图 1 所示),包括各项指标在不同卵巢癌分期中的分布。
图 1 ROMA 指数和 RM 指数的 ROC 曲线比较
最终,DxAI 智研平台帮助陈博士成功评估了低覆盖度全基因组测序方法在卵巢癌诊断中的可用性,并在知名国际期刊《Journal of Translational Medicine》发表相关科研成果论文----Chen et al. J Transl Med (2021) 19:369[1]。
平台简便易用
无统计背景也能快速上手
陈培松博士认为,机器学习在检验数据挖掘方面的潜力非常大,在应用方面,有一个简便易用的工具至关重要。因为不少检验科的工作人员缺乏统计背景,常常需要有专门团队去做统计分析工作。
陈博士通过自身使用 DxAI 智研平台的经验,发现 DxAI 智研平台是一款友好的工具,正好满足了这一需求。平台能够帮助研究者在海量数据里找出有用的指标,在建模的过程中,平台也提供了智能化解决方案,无需编写代码即可获得多个模型并自动调整参数,相关的结果产出后可以直接用于发表。
在 DxAI 智研平台的帮助下,中山大学附属第一医院检验科的数据探索速度大大提升,将之前 12~15 个月的研究时间缩短到 6 个月,特别是在数据处理和分析阶段,所耗时间缩短到以小时计算。在过去一年中,科室越来越多的人开始使用 DxAI 智研平台去完成研究工作,在平台上积累课题数已经有 100 多个,并保存了各种各样疾病研究模型。
接下来,贝克曼库尔特还将继续推出 DxAI 智研平台赋能疾病研究系列报道,带你深入医院案例,领略检验大数据蕴含的独特价值,敬请期待。
往期精彩内容
人工智能赋能疾病研究,助力挖掘检验数据宝藏
参考文献
[1] Chen, M., Zhong, P., Hong, M., et al. Applying low coverage whole genome sequencing to detect malignant ovarian mass. Journal of translational medicine, 19(1): 369.
文章内容来自网络,如有侵权,联系删除、联系电话:023-85238885
参与评论
请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。
评论区