然而,使用机器学习来进行血细胞计数以诊断疾病,而不是使用昂贵且通常精度较低的细胞分析仪,这是一项非常劳动密集型的工作,因为在机器学习模型的培训中,需要大量的人工注释工作。然而,Benihang大学的研究人员开发了一种新的训练方法,可以自动完成大部分的训练活动。
4月9日,他们的新训练计划发表在《电子人与仿生系统》杂志上。
血液中细胞的数量和类型通常在疾病诊断中起着至关重要的作用,但通常用于进行此类血细胞计数的细胞分析技术鈥攊解决悬浮在液体中的细胞的物理和化学特性的检测和测量鈥攁价格昂贵,需要复杂的准备工作。更糟糕的是,由于温度、pH值、电压和磁场等各种影响,细胞分析仪的准确度仅为90%左右,这些影响可能会使设备混淆。
为了提高准确性、降低复杂性和降低成本,许多替代方法的研究最近集中在使用计算机程序对高密度血液采集的照片进行“分割”上铿乶连接到显微镜的ition摄像头。分割涉及到对照片中出现的内容逐像素进行标记的算法,在这种情况下,图像的哪些部分是细胞,哪些部分不是细胞鈥攊n本质,计算图像中的细胞数。
对于只显示单一类型细胞的图像,此类方法可以达到相当高的精度,但在面对具有多种类型细胞的图像时,其性能较差。因此,近年来,为了解决这个问题,研究人员转向了卷积神经网络(CNN)鈥攁 反映人类视觉皮层连接结构的机器学习类型。
为了让美国有线电视新闻网执行这项任务,它必须首先接受“训练”,了解人类手动标记的数千张细胞图像上的细胞是什么和不是什么。然后,当喂食一张新的未标记图像时,它可以识别并计数其中的细胞。
“但是,即使在专家的帮助下,这种手动标记也很费劲和昂贵,”该论文的合著者、北京航空航天大学机械工程与自动化系教授Guangdong Zhan说,“这违背了一种比细胞分析仪更简单、更便宜的替代品的目的。”
因此,北京航空航天大学的研究人员开发了一种新的CNN训练方案,即U-Net,这是一种完全卷积的网络分割模型,自2015年首次开发以来,已广泛应用于医学图像分割。
在新的训练方案中,CNN首先在数千张图像上进行训练,其中只有一种类型的细胞(取自小鼠的血液)。
这些单细胞类型的图像由传统算法自动“预处理”,这些算法可以减少图像中的噪声,提高图像质量,并检测图像中物体的轮廓。然后执行自适应图像分割。后一种算法计算黑白图像中不同级别的灰度,如果图像的一部分超过某个灰度阈值,则该算法将其分割为不同的对象。使该过程具有自适应性的是,它不是根据固定的灰度阈值分割出部分图像片段,而是根据图像的局部特征进行分割。
将单细胞类型的训练集呈现给U-Net模型后,使用一小组多细胞类型的手动注释图像对模型进行微调。相比之下,仍保留了一定数量的手动注释,需要人类标记的图像数量从以前的数千张下降到了600张。
为了测试他们的训练方案,研究人员首先在相同的小鼠血液样本上使用传统的细胞分析仪进行独立的细胞计数,以比较他们的新方法。他们发现,他们的训练方案对多细胞类型图像的分割准确率为94.85%,这与人工标注的多细胞类型图像的训练水平相同。
该技术还可以应用于更高级的模型,以考虑更复杂的分割问题。
由于新的训练技术仍然需要一定程度的手动注释,研究人员希望继续开发一种用于注释和训练模型的全自动算法。