Automated red blood cell classification on blood smear images helps hematologist to analyze RBC lab results in less time and cost. Overlapping cells can cause incorrect predicted results that have to separate into multiple single RBCs before classifying. To classify multiple classes with deep learning, imbalance problems are common in medical imaging because normal samples are always higher than rare disease samples. This paper presents a new method to segment and classify red blood cells from blood smear images, specifically to tackle cell overlapping and data imbalance problems. Focusing on overlapping cell separation, our segmentation process first estimates ellipses to represent red blood cells. The method detects the concave points and then finds the ellipses using directed ellipse fitting. The accuracy is 0.889 on 20 blood smear images. Classification requires balanced training datasets. However, some RBC types are rare. The imbalance ratio is 34.538 on 12 classes with 20,875 individual red blood cell samples. The use of machine learning for RBC classification with an imbalance dataset is hence more challenging than many other applications. We analyze techniques to deal with this problem. The best accuracy and f1 score are 0.921 and 0.8679 on EfficientNet-b1 with augmentation. Experimental results show that the weight balancing technique with augmentation has the potential to deal with imbalance problems by improving the f1 score on minority classes while data augmentation significantly improves the overall classification performance.


翻译:血液涂片图像的自动红血细胞分类有助于血友病学家分析红细胞实验室结果的时间和成本减少。 重叠细胞可以导致不正确的预测结果, 在分类之前必须分为多个单一的RBC。 要将多类分类并进行深层学习, 不平衡问题在医学成像中是常见的, 因为正常的样本总是高于罕见的疾病样本。 本文提出了一个新方法, 将红血细胞从血液涂片中进行分解和分类, 特别是处理细胞重叠和数据不平衡问题。 侧重于重叠的细胞分离, 我们的分解过程首先估计省略出以代表红血细胞。 这种方法可以探测锥形点, 然后用定向的 Ellips 安装来发现椭圆。 20个血液涂片图像的准确性为 0. 889 。 但是, 某些 RBC 类型是罕见的。 12类的不平衡率为34.538, 使用20 875 个红细胞样本样本对红细胞进行分解, 具体解决细胞分类的机器学习比许多其他应用更具有挑战性。 我们分析处理这一问题的技术。 最佳的准确性和f1 分分分数是0. 921 和0. 和0. 869 分分比分比分比分数 水平, 水平 水平 水平 水平 水平 提高 提高 提高 增长 提高 提高 提高 增长 提高 提高 提高 提高 提高 提高 升级 提高 提高 提高 提高 提高 提高 提高 水平 提高 提高 提高 提高 提高 升级 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 水平 提高 提高 提高 提高 提高 提高 提高 提高 水平 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 水平 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 水平 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高 提高

0
下载
关闭预览

相关内容

最新《Transformers模型》教程,64页ppt
专知会员服务
276+阅读 · 2020年11月26日
应用机器学习书稿,361页pdf
专知会员服务
57+阅读 · 2020年11月24日
最新《时序分类:深度序列模型》教程,172页ppt
专知会员服务
42+阅读 · 2020年11月11日
强化学习最新教程,17页pdf
专知会员服务
167+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
39+阅读 · 2019年10月9日
TorchSeg:基于pytorch的语义分割算法开源了
极市平台
20+阅读 · 2019年1月28日
上百份文字的检测与识别资源,包含数据集、code和paper
数据挖掘入门与实战
17+阅读 · 2017年12月7日
【推荐】YOLO实时目标检测(6fps)
机器学习研究会
20+阅读 · 2017年11月5日
深度学习医学图像分析文献集
机器学习研究会
17+阅读 · 2017年10月13日
【推荐】全卷积语义分割综述
机器学习研究会
19+阅读 · 2017年8月31日
Arxiv
6+阅读 · 2018年1月14日
VIP会员
相关VIP内容
最新《Transformers模型》教程,64页ppt
专知会员服务
276+阅读 · 2020年11月26日
应用机器学习书稿,361页pdf
专知会员服务
57+阅读 · 2020年11月24日
最新《时序分类:深度序列模型》教程,172页ppt
专知会员服务
42+阅读 · 2020年11月11日
强化学习最新教程,17页pdf
专知会员服务
167+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
39+阅读 · 2019年10月9日
Top
微信扫码咨询专知VIP会员