基于YoloV8的药丸/片剂类型识别

文摘   2024-11-14 07:45   重庆  

点击下方卡片,关注“OpenCV与AI深度学习

视觉/图像重干货,第一时间送达!

药丸鉴定问题

    想象一下这个场景:你手里有一颗药丸,但你不太确定它是什么。也许标签已经磨损,或者您在药柜中发现它松动了。正确识别药物对您的安全和健康至关重要。这就是计算机视觉的用武之地。

    药丸识别的工作原理

    • 图像捕获:要开始识别过程,您需要使用智能手机或专用设备为药丸拍摄清晰的照片。照明和角度会影响识别的准确性,因此捕获高质量的图像至关重要。

    • 图像预处理:获得图像后,将使用计算机视觉算法对其进行预处理。这涉及降噪、对比度增强和图像大小调整等任务,以确保为分析提供最佳输入。

    • 特征提取:下一步是从图像中提取特征。特征可能包括药丸的形状、颜色、标记和任何唯一标识符。

    • 模式识别:然后,计算机视觉模型分析这些特征,并将它们与已知药物的庞大数据库进行比较。该数据库包含有关各种药丸的外观、标记和特征的信息。

    • 分类:根据比较,系统会对药丸进行分类,并为您提供其名称、剂量和其他相关信息。

YOLO 工作流程

    • 输入图像:YOLO 将图像作为其输入。此图像可以是从照片到医学扫描或视频帧的任何内容。

    • 卷积神经网络 (CNN):输入图像通过深度卷积神经网络 (CNN) 进行处理。这个 CNN 在特征提取和理解图像内容方面起着至关重要的作用。

    • 网格划分:YOLO 将处理后的图像划分为网格。此网格中的每个单元格都负责对其边界内存在的对象进行预测。这种基于网格的方法可实现高效的本地化对象检测。

    • 边界框:在每个网格单元格中,YOLO 预测将对象紧密包围的边界框(矩形)。这些边界框指定检测到的对象的位置和大小。

    • 类预测:同时,YOLO 会预测边界框内包含的每个对象的类。例如,在医学成像中,它可能会预测物体是骨折、关节还是正常组织。

    • 置信度分数:YOLO 为每个预测的边界框分配置信度分数。这些分数表示模型对预测准确性的置信度。高置信度分数表示边界框包含有效对象的可能性很高。

    • Non-Maximum Suppression(非极大值抑制):为了优化结果并消除重复或重叠的预测,YOLO 采用了一种称为非极大值抑制的技术。此步骤可确保仅保留最准确和最相关的预测

    • 输出:YOLO 的最终输出包括边界框、其关联的对象类和置信度分数。这些结果提供了对输入图像中检测到的对象的全面了解。

    Roboflow Pill 分类数据集:

https://universe.roboflow.com/drug1-dr14z/drug-swwtp
# replace with your own api key#visit the above roboflow dataset liunk and download dataset section and #try download code for yolov8 copy paste that#dont copy pasrte this my api key shouldnt work for you..privacy
!pip install roboflow
from roboflow import Roboflowrf = Roboflow(api_key="your api key here")project = rf.workspace("drug1-dr14z").project("drug-swwtp")dataset = project.version(1).download("yolov8")
!pip install ultralyticsfrom ultralytics import YOLOmodel = YOLO('yolov8n.pt')model.train(data='/content//data.yaml',epochs=70) #paste path properly in ur colab of data.yaml
    在 Pycharm 或 Vscode 中使用本地自定义训练 best.pt
!pip install ultralyticsfrom ultralytics import YOLOmodel=YOLO("best.pt") #download fron runs/detect/train/weights/best.pt supoose trained in GColabresults=model(source="PillVideo.mp4",save=True,conf=0.4)
    使用计算机视觉进行片剂/药丸类型名称检测的好处
    • 安全:准确的药丸识别对于避免用药错误至关重要,尤其是对于那些服用多种药物的人。
    • 可及性:这项技术使任何拥有智能手机或支持摄像头的设备的人都可以进行药丸识别。
    • 速度:计算机视觉算法可以在几秒钟内识别药丸,从而快速提供结果。
    • 医疗保健援助:医疗保健专业人员可以使用这项技术来验证处方并改善患者护理。

—THE END—

下载1:Pytorch常用函数手册

在「OpenCV与AI深度学习公众号后台回复:Pytorch函数手册即可下载学习全网第一份Pytorch函数常用手册,包括Tensors介绍、基础函数介绍、数据处理函数、优化函数、CUDA编程、多处理等十四章内容。

下载2:145个OpenCV实例应用代码
在「OpenCV与AI深度学习」公众号后台回复:OpenCV145即可下载学习145个OpenCV实例应用代码(Python和C++双语言实现)。

欢迎加入CV学习交流微信

觉得有用,记得点个赞和在看 

OpenCV与AI深度学习
专注计算机视觉、深度学习和人工智能领域干货、应用、行业资讯的分享交流!
 最新文章