AutoLabelimage pro max —— 一个简单的yolo自动标注小工具

之前开发时遇到了需要标注yolo格式数据的情况,当时用ai简单搜了一下,虽然有一些借助自动标注的解决方案,但是基本都是半监督式的标注方法,对于一些比较小众的检测类别,初始的数据标注还是需要人工来做,最终找了半天也没找到可以解决我需求的应用,于是只能去人工慢慢标注了。

最近几天正好在本地部署一些小模型,干脆拿来试试效果,结果发现对于没有专门预训练的模型来说,虽然可以正确理解图片的意思,但是很难返回一个比较精准的坐标。再后来才发现有一些预训练后支持直接输出相对坐标位置的模型,最终经过测试发现Qwen3VL-8B-Instruct-Q4_K_M在我的5070上跑起来效果最好,就是准确度略差,位置总会差一些。再后来我继续问ai,发现很多半监督的自动标注方法会借助sam来精修,从而让box更精准,那这个方法应该同样可以解决我的问题,于是在前两天趁着gpt team还没死的时候用codex把程序写出来了。

github.com

图片

GitHub - Mitsuha3333/AutoLabelimage-pro-max: 依托Qwen3vl的能力,实现yolo自动化标注,解决初始数据集标注的难题

依托Qwen3vl的能力,实现yolo自动化标注,解决初始数据集标注的难题

我这里是用本地部署的Qwen3VL-8B-Instruct-Q4_K_M跑的,因为对于我的需求而言已经足够精准了,如果有更高要求,只要是支持多模态的openai格式的接口,改一下config里的url就可以用。如果有更好的提示词,也可以在config里直接修改。
以前没有什么开发经验,所以这就是为了解决我自己工作中的问题而去做的一个很简单的小工具,如果正好有大佬也觉得有用,可以帮忙点个star,同时也欢迎同样有yolo数据标注需求的大佬们多多交流!

大佬好强,mark一下以后可能会用到

感谢大佬正好和AnyLabeling一起服用

可以的 刚好之前也用多模态尝试过,不过有一些过于复杂的还是没办法全自动

是的,太复杂的场景或者小目标检测就比较麻烦了

最近刚好要标几张数据

感谢大佬。