背景
最近需要对一批图像进行编码,这些图像也没类别标注,那么直接上resnet训练拿最后层做嵌入也不行。预训练的resnet也不太好,这批图像和COCO数据库的类别没啥关系。
后面想用clip,但这批图像也没文本标注,最后用了moco
moco可以实现自监督的对比学习,那么其中的q编码器可以作为图像的嵌入。而且这些嵌入,还可以做各种各样的下游任务,好用😘
MOCO
githib: https://github.com/facebookresearch/moco?login=from_csdn
源码还算好读,脸书的编码规范真不错,看看注释基本就懂了
评论区