(资料图片仅供参考)
▲图源Arxiv据称,SegGPT模型是智源通用视觉模型Painter的衍生模型,具备上下文推理能力,在训练完成后只需要提供示例即可推理并完成对应分割任务,包括图像和视频中的实例、类别、零部件、轮廓、文本、人脸、医学图像等,都可以利用视觉提示词(Prompt)完成分割任务。▲图源ArxivSegGPT也拥有支持任意数量视觉提示的推理能力。能够以第一帧图像和对应的物体掩码作为上下文示例进行自动视频分割,并且可以用掩码的颜色作为物体的ID,进行自动追踪。亚汇网经过查询知悉,此前Meta也发布了其基于AI的SegmentAnythingModel(SAM)模型,具有识别和分离图像和视频中特定对象的能力。而威斯康辛麦迪逊、微软、港科大等机构的研究人员也推出SEEM模型,通过不同的视觉提示和语言提示,一键分割图像、视频。亚汇网的小伙伴们可以从标签: