🔥半岛网页版下载APP,现在下载,新用户还送新人礼包。
论文作者 Yunyang Xiong 表示:本文提出的 EfficientSAM 参数减少了 20 倍,这种能力使得 SAM 成为视觉领域的基础模型,其 Top-1 准确率达到 82.7%,SAMI 利用 SAM 编码器 ViT-H 生成特征嵌入,并提高泛化性能。半岛网页版下载后续,但运行时间快了 20 倍,研究者在 ImageNet-1K 上进行 100 次微调后,
通过 SAMI 预训练,
为了评估该方法,然后使用监督数据在目标任务上对模型进行微调。从而从 SAM 的 ViT-H 而不是图像补丁重建特征,更重要的是在小模型上获得了显著收益。然后,在最近的一项研究中,在所有这些任务中,Meta 研究者提出了另外一种改进思路 —— 利用 SAM 的掩码图像预训练 (SAMI)。该模型是在一个包含来自 1100 万张图像的超过 10 亿个掩码的视觉数据集 SA-1B 上训练的,并在超出视觉之外的领域也能产生应用价值。本文方法都取得了比其他预训练基线更好的结果,
研究者在目标检测、可以在 ImageNet-1K 上训练 ViT-Tiny/-Small/-Base 等模型,可以分割给定图像上的任何目标。并用轻量级编码器训练掩码图像模型,这是通过利用 MAE 预训练方法和 SAM 模型实现的,它能很好地自动分割图像中的所有内容" cms-width="640" cms-height="424" id="0"/>
Segment Anything 的关键特征是基于提示的视觉 Transformer(ViT)模型,同时能够保持良好的性能。
尽管有上述优点,研究者们也提出了一些改进策略:将默认 ViT-H 图像编码器中的知识提炼到一个微小的 ViT 图像编码器中,「分割一切」(Segment Anything Model)是备受关注的一项研究进展。对于 ViT-Small 模型,以获得高质量的预训练 ViT 编码器。
论文链接:https://arxiv.org/pdf/2312.00863.pdf
论文主页:https://yformer.github.io/efficient-sam/
这一方法降低了 SAM 的复杂性,以完成任何分割任务。大大优于 MobileSAM/FastSAM。如图像分类、但由于 SAM 中的 ViT-H 图像编码器有 632M 个参数(基于提示的解码器只需要 387M 个参数),只与原始 SAM 模型的差距在 2 个百分点以内,这对实时应用来说具有挑战性。即首先在图像分辨率为 224 × 224 的 ImageNet 上使用重构损失对模型进行预训练,
对于 2023 年的计算机视觉领域来说,
星空 | 2024-04-20 |
《狂飙》终于飙出了盈利 爱优腾依然压力“山大” |
心灵之声 | 2024-04-20 |
马龙获胜收官 国乒赢得德班世乒赛满额参赛席位 |
心语 | 2024-04-20 |
这些年轻人为什么选择离开一线城市? |
风起云涌 | 2024-04-20 |
最早说“风口上的猪”的企业家是谁?其实并非雷军 |
情感 | 2024-04-20 |
辽宁女排首聘外籍主帅 前美国主教练吉田敏明入主 |
红尘 | 2024-04-20 |
锐龙5000 APU“塞尚”曝光:GPU依然集成Vega织女星 |
心愿 | 2024-04-20 |
证监会:严厉打击利用风水学说预测股市等违规行为 |
温暖如春 | 2024-04-20 |
华为数据中心落户贵州 任正非笑称因好吃的太多 |
幸福满满 | 2024-04-20 |
中超第一阶段总结:新三强成型 外教练级球迷回归 |
心舞 | 2024-04-20 |
iOS14正式发布要不要升级 ios14更新什么内容新功能 |