ZJUTER0126

Updated 5 months ago Markdown

Updated 6 months ago Python

自从ViT提出之后,在过去的一年里(2021年),基于transformer的模型在计算机视觉各个领域全面超越CNN模型。然而,这很大程度上都归功于Local Vision Transformer模型,Swin Transformer是其中重要代表。原生的ViT模型其计算量与图像大小的平方成正比,而Local Vision Transformer模型由于采用local attention(eg. window attention),其计算量大幅度降低,除此之外,Local Vision Transform

Updated 7 months ago Python

昇腾众智计划:SwinTransformer代码 SwinTransformer使用了一种新的注意力模块,利用滑动窗口的特性对不同patch的像素进行建模,在众多计算机视觉任务中取得了良好的效果

Updated 1 year ago Python