方法:本文介绍了一种新型的脉冲自注意机制,名为双脉冲自注意(DSSA),以及基于该机制的脉冲视觉Transformer架构——SpikingResformer。DSSA通过双脉冲转换生成脉冲自注意,完全基于脉冲驱动且与SNN兼容。SpikingResformer结合了ResNet多阶段设计和提出的脉冲自注意机制,实现了更好的性能和更低的参数和能耗。
创新点:
方法:论文将Vision Transformer(ViT)和ResNet-50架构整合到一个名为EfficientRMT-Net的新模型中,可以有效准确地识别各种土豆叶病。EfficientRMT-Net利用卷积神经网络(CNN)模型进行不同特征提取,并采用深度卷积(DWC)来降低计算需求。还采用阶段块结构来改善可扩展性和敏感区域检测,增强不同数据集的可迁移性。
创新点:
方法:通过结合Swin Transformer和ResNet,开发一种用于低光图像增强的Swin Transformer和ResNet基于的生成对抗网络(STRN)。STRN的生成器由浅层特征提取、深层特征提取和高质量图像重建模块组成,通过使用RSTB-DRB块来计算全局和局部注意力。
创新点:
方法:论文提出了一种基于ResNet和Vision Transformer(ViT)模型的混合方法,旨在改进心肌梗死(MI)的检测准确性。通过将ResNet和ViT模型提取的特征进行融合,该方法结合了全局和局部特征,提供了更全面的心肌梗死模式表示。
创新点:
RLPROMPT: Optimizing Discrete Text Prompts with Reinforcement Learning