admin管理员组

文章数量:1487745

YoloV8改进策略:Hiera改进YoloV8,实现精度和速度的双提升!

论文:《Hiera:一个没有花哨的分层视觉转换器》

.00989.pdf 现代分层视觉转换器在追求监督分类性能时增加了几种视觉特定组件。 虽然这些组件可以提高准确性和吸引人的浮点运算次数,但增加的复杂性实际上使这些转换器比普通ViT转换器慢。 在本文中,我们认为这种额外的复杂性是不必要的。 通过使用强大的视觉预训练任务(MAE)进行预训练,我们可以从最先进的视觉转换器中去除所有花里胡哨的东西,同时不会丢失准确性。 在此过程中,我们创建了Hiera,这是一种极其简单的分层视觉转换器,它比以前的模型更准确,同时在推理和训练过程中速度更快。 我们在各种图像和视频识别任务上评估了Hiera。 我们的代码和模型可以在。

完整链接:

代码语言:javascript代码运行次数:0运行复制
.2014.3001.5502

YoloV8的官方结果

代码语言:javascript代码运行次数:0运行复制
YOLOv8l summary (fused): 268 layers, 43631280 parameters, 0 gradients, 165.0 GFLOPs
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 29/29 [
                   all        230       1412      0.922      0.957      0.986      0.737
                   c17        230        131      0.973      0.992      0.995      0.825
                    c5        230         68      0.945          1      0.995      0.836
            helicopter        230         43       0.96      0.907      0.951      0.607
                  c130        230         85      0.984          1      0.995      0.655
                   f16        230         57      0.955      0.965      0.985      0.669
                    b2        230          2      0.704          1      0.995      0.722
                 other        230         86      0.903      0.942      0.963      0.534
                   b52        230         70       0.96      0.971      0.978      0.831
                  kc10        230         62      0.999      0.984       0.99      0.847
               command        230         40       0.97          1      0.995      0.811
                   f15        230        123      0.891          1      0.992      0.701
                 kc135        230         91      0.971      0.989      0.986      0.712
                   a10        230         27          1      0.555      0.899      0.456
                    b1        230         20      0.972          1      0.995      0.793
                   aew        230         25      0.945          1       0.99      0.784
                   f22        230         17      0.913          1      0.995      0.725
                    p3        230        105       0.99          1      0.995      0.801
                    p8        230          1      0.637          1      0.995      0.597
                   f35        230         32      0.939      0.938      0.978      0.574
                   f18        230        125      0.985      0.992      0.987      0.817
                   v22        230         41      0.983          1      0.995       0.69
                 su-27        230         31      0.925          1      0.995      0.859
                 il-38        230         27      0.972          1      0.995      0.811
                tu-134        230          1      0.663          1      0.995      0.895
                 su-33        230          2          1      0.611      0.995      0.796
                 an-70        230          2      0.766          1      0.995       0.73
                 tu-22        230         98      0.984          1      0.995      0.831
Speed: 0.2ms preprocess, 3.8ms inference, 0.0ms loss, 0.8ms postprocess per image


改进一

测试结果

代码语言:javascript代码运行次数:0运行复制
YOLOv8l summary: 364 layers, 35794608 parameters, 0 gradients, 144.6 GFLOPs
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 15/15 [00:02<00:00,  6.48it/s]
                   all        230       1412      0.971      0.982      0.993      0.763
                   c17        230        131       0.99      0.992      0.995       0.85
                    c5        230         68      0.956          1      0.995      0.864
            helicopter        230         43      0.964      0.977      0.983      0.617
                  c130        230         85          1      0.984      0.995       0.67
                   f16        230         57      0.996      0.965      0.992      0.694
                    b2        230          2       0.91          1      0.995      0.851
                 other        230         86          1      0.974      0.978      0.567
                   b52        230         70      0.986      0.978      0.989       0.87
                  kc10        230         62          1      0.983       0.99      0.856
               command        230         40      0.993          1      0.995       0.82
                   f15        230        123      0.993      0.976      0.995      0.704
                 kc135        230         91      0.989      0.979      0.992       0.71
                   a10        230         27          1      0.761      0.989      0.474
                    b1        230         20      0.987          1      0.995      0.717
                   aew        230         25      0.951          1      0.995      0.789
                   f22        230         17      0.983          1      0.995      0.774
                    p3        230        105      0.999          1      0.995      0.812
                    p8        230          1      0.848          1      0.995      0.796
                   f35        230         32          1      0.962      0.995      0.567
                   f18        230        125      0.991      0.992       0.99      0.847
                   v22        230         41      0.993          1      0.995      0.724
                 su-27        230         31       0.99          1      0.995      0.874
                 il-38        230         27      0.989          1      0.995      0.863
                tu-134        230          1      0.826          1      0.995      0.895
                 su-33        230          2          1          1      0.995      0.697
                 an-70        230          2      0.897          1      0.995      0.854
                 tu-22        230         98      0.999          1      0.995      0.844

运算量下降,精度提升!!!

改进二

测试结果

代码语言:javascript代码运行次数:0运行复制
YOLOv8l summary (fused): 277 layers, 46783152 parameters, 0 gradients, 172.5 GFLOPs
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 15/15 [00:02<00:00,  5.55it/s]
                   all        230       1412      0.962      0.973      0.992       0.75
                   c17        230        131      0.979      0.992      0.995      0.826
                    c5        230         68      0.958      0.995      0.994      0.841
            helicopter        230         43      0.977      0.972      0.982      0.614
                  c130        230         85          1       0.99      0.995      0.656
                   f16        230         57      0.991      0.965      0.992      0.674
                    b2        230          2      0.887          1      0.995      0.648
                 other        230         86      0.949      0.942      0.974      0.538
                   b52        230         70      0.986      0.979      0.989      0.845
                  kc10        230         62      0.993      0.984      0.989       0.84
               command        230         40      0.989          1      0.995       0.85
                   f15        230        123      0.973      0.992      0.994      0.715
                 kc135        230         91      0.976      0.989      0.992      0.712
                   a10        230         27          1      0.586      0.967      0.523
                    b1        230         20          1      0.967      0.995      0.722
                   aew        230         25      0.922          1      0.995       0.79
                   f22        230         17       0.98          1      0.995      0.778
                    p3        230        105      0.992          1      0.995      0.809
                    p8        230          1      0.816          1      0.995      0.697
                   f35        230         32      0.968      0.932      0.992      0.573
                   f18        230        125      0.989      0.992      0.992      0.844
                   v22        230         41      0.992          1      0.995      0.734
                 su-27        230         31      0.989          1      0.995       0.86
                 il-38        230         27      0.987          1      0.995      0.854
                tu-134        230          1      0.806          1      0.995      0.995
                 su-33        230          2          1          1      0.995      0.734
                 an-70        230          2      0.879          1      0.995      0.751
                 tu-22        230         98      0.996          1      0.995      0.833
Speed: 0.2ms preprocess, 4.8ms inference, 0.0ms loss, 0.7ms postprocess per image
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。原始发表:2024-01-22,如有侵权请联系 cloudcommunity@tencent 删除测试论文模型视频性能

本文标签: YoloV8改进策略Hiera改进YoloV8,实现精度和速度的双提升!