## 背景 <!-- 请简要描述此需求的背景 --> <!-- 示例:Googlenet是ImageNet挑战赛(ILSVRC14)第一名的高性能网络结构,常用分类模型之一。MegEngine已经提供相关的OPR支持 --> **COCO数据集测试速度异常**  ## 任务描述 <!-- 请详细描述该任务,任务需要明确、具体 --> <!-- 示例:Googlenet模型复现,训练正常收敛,验收指标符合预期,并将代码提交到models/vision/classification/models[contribution] 下--> 按照首页readme安装megengine和Models,从 [hub.py](https://github.com/MegEngine/Models/blob/11013f6b3b252df71098b27714e39d9802d2520d/official/vision/detection/configs/atss_res50_coco_3x_800size.py#L18) 下载 预训练权重,直接在coco数据集上进行测试。代码未做任何改动,采用8卡测试,最终结果mAP为42.6(正常),但是耗时将近6m30s(不正常),正常8卡时间应该在1min左右 python:3.6 megengine版本:v1.4.0 ## 目标 <!-- 请明确此任务的目标 --> <!-- 示例:数据集ImageNet 对点和论文一致 --> 希望多卡测试速度正常,请确认问题并帮忙修复