关于量化精度的问题

您好， 我这边也在进行Sparse4D的TensorRT部署， 目前backbone FP32 + Head FP32 精度，检测效果是正常的， 同对backbone进行了int8的量化， Backbone Int8 + Head FP32， 检测效果正常， 但是 backbone Int8 + Head Int8 检测效果很差。 而且对于Head int8 在速度上相比FP32 基本没有提升。关于这部分您有什么建议吗？大概会是head中的哪一部分存在问题呢？