摘要:文本提出一种融合知识蒸馏(KD)和对比学习(CL)的协同训练范式。这种范式凭借知识蒸馏机制,将多个教师模型所包含的丰富语义逻辑和泛化知识迁移到轻量级学生模型上;同时,它还会利用对比学习策略,在特征空(试读)...