Giải thích về tư tưởng chính của pseudo labeling. Nêu sự khác biệt giữa online pseudo labeling và offline pseudo labeling?
Giải thích ưu điểm của việc sử dụng exponential moving average weights được đề xuất trong phương pháp Mean Teacher?