🗒️多任务训练如何加强 zero-shot 泛化:我的学习笔记LLM我从多任务提示训练理解 zero-shot 泛化:任务多样性和提示多样性会影响模型迁移到未见任务的能力。2025-11-6 LLM 训练 DATA
🗒️LLM-白泽🐲LLM用chatgpt生成多轮完整对话数据,而不是QA对,从而有更好的效果。同时使用chatgpt做了一个对齐方式代替人类的对齐方式(SDF,Self-Distillation with Feedback)2023-6-30 chatgpt 训练 PEFT