🗒️LLM-白泽🐲LLM用chatgpt生成多轮完整对话数据,而不是QA对,从而有更好的效果。同时使用chatgpt做了一个对齐方式代替人类的对齐方式(SDF,Self-Distillation with Feedback)2023-6-30 chatgpt 训练 PEFT