跳到主要内容

1 篇文档带有标签「alpaca」

查看所有标签

SFT 指令微调

数据格式、chat template 与 loss mask,把 base model 训成能听指令的 instruct model