Skip to content

我应该选什么模型?

Ziqing Yang edited this page Apr 18, 2023 · 9 revisions

以下给出了中文LLaMA和Alpaca模型的基本对比以及建议使用场景(包括但不限于)。

对比项 中文LLaMA 中文Alpaca
训练方式 传统CLM 指令精调
输入模板 不需要 需要符合模板要求(llama.cpp/LlamaChat等已内嵌)
适用场景 ✔️ 文本续写:给定上文,让模型继续写下去 1、指令理解(问答、写作、建议等)
2、多轮上下文理解(聊天等)
不适用场景 ❌ 指令理解 、多轮聊天等 文本无限制自由生成
llama.cpp 使用-p参数指定上文 使用-ins参数启动指令理解+聊天模式
text-generation-webui
LlamaChat 加载模型时选择"LLaMA" 加载模型时选择"Alpaca"
已知问题 如果不控制终止,则会一直写下去,直到达到输出长度上限。 目前版本模型生成的文本长度相对短一些,比较惜字如金。
Clone this wiki locally