书生浦语作业 第一节笔记
上海人工智能实验室目前开放了大模型的全链条开源体系,涵盖数据集、预训练、微调、部署、评测、应用等模块,对从事大模型相关工作、研究的同学比较友好,消费级的显卡也可以训练大模型
书生包含大量的数据
融合Hybird Zero技术,可大大加速训练
开发XTuner微调框架,适配HuggingFace等主流开源模型库,并自带加速库,适配多种硬件
一个规范标准的大模型评测体系可以更好的帮助我们对大模型的能力进行全面的测评
模型部署也融合了一些主流的推理优化技术,本人对这块比较感兴趣,希望可以深入研究一下