Skip to content

Latest commit

 

History

History
23 lines (18 loc) · 1.68 KB

readme.md

File metadata and controls

23 lines (18 loc) · 1.68 KB

模型规模和开源策略: InternLM-7B:中等规模的模型,适合低成本部署和社区使用。 InternLM-20B:更大的模型,平衡了性能和资源消耗,适合商业应用。 InternLM-123B:顶级模型,非开源,具有强大的推理和知识能力,用于高端应用。

从模型到应用的转化: 对于复杂的业务场景,首先进行模型微调,包括全参数微调或部分参数微调。 根据需求构建智能体,使其能够与数据库交互或调用外部API。

全链路开源开放体系: 书生-万卷:提供了丰富的开源训练数据,包括文本、图像-文本和视频数据。 InternLM-Train:预训练工具,支持多显卡扩展和并行性能优化,兼容如HuggingFace等主流训练生态,支持多种语言模型,开箱即用。 XTurner:微调工具,适配多种微调算法,与开源生态兼容,具有显著的显存优化效果。提供增量续训和有监督微调功能。

GPU部署和模型优化: LMDeploy:专为GPU环境设计的部署解决方案,包括4b权重量化和8b KV量化,推理引擎进行了优化改造,提供与大模型兼容的生态接口。

评测和智能体应用: OpenCompass:评测工具,涵盖多个测试方面(如学科、语言、知识、理解、推理、安全),提供自定义评测数据集和大模型评测接口。 Lagent 和 AgentLego:智能体应用工具。 Lagent:智能体框架,支持多种智能体工作流程能力,兼容多种大语言模型,提供多种工具和多模态工具调用接口。 AgentLego:提供多模态智能体工具集合,支持多个智能体系统(如Langchain),并提供远程工具部署和调试支持。