ComfyChat

Rough LLM Interpreter of ComfyUI

简介
架构图
部署
模型地址
项目发展方向
数据
工作内容
工作进度

简介

本项目依托书生·浦语大模型实战营活动，以期基于LLMs能力，针对ComfyUI构建一个粗糙但相对完善的解释器；帮助对ComfyUI、Stable Diffusion感兴趣的朋友快速上手是本项目的宗旨。非常感谢上海人工智能实验室提供此次机会，同时也非常感谢本项目涉及到的开源项目和个人！！！

因兴趣原因，使用过各类Stable Diffusion模型的GUI项目，如stable diffusion webui，Fooocus，ComfyUI等，ComfyUI节点式的工作方式、活跃的开源社区为其开发的各类功能强大的自定义节点和工作流，均赋予了ComfyUI强大能力，但同时也使其学习成本较高，本项目通过收集社区各中数据构建数据集，使用LLM技术，构建一个降低ComfyUI学习成本的工具。

架构图

部署

本项目服务主体代码在server路径下，demo.py是服务入口，运行起来不太复杂，可按以下步骤操作：

推荐使用conda或miniconda新建一个python310的虚拟环境并激活，即'conda create -n ComfyChat python=3.10'、'conda activate ComfyChat'
requirements.txt中已指定主要依赖库和版本，在ComfyChat中安装即可。不推荐直接使用'pip install -r requirements.txt'安装，因为依赖库较多，一个库安装失败会导致所有库安装失败。requirements.txt中各库版本是项目开发环境中使用版本，应该不会出现版本冲突，但不保证。
拉取本项目代码：git clone --recurse-submodules https://github.com/ZZfive/ComfyChat.git
为方便模型管理，服务依赖模型可统一存放在weights路径下，其中主要存放Whisperx和GPT-SoVITS依赖模型，LLM和Embedding的模型也能存放在此路径下，只需在config.ini正确配置即可。Whisperx依赖模型在demo.py运行时会自动下载至weights中，GPT-SoVITS依赖模型则需手动下载。先在weights路径下创建GPT-SoVITS，将相关模型存放在weights/GPT-SoVITS中；此路径结构图如下所示，其中weights/GPT_SoVITS/pretrained_models路径下存放的是GPT-SoVITS项目提供的预训练模型，可在该项目中找到下载地址；而剩下的人物角色模型是开源社区贡献，可在此处下载
若想开启comfyui，需要先准备一些必要模型，如Stable-diffusion、Lora、VAE、embeddings和controlnet等，可以将此类模型都存放在weights路径下，然后修改visual_genrations/comfyui/extra_model_paths.yaml.example文件。先将文件名中的.example删掉，改为extra_model_paths.yaml，然后再按以下截图中设置模型路径。模型准备好后，将config.ini中comfyui配置中的enable设置为1
执行完上述操作后，正确设置config.ini，'python demo.py'就能成功运行服务

模型地址

项目发展方向

已进行
- 微调：对InternLM2、LLaMA3等LLMs模型微调
- RAG：构建ComfyUI知识库，基于RAG开源框架，改善LLMs回答准确性
- 多模态接入：将ASR、TTS、生图等功能集成
待开展
- 工作流训练：ComfyUI工作流本质是表征各个节点相连接的json文档，可能类似于code，尝试通过训练测试LLMs能否理解、构建工作流

数据

数据源

各默认节点的解释说明--comfyui项目文档及网上数据，社区的节点说明文档
- https://github.com/BlenderNeko/ComfyUI-docs
自定义节点的解释说明--各类自定义节点项目中的说明文档
- 从 ComfyUI-Manager收集的自定义节点项目列表文件中构建批量下载
- https://github.com/6174/comflowy
- https://github.com/get-salt-AI/SaltAI-Web-Docs
- https://github.com/CavinHuang/comfyui-nodes-docs
工作流文件--仍未实际开展
- c站
- github上的个人汇总
- https://comfyworkflows.com
- https://openart.ai/workflows

工作内容

数据构建

数据收集
- comfyui说明数据爬取
  - 社区说明文档信息收集
  - comfyui manager中的节点列表信息收集
  - 网络上关于comfyui的信息收集--ing
  - 部署一个视频、音频转文本模型，收集相关文本--whisperx
- comfyui工作流及对应文本说明数据爬取
  - 待开展
- 去重？
- 安全过滤？
数据集构建
- 指令微调所需的对话数据构建：已构建v1、v2数据，详细数据跳转至此处

训练

LLaMA3微调
InternLM2.5-7b微调
InternLM2-7b微调
InternLM2-1.8b微调

服务部署

基于微调后LLMs的对话服务部署
RAG服务搭建
服务接入TTS
服务接入生图

工作进度

致谢

特别感谢以下团队、项目或人员

上海人工智能实验室和书生·浦语团队
ComfyUI
https://github.com/BlenderNeko/ComfyUI-docs
https://github.com/6174/comflowy
https://github.com/get-salt-AI/SaltAI-Web-Docs
https://github.com/CavinHuang/comfyui-nodes-docs
茴香豆
whisperX
whispercpp
GPT-SoVITS
Chattts
旭_1994的CSDN博客

Name		Name	Last commit message	Last commit date
Latest commit History 192 Commits
assets		assets
audio		audio
data		data
finetune		finetune
server		server
visual_genrations		visual_genrations
weights		weights
.gitattributes		.gitattributes
.gitignore		.gitignore
.gitmodules		.gitmodules
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ComfyChat

简介

架构图

部署

模型地址

项目发展方向

数据

工作内容

数据构建

训练

服务部署

工作进度

致谢

About

Releases

Packages

Languages

ZZfive/ComfyChat

Folders and files

Latest commit

History

Repository files navigation

ComfyChat

简介

架构图

部署

模型地址

项目发展方向

数据

工作内容

数据构建

训练

服务部署

工作进度

致谢

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages