MachineLearningPractice 一、GhatGLM文档问答(chatglm_qa) 使用ChatGLM+langchain实现文档问答,使用gradio搭建简单UI,支持实时上传文档。 详见:chatglm_document_qa_READM.md 二、视觉版大语言模型(vision_llm) 利用yolo和CLIP模型生成图片描述,基于生成的图片描述进行图文问答。界面使用streamlit编写。 三、图像搜索(image_search) 基于Vit模型提取图像embedding,使用向量数据库进行相似度搜索,以实现图搜图功能。