Ask-Anything [Paper]
目前,Ask-Anything是一个简单而有趣的与视频聊天工具。
我们的团队正在努力建立一个智能且强大的用于视频理解的聊天机器人。
[VideoChat-7B-8Bit] End2End ChatBOT for video and image.
|
|
🚀: 我们通过指令微调更新了video_chat
!相关内容可见我们的技术报告。相关的指令微调数据可见InternVideo。video_chat
之前版本已经移动到video_chat_with_chatGPT
。
⭐️: 我们还在进行更新版本的开发,敬请期待!
-
2023/11/29 VideoChat2和MVBench发布
- VideoChat2是基于UMT和Vicuna-v0构建的强大基线
- 2M 多样指令数据以便有效调优
- MVBench是一个全面的视频理解基准
-
2023/05/11 端到端VideoChat
-
2023/04/25 与ChatGPT一起看超过1分钟的视频
- VideoChat LongVideo: 使用langchain和whisper处理长时信息
-
2023/04/21 与MOSS一起看视频
- video_chat_with_MOSS: 将视频与MOSS显式编码
-
2023/04/20: 与StableLM一起看视频
- VideoChat with StableLM: 将视频与StableLM显式编码
-
2023/04/19: 代码发布和在线演示Demo发布
- VideoChat with ChatGPT: 将视频与ChatGPT显式编码,对时序信息敏感 demo is avaliable!
- MiniGPT-4 for video: 将视频与Vicuna隐式编码, 对时序信息不敏感。 (MiniGPT-4的简单拓展,将来会改进。)
如果您在试用、运行、部署中有任何问题,欢迎加入我们的微信群讨论!如果您对项目有任何的想法和建议,欢迎加入我们的微信群讨论!
cxk_online.mp4
如果您在研究中发现这个项目对您有帮助,请考虑引用:
@article{2023videochat,
title={VideoChat: Chat-Centric Video Understanding},
author={Li, Kunchang and He, Yinan and Wang, Yi and Li, Yizhuo and Wang, Wenhai and Luo, Ping and Wang, Yali and Wang, Limin and Qiao, Yu},
journal={arXiv preprint arXiv:2305.06355},
year={2023}
}
我们的团队不断研究通用视频理解和长期视频推理
我们正在招聘上海人工智能实验室通用视觉组的研究员、工程师和实习生。如果您有兴趣与我们合作,请联系Yi Wang ([email protected]
).