Skip to content

Latest commit

 

History

History
76 lines (52 loc) · 4.55 KB

README_cn.md

File metadata and controls

76 lines (52 loc) · 4.55 KB

Ask-Anything [Paper]

目前,Ask-Anything是一个简单而有趣的与视频聊天工具。 我们的团队正在努力建立一个智能且强大的用于视频理解的聊天机器人。 Open in Spaces [VideoChat-7B-8Bit] End2End ChatBOT for video and image.
Open in Huggingface | |

🚀: 我们通过指令微调更新了video_chat!相关内容可见我们的技术报告。相关的指令微调数据可见InternVideovideo_chat之前版本已经移动到video_chat_with_chatGPT

⭐️: 我们还在进行更新版本的开发,敬请期待!

🎥 在线演示Demo

f9f8acb1a6da540b60ef8660cf26cac

🔥 更新

  • 2023/11/29 VideoChat2和MVBench发布

  • 2023/05/11 端到端VideoChat

    • VideoChat: 基于指令微调的视频聊天机器人(也支持图像聊天)
    • 论文: 我们展示了如何制作具有两个版本的VideoChat(通过文本和特征),同时还讨论了其背景、应用等方面。
  • 2023/04/25 与ChatGPT一起看超过1分钟的视频

  • 2023/04/21 与MOSS一起看视频

  • 2023/04/20: 与StableLM一起看视频

  • 2023/04/19: 代码发布和在线演示Demo发布

🌤️ 交流群

如果您在试用、运行、部署中有任何问题,欢迎加入我们的微信群讨论!如果您对项目有任何的想法和建议,欢迎加入我们的微信群讨论!

image

💬 示例

cxk_online.mp4

📄 引用

如果您在研究中发现这个项目对您有帮助,请考虑引用:

@article{2023videochat,
  title={VideoChat: Chat-Centric Video Understanding},
  author={Li, Kunchang and He, Yinan and Wang, Yi and Li, Yizhuo and Wang, Wenhai and Luo, Ping and Wang, Yali and Wang, Limin and Qiao, Yu},
  journal={arXiv preprint arXiv:2305.06355},
  year={2023}
}

⏳ 招聘启事

我们的团队不断研究通用视频理解和长期视频推理

我们正在招聘上海人工智能实验室通用视觉组的研究员、工程师和实习生。如果您有兴趣与我们合作,请联系Yi Wang ([email protected]).