Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

【开源自荐】Denser Retriever: 企业级AI检索器,构建自己专属的RAG应用和聊天机器人🤖 #184

Open
zhiheng-huang opened this issue Jul 15, 2024 · 2 comments

Comments

@zhiheng-huang
Copy link

你是否还在苦恼大型语言模型的「幻觉」问题?是否希望构建自己网站或者自己需求专属的聊天机器人?是否正在寻找简单易用且准确性高的RAG模型?
Denser Retriever 这款工具帮到你!

产品简介

Denser Retriever是一个企业级AI检索器,旨在简化应用程序的集成,确保精确度。

亮点速览

  • 支持关键词搜索、向量搜索和机器学习模型重排等异构检索器
  • 利用xgboost机器学习技术有效结合异构检索器
  • 在MTEB检索基准测试上达到最先进的精确度
  • 展示如何使用Denser检索器为聊天机器人和语义搜索等端到端应用提供动力
  • 提供了详细的开发文档和安装指南

表现评估

我们在MTEB数据集上的实验表明,通过xgboost模型(记作ES+VS+RR_n)将关键词搜索、向量搜索和重排序器结合,可以显著提升向量搜索(VS)的基线(snowflake-arctic-embed-m模型, 在MTEB/BEIR排行榜达到了最先进的性能)。ES+VS+RR_n模型在15个MTEB数据集上达到了最高的NDCG@10得分56.47,相比snowflake模型(NDCG@10得分54.24)绝对提升了2.23,相对提升了4.11%。在广泛认可的MSMARCO基准数据集上,ES+VS+RR_n模型将snowflake模型的NDCG@10得分从41.77提升到47.23,带来了13.07%的相对提升。

mteb_ndcg_plot
retriever_dog
denser-retriever

@Wechat-ggGitHub
Copy link
Owner

我先在逛逛 github 公众号上,帮您推荐一下。后续整理到 readme 中。 预计 7.18 推文

@zhiheng-huang
Copy link
Author

Thanks @Wechat-ggGitHub 👍

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants