发布日期:2024-12-21 02:35 点击次数:177
博查公司近日发布了其最新的基础模子——Rerank模子 Bocha Semantic Reranker,专为提高企业搜索和检索增强生成(RAG)系统而诡计。该模子兼容任何数据库或搜索索引,况且不错松驰插入到任何具有原生搜索功能的旧版利用措施中。仅需一瞥代码,Bocha Semantic Reranker便能显耀提高搜索性能或镌汰动手RAG利用的老本,同期对延伸的影响一丁点儿。
划重心
Bocha Semantic Reranker 以 80M 参数罢了接近于宇宙一线 280M、560M参数模子的排序服从。 - 由于模子参数比同类模子小3~6倍,推理速率更快、老本更低、性价比更高。 - 基于博查搜索引擎的时刻积蓄,排序服从在搜索场景进展更好。 - 提供官方API,国内用户无需自行部署模子,不错奏凯通过调用,免去推理干事器和注意老本。
博查Rerank模子的评分旨趣
博查语义排序模子的评分历程是基于查询语句(用户的输入问题)以及与之匹配的文档试验(连接是最高512个tokens的文本)进行的。评分的历程如下:1. 评估语义干系性:bocha-semantic-reranker会评估查询语句与每个文档的语义干系性,判断文档是否粗略有用恢复用户的查询或与查询意图高度匹配。2. 分拨@BochaSemanticRerankScore:凭据语义干系性,bocha-semantic-reranker为每个文档分拨一个rerankScore,分数的范围从0到1。分数越高,暗意文档与查询的语义干系性越强,越相宜用户需求。连接,分数接近1暗意高度干系,分数接近0暗意不干系或低干系。
博查Rerank模子的BEIR Benchmark