精品日韩在线观看_精品福利视频一区二区三区_久久女人_中文字幕av在线_久久9热_一级毛片免费视频

實(shí)時(shí)新聞動(dòng)態(tài)更新

為您提供有關(guān)金現(xiàn)代的第一手資訊

Title
業(yè)務(wù)咨詢
聯(lián)系電話
400-600-7966
企業(yè)微信
掃碼咨詢

公開分享,突破開源RAG短板的5大關(guān)鍵策略!

2025-04-14 11:49:06   來(lái)源: 本站原創(chuàng) 

在 AI 蓬勃發(fā)展的時(shí)代,智能問(wèn)答助手已深度融入我們的工作與生活。

但不同智能助手的表現(xiàn)參差不齊,有的常常含糊其辭、答非所問(wèn);有的卻精準(zhǔn)流暢,宛如行業(yè)專家。

其實(shí),這一巨大差距的根源,在于是否應(yīng)用了RAG(檢索增強(qiáng)生成)技術(shù),以及是否攻克了RAG技術(shù)的關(guān)鍵瓶頸。


開源RAG的優(yōu)勢(shì)和短板


RAG技術(shù)改變了傳統(tǒng)的智能問(wèn)答模式。傳統(tǒng)模式需把大量文檔納入大模型訓(xùn)練,成本高、耗時(shí)久,知識(shí)更新還得重新訓(xùn)練,效率低下。

RAG 技術(shù)則在大模型外構(gòu)建獨(dú)立文檔檢索系統(tǒng)。用戶提問(wèn)時(shí),系統(tǒng)先從文檔庫(kù)精準(zhǔn)篩選相關(guān)片段,再與問(wèn)題一同輸入大模型生成回答。

使企業(yè)無(wú)需大規(guī)模訓(xùn)練大模型,就能快速運(yùn)用最新文檔知識(shí),大幅提升響應(yīng)速度與回答準(zhǔn)確性,降低企業(yè)知識(shí)管理成本和維護(hù)難度。

RAG技術(shù)示意

然而,開源 RAG 技術(shù)也存在顯著局限。

#在文檔切分上,面對(duì)含多層級(jí)標(biāo)題、交叉引用、嵌套段落等復(fù)雜結(jié)構(gòu)的專業(yè)文檔,只能依靠簡(jiǎn)單規(guī)則按固定字?jǐn)?shù)或段落切分,致使片段過(guò)長(zhǎng)含冗余或過(guò)短致語(yǔ)義破碎,影響大模型對(duì)核心要點(diǎn)的把握,降低問(wèn)答質(zhì)量;

#向量召回策略先天不足,僅 60 - 70% 的文檔召回命中率,導(dǎo)致大量相關(guān)文檔遺漏,限制大模型生成回答時(shí)的參考信息,削弱回答全面性與準(zhǔn)確性;

#檢索重排環(huán)節(jié),缺乏有效機(jī)制精準(zhǔn)判斷召回片段與用戶問(wèn)題的語(yǔ)義相關(guān)性,僅靠基礎(chǔ)方式排序,面對(duì)隱晦問(wèn)題無(wú)法將關(guān)鍵內(nèi)容前置,使大模型因參考信息無(wú)序難以生成條理清晰、針對(duì)性強(qiáng)的答案。


突破開源RAG短板的5大關(guān)鍵策略


01創(chuàng)新性切分算法重塑回答精準(zhǔn)度

深度語(yǔ)義與結(jié)構(gòu)分析:金現(xiàn)代自研了一套切分算法,將其應(yīng)用在小金智問(wèn)智能問(wèn)答平臺(tái)當(dāng)中。與市面上常規(guī)切分算法不同,它突破了僅以段落、句子為依據(jù)的刻板模式。

通過(guò)實(shí)踐驗(yàn)證以及眾多客戶的真實(shí)反饋,該算法能夠深入到文檔結(jié)構(gòu)與語(yǔ)義層面,充分利用大綱、目錄、章節(jié)、標(biāo)題等多維度關(guān)鍵信息,對(duì)文檔進(jìn)行精準(zhǔn)切分。

在處理文檔時(shí),它能精準(zhǔn)把握段落邏輯與內(nèi)容關(guān)聯(lián),確保切分后的文本片段長(zhǎng)短適宜,語(yǔ)義連貫且完整。

這種切分方式為智能問(wèn)答提供更優(yōu)質(zhì)、準(zhǔn)確的信息輸入,大幅提升了智能問(wèn)答的準(zhǔn)確性。

表格與公式解析突破:針對(duì)文檔中的表格和公式,金現(xiàn)代研發(fā)了基于類HTML 解析語(yǔ)法的表格理解增強(qiáng)技術(shù)(已申請(qǐng)專利)。

這一技術(shù)能夠幫助大模型更準(zhǔn)確地理解表格中數(shù)據(jù)的真實(shí)語(yǔ)義。

以差旅報(bào)銷住宿標(biāo)準(zhǔn)為例,大模型借助該技術(shù)可以清晰地識(shí)別各數(shù)據(jù)所代表的指標(biāo)以及數(shù)據(jù)之間的關(guān)聯(lián),準(zhǔn)確回答諸如 “北京出差的住宿標(biāo)準(zhǔn)” 等針對(duì)表格的復(fù)雜問(wèn)題。

表格解析示意

02自主召回策略擴(kuò)大知識(shí)覆蓋

開源 RAG 技術(shù)的向量召回策略,其召回文檔命中率在 60 - 70%。

金現(xiàn)代采用自研的向量召回 + 關(guān)鍵詞召回的多路召回策略,成功將召回的文檔命中率提升至 85% 以上。

向量召回通過(guò)優(yōu)化向量空間模型,更精準(zhǔn)地計(jì)算語(yǔ)義相似度;關(guān)鍵詞召回則基于對(duì)文檔內(nèi)容的深入詞法、句法分析,精準(zhǔn)提取關(guān)鍵信息。

這一創(chuàng)新策略大大擴(kuò)充了大模型在生成回答時(shí)可參考的知識(shí)范圍,為提供更全面、準(zhǔn)確的回答奠定了堅(jiān)實(shí)基礎(chǔ)。

03智能檢索重排優(yōu)化信息呈現(xiàn)

金現(xiàn)代引入檢索重排(Rerank)技術(shù),并采用 Cross - Encoder 模型對(duì)召回片段進(jìn)行二次排序。

該模型能夠聯(lián)合編碼查詢問(wèn)題與召回文檔片段,精準(zhǔn)捕捉二者之間的語(yǔ)義相關(guān)性,使更相關(guān)的片段排在更靠前的位置。

使得大模型生成的回答更具針對(duì)性和準(zhǔn)確性,有效避免了無(wú)關(guān)或低相關(guān)信息對(duì)回答的干擾。

04可視化切分配置滿足個(gè)性需求

為滿足企業(yè)多樣化的個(gè)性需求,金現(xiàn)代提供了可視化切分配置方法。

在實(shí)際操作中,切分方案可能因業(yè)務(wù)變化、文檔更新等因素出現(xiàn)不合理的情況。有了可視化切分配置,企業(yè)無(wú)需擔(dān)憂復(fù)雜的技術(shù)流程或依賴外部技術(shù)支持。

通過(guò)直觀的操作界面,可自主完成對(duì)切分片段的編輯、修改、合并等操作,高效解決切分不合理的難題,保障知識(shí)管理工作順暢推進(jìn)。

05嚴(yán)密權(quán)限控制保障數(shù)據(jù)安全

金現(xiàn)代擁有一套完整的權(quán)限控制體系,這意味著傳遞給大模型的知識(shí)均經(jīng)過(guò)嚴(yán)格的權(quán)限過(guò)濾。

以一個(gè)擁有多個(gè)部門的企業(yè)為例,市場(chǎng)部員工僅能訪問(wèn)與市場(chǎng)業(yè)務(wù)相關(guān)的文檔,研發(fā)部員工只能查看研發(fā)相關(guān)資料。

即使大模型功能強(qiáng)大,也無(wú)法獲取超出員工權(quán)限范圍的知識(shí),從根本上杜絕了數(shù)據(jù)泄露的風(fēng)險(xiǎn)。

金現(xiàn)代將以上技術(shù)應(yīng)用在小金智問(wèn)智能問(wèn)答平臺(tái)中,目前已在多家客戶的實(shí)際業(yè)務(wù)場(chǎng)景中成功落地,具有高準(zhǔn)確性、強(qiáng)安全性、低成本的顯著優(yōu)勢(shì)。未來(lái),金現(xiàn)代會(huì)持續(xù)提供高效、精準(zhǔn)的智能化服務(wù),為企業(yè)的持續(xù)創(chuàng)新與發(fā)展賦能。


主站蜘蛛池模板: 久久久91精品国产一区二区三区 | 欧美在线综合 | 亚洲精品乱码8久久久久久日本 | 黄色av网站在线免费观看 | 亚洲精品在线网站 | 中国妞videos高潮 | 久久精品视频免费看 | 黄色一级片在线看 | 国产欧美精品一区二区三区 | 国产一区二区三区在线看 | 农村少妇kkkk7777 | 欧美日韩精品 | 在线观看黄色大片 | 欧美久久久久久久久久久久 | 国产色婷婷精品综合在线播放 | 国产精品久久久爽爽爽麻豆色哟哟 | 搡女人真爽免费午夜网站 | 国产成人精品电影 | 最近中文字幕在线视频1 | 91久久国产精品 | 亚洲欧美成人网 | 欧美日韩在线观看中文字幕 | 影音先锋中文字幕一区 | 亚洲高清在线观看视频 | 中文字幕免费视频观看 | 久久黄网| 精品国产乱码一区二区三区 | 久久综合香蕉 | 在线天堂新版最新版在线8 www.国产欧美 | 欧美国产一区二区 | 91视频8mav | 欧美日韩中文字幕 | 国产美女在线观看 | 日本久久久久久 | www四虎com| 亚洲一区二区三区四区五区中文 | 欧美一区二区免费 | 亚洲综合无码一区二区 | 亚洲综合视频 | 一本一道久久a久久精品综合蜜臀 | 亚洲国产午夜 |