Linq的AI檢索模型登頂HuggingFace MTEB排行榜

波士頓2024年6月5日 /美通社/ -- 生成式人工智能（AI）初創公司Linq宣佈，該公司的大型嵌入模型「Linq-Embed-Mistral」在HuggingFace的「大規模文本嵌入基準（MTEB）」排行榜文本檢索評估中排名第一，超過了NVIDIA、Salesforce、Google，OpenAI和Cohere等競爭對手。這項評估由全球最大的機器學習平台HuggingFace負責。

Linq的嵌入模型在文本檢索類別中獲得了60.2分，高居榜首，領先於NVIDIA（59.4分）和Voyage AI（58.3分）。Google的模型以55.7分緊隨其後，OpenAI和Cohere分別獲得55.4分和55.0分。

HuggingFace的MTEB排行榜對嵌入模型在分類、聚類、成對分類、重排序、檢索、語義文本相似度（STS）和摘要這七個類別中的表現進行了排名。Linq的嵌入模型不僅在文本檢索類別中表現出色，在其他類別中也居於領先，總體排名第三。

MTEB總共列出了300多個嵌入模型，表明嵌入模型技術領域處於激烈但良性的競爭態勢。Linq在這項基準測試中的優異表現證明了其在嵌入模型技術方面的領先優勢。

嵌入模型在生成式AI中至關重要，尤其是通過採用檢索增強生成（RAG）技術來解決大語言模型（LLM）的幻覺問題。RAG允許模型通過訪問LLM內部不可用的最新數據或內部文檔來產生可靠的輸出。

負責該項目的Junseong Kim博士表示：「我們的研究表明，由於檢索數據具有廣泛的主題多樣性和高難度，GPT生成的數據並不完美，需要進行徹底驗證和改進。通過這些過程，輸出的質量可以提升到與人工標記數據相當的水平，最終基於MTEB基準數據集達到最佳檢索性能。研究結果顯示，通過使用GPT對數據進行精心優化和篩選，我們可以創建出針對RAG進行優化的模型，並最大限度地提高在特定領域的性能。」此外，他還強調：「重要的不僅僅是數據的改進，訓練方法的優化和快速的實驗週期也是提高檢索性能的關鍵。」

Linq聯合創始人兼首席執行官Jacob Choi說道：「準確的搜索對於生成式AI企業提高採用率至關重要。我們很自豪能夠開發出有助實現這一目標的核心嵌入模型，並且我們還將不斷擴展和完善該模型，以確保在金融和法律等專業領域提供精確的文本搜索。」Choi指出，2023年，ChatGPT的出現讓生成式AI的B2C（企業對消費者）用例開始興起。到了2024年，隨著準確性和安全技術的不斷改進，B2B（企業對企業）應用也將迎來顯著增長。

Massive Text Embedding Benchmark (MTEB) BEIR Retrieval Score in HuggingFace. as of May 30, 2024.

關於Linq

Linq（Wecover Platforms Inc）成立於2022年，由麻省理工學院電子與計算機工程系畢業生Jacob Choi和麻省理工學院計算科學與工程專業博士Subeen Pang共同創立。2021年，Choi因其AI神經形態計算研究入選福布斯「30位30歲以下科學領域精英」榜單。2022年，Linq獲得KakaoVentures，Smilegate Investment和Yellowdog的早期投資。2023年，Linq在Samsung Financial Networks主辦的「三星開放式協作」大賽中拔得頭籌，併入選美國最大的非股權式加速器MassChallenge的金融科技項目，繼續與畢馬威美國公司合作。

聯繫人：Jacob Choi （jacob.choi@getlinq.com）

source: Linq (Wecover Platforms Inc)

【與拍賣官看藝術】畢加索的市場潛能有多強？亞洲收藏家如何從新角度鑑賞？► 即睇

1	《盤前攻略》通脹數據前美股吐，牛證部署恒指支持位１９３００
2	【阿里預測】阿里第二財季料少賺６％，消費弱淘天ＥＢＩＴＡ受壓
3	【大行炒Ｄ乜】百濟神州績後獲大行唱好，中金上調中升目標一倍
4	【北水炒Ｄ乜】淨流出４５﹒５１億元，買騰訊沽盈富基金
5	人幣續貶，恒指再低開１７４點報１９６７１穿５０天線，京東領跌
6	【騰訊業績】騰訊第三季經調整盈利升３３％至５９８億人幣勝預期
7	【騰訊業績】騰訊首三季經調整盈利升４６％至約１６７４億人幣
8	中國移動（００９４１）申報昨斥近２千萬元回購２９萬股Ｈ股
9	蒙牛乳業（０２３１９）－公司回購股份紀錄
10	《午市前瞻》人幣弱勢港股難大升，吉利收購消息偏淡料季績平平

1	《品中資－羅國森》「米」已成炊，真正「雙倍奉還」
2	《法證攻防－林恩》人大常委會閉幕，特朗普重返白宮
3	《菲常論證－溫蕎菲》騰訊明日放榜，好倉資金積極部署
4	《專家之言－葉尚志》試衝波幅範圍上限，關注互聯網龍頭績報
5	《缸邊隨筆－石鏡泉》１１月８日的三件大事
6	《窩輪豪情－梁業豪》缺乏呈現單邊市況的條件
7	《陸言堂－陳永陸》留意特朗普上任後，會否增政府開支
8	《美元走勢－羅明立》美英齊減息，美元短線料仍靠穩
9	《運籌帷幄－梁業豪》長線投資者須知
10	《股林淘金－林家亨》金九銀十後，汽車股退潮跡象明顯

1	高息定存 \| 一周高息合集，銀行6個月最高3.6厘，3個月4厘
2	高息定存 \| 特朗普勝選美元走強，富邦一個月美元定存5.98厘
3	美國大選 \| 法國外貿銀行：若60%關稅屬實，損內地GDP增長率1百分點
4	瀚亞專家投資智慧：市場動盪下，低波幅如何成為避險關鍵？
5	2025 多元資產部署解鎖環球股匯債市潛力
6	神州經脈 \| 6萬億化債政策出台，滬指全周升逾5%，人幣跌
7	高息定存 \| 銀行紛搶存，恒生3個月加至3.6厘，創興高達3.9厘
8	【FOCUS】「X治國」2.0啟幕，新舊媒體權力交鋒
9	特朗普勝選美元大漲金價重挫，大行籲趁機買，金礦股及黃金ETF可以點部署？
10	美國減息 \| 【FOCUS】減息減了個寂寞，鮑公茫然下一步

1	美國大選2024 \| 2024美國大選即時結果，特朗普宣布勝利
2	理財通 \| 證監會：首批試點計劃券商名單出爐，續優化擴大理財通
3	恒指公司與沙特交易所簽署合作意向協議書，探索產品開發等
4	內地救市見效樓市有起色，惟再有內房抽水可以點揀？
5	港股 \| 蕭猷華：重磅消息來襲，股市勢必波動
6	高息定存 \| 一周高息合集，銀行6個月最高3.6厘，3個月4厘
7	施政報告2024 \| 2024年施政報告重點文字直播（稍後送上懶人包）
8	把握股市大浪未贏錢先享獎賞開立東亞戶口賺高達HK$3,800獎賞
9	美國大選 \| 【FOCUS】「垃圾」牽動選票，美媒各有盤算
10	高息定存 \| 一周高息合集，多家銀行加定存息，華僑3個月最高4厘
11	高息定存 \| 創興加3個月存息至3.6厘，渣打6個月3.48厘
12	美國大選2024 \|【FOCUS】侵侵勝券在握，防美元反高潮
13	高息定存 \| 南商3個月加至3.6厘，滙豐向個別客戶推特別優惠
14	TAOBAO \| 市傳淘寶租中港城4萬呎舖，料開設大型體驗家具館
15	提振內房｜一文看懂，中國房地產政策組合拳
16	港股 \| 午市前瞻 \| 人行買斷式逆回購刺激料有限內房板塊短線向好可吼
17	高息定存 \| 特朗普勝選美元走強，富邦一個月美元定存5.98厘
18	施政報告2024 \| 施政報告2024懶人包
19	光伏股 \| 協鑫科技曾飆三成大選前美國擬撤銷中國光伏反補貼稅
20	港股 \| 恒指午後升逾500點，人行預告下周LPR將減20至25基點
21	施政報告 \| 李家超︰施政報告沿用綠色封面，代表和諧活力和繁榮
22	新股上市 \| 證監會優化新上市申請審批流程時間表，市值達百億A股有望獲快速審批來港上市
23	NVIDIA \| 英偉達股價創歷史新高，美銀分析師料會繼續上升
24	電池之戰 \| 【FOCUS】寧王搶佔增混商機，固態電池更牽暗戰
25	美國大選 \| 法國外貿銀行：若60%關稅屬實，損內地GDP增長率1百分點
26	銀色債券 \| 銀債最多獲分24手，申請23手或以下獲全數配發
27	恒指 \| 恒指午後升逾300點，人大常委開會期間中資金融股造好
28	大家樂牛油 \| 大家樂否認轉用內地牛油，澄清荷蘭生產自家品牌維寶牛油醬
29	內銀股 \| 六大行減存款利率，人行年底前再降準，內銀造好可以點部署？
30	瀚亞專家投資智慧：市場動盪下，低波幅如何成為避險關鍵？

大國博弈

特朗普團隊出爐

貨幣攻略

高息定存 | 渣打3個月存息減至3.3厘，虛銀逆市加至3.5...

傾力救市

11月8日的三件大事

說說心理話