云創大數據cVector向量計算一體機自推出以來,收獲行業好評不斷,多家企事業單位向云創大數據表達了合作意向。為了讓更多單位體驗并感受cVector向量計算一體機的不俗實力和創新特性,現正式將cVector向量計算一體機進行開放。
在開放測試中,用戶可選擇“隨機生成”和“隨機選取”兩種方式,基于5億、1億、5千萬、1千萬數據量,即可體驗在極短的時間內,cVector向量計算一體機如何高效、快速完成比對。歡迎用電腦訪問http://xl.cstor.cn體驗!
cVector向量計算一體機是一種面向億級以上向量計算場景的高性能向量存儲、計算一體化平臺,采用并行計算架構,融合高密度混合服務硬件,實現對大規模向量數據的計算和比對,相較于通過GPU、向量數據庫進行向量計算,cVector向量計算一體機在入庫效率、計算性能方面優勢突出,可廣泛應用于人工智能大模型、機器學習、計算機視覺、自然語言處理等領域。
cVector向量計算一體機通過發揮高性能硬件、向量加速算法和并行計算算法的合力,致力于滿足億級乃至百億千億向量規模的大模型推理應用向量計算需求。
cVector向量計算一體機
cVector向量計算一體機的使用方式與向量數據庫基本一致,支持批量、追加入庫,支持向量間歐式距離、余弦距離等向量計算,支持網頁、命令調用、Python庫等方法,但在向量的入庫和比對計算上具有驚人的性能。
cVector向量計算一體機架構圖
近期, cVector向量計算一體機接受了工信部直屬的國家一級科研事業單位中國軟件評測中心的鑒定測試。中國軟件評測中心對比測試了cVector向量計算一體機與3款主流向量數據庫在入庫速度、查詢速度、準確性等維度的性能對比。
在入庫性能方面,同樣入庫3000萬條256 維向量數據,在向量數據庫中最快的是A,入庫速度是4851.97s,cVector向量計算一體機是1202.91s,入庫速度約是向量數據庫A的4倍,向量數據庫C的50倍,向量數據庫B的113倍;當入庫數據達到1億條時,向量數據庫A的入庫速度是17295.49s,cVector向量計算一體機是4484.55s,入庫速度約是前者的3.9倍。
入庫性能比對
在查詢性能方面,同樣查詢1億條256 維向量數據,向量數據庫A的查詢速度是512.8s,cVector向量計算一體機是0.27s,查詢速度是前者的1899倍,而其他兩家測試向量數據庫由于數據量太大無法入庫比較。
查詢性能對比
在準確性方面,cVector 向量計算一體機、向量數據庫A、向量數據庫B和向量數據庫C的數據準確度一致,通過了中國軟件評測中心(工業和信息化部軟件與集成電路促進中心)單項性能測試。
cVector向量計算一體機在億級乃至百億千億向量規模的的入庫和查詢等方面具有顯著的性能優勢,可幫助提高大模型推理的服務性能和服務質量,并能明顯降低其基礎設施建設成本,助力類ChatGPT等人工智能企業以更優的性價比解決算力不足的問題。
在具體應用方面,對于生成式AI相關企業,cVector向量計算一體機主要面向大模型推理應用,能夠在下述大模型推理環節發揮顯著作用:
①提高生成式AI的輸出準確性。由于大模型的輸出結果是根據概率推理而成,所以會出現“一本正經說胡話”的情形。可以將可信來源的數據轉化成向量數據存儲在向量計算一體機中,校準大模型推理輸出的結果,從而使大模型輸出的結果更加準確。
②提升大模型理解互聯網實時數據的能力。大模型基于歷史數據訓練而成,所以“只知道過去,不知道現在”。如果使用向量計算一體機存儲海量實時數據所轉化成的向量數據,可以幫助大模型理解掌握實時情況。
③提升大模型對用戶的服務質量。向量計算一體機可以允許用戶上傳更多的數據,讓大模型掌握用戶個性化的背景資料,更好地學習理解用戶請求,更好地結合用戶的實際情況回答問題。
④減輕大模型的訪問壓力。用戶所提的大部分問題都是相似的常見問題,向量計算一體機可以緩存大量熱點問題,不需要經過大模型推理即可返回結果,從而大幅減少算力成本。
⑤幫助生成式AI過濾敏感內容。怎么防止生成式AI說錯話一直是一個挑戰性問題,而向量計算一體機可以存放敏感內容所對應的向量數據,在用戶提出請求時加以判斷,盡可能防止AI對敏感問題做出不恰當的回應。
cVector向量計算一體機能夠廣泛應用于人工智能領域中生成式AI的推理應用場景,為各類生成式AI企業提供高性價比的產品和解決方案,大幅增加大模型平臺的競爭力,歡迎各大企事業單位試用。
聯系方式:
單先生 13770311887(微信同號)