欧美涩涩

加入收藏設(shè)為首頁

您現(xiàn)在的位置：首頁 > 國內(nèi)資訊 > 正文

百川智能發(fā)布Baichuan2開源大模型，號稱“文理兼?zhèn)淙骖I(lǐng)先LLaM

2023-09-07 04:58 來源：IT之家編輯：山歌閱讀量：18259

，百川智能今日召開主題為“百川匯海，開源共贏”的大模型發(fā)布會，正式開源微調(diào)后的 Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat 與其 4bit 量化版本，并且均為免費可商用。

據(jù)百川智能官方介紹，Baichuan2-7B-Base 和 Baichuan2-13B-Base，均基于 2.6 萬億高質(zhì)量多語言數(shù)據(jù)進行訓練，兩個模型在數(shù)學、代碼、安全、邏輯推理、語義理解等能力有顯著提升。

其中 Baichuan2-13B-Base 相比上一代 13B 模型，數(shù)學能力提升 49%，代碼能力提升 46%，安全能力提升 37%，邏輯推理能力提升 25%，語義理解能力提升 15%。

圖源“百川智能”公眾號，下同

在 MMLU、CMMLU、GSM8K 等基準測試中，百川智能的兩個模型都比 LLaMA 2 的分數(shù)要高一些，且在“中文通用”部分優(yōu)勢較大。

7B 參數(shù)模型的 Benchmark 成績

13B 參數(shù)模型的 Benchmark 成績

Baichuan2-7B 和 Baichuan2-13B 不僅對學術(shù)研究完全開放，開發(fā)者也僅需郵件申請獲得官方商用許可后，即可以免費商用。騰訊云、阿里云、火山方舟、華為、聯(lián)發(fā)科等企業(yè)均參加了本次發(fā)布會并與百川智能達成了合作。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接，用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

鄭重聲明：此文內(nèi)容為本網(wǎng)站轉(zhuǎn)載企業(yè)宣傳資訊，目的在于傳播更多信息，與本站立場無關(guān)。僅供讀者參考，并請自行核實相關(guān)內(nèi)容。

欄目排行

欄目推薦

中國金融網(wǎng)版權(quán)所有，未經(jīng)書面授權(quán)禁止使用！ Copyright @ 2013-2021 備案號：京ICP備17016634號-1

中國金融網(wǎng)僅提供服務(wù)對接功能，所載文章、數(shù)據(jù)僅供參考，用戶需獨立做出投資決策，風險自擔，投資有風險，選擇需謹慎。