亞馬遜云科技成功助力TII訓(xùn)練400億參數(shù)規(guī)模的大語(yǔ)言模型Falcon 40B
6月7日,亞馬遜云科技宣布,位于阿聯(lián)酋首都阿布扎比的全球領(lǐng)先科研中心TII(Technology Innovation Institute)在亞馬遜云科技上訓(xùn)練了其性能卓越的開(kāi)源模型Falcon 40B。Falcon 40B是擁有400 億參數(shù)的大語(yǔ)言模型(LLM),在Apache 2.0許可下提供,并在Hugging Face的開(kāi)源大語(yǔ)言模型排行榜上位列榜首。該排行榜在多個(gè)基準(zhǔn)測(cè)試中跟蹤、排名和
2023-06-08 10:15:49
來(lái)源:丁科技網(wǎng)??

6月7日,亞馬遜云科技宣布,位于阿聯(lián)酋首都阿布扎比的全球領(lǐng)先科研中心TII(Technology Innovation Institute)在亞馬遜云科技上訓(xùn)練了其性能卓越的開(kāi)源模型Falcon 40B。Falcon 40B是擁有400 億參數(shù)的大語(yǔ)言模型(LLM),在Apache 2.0許可下提供,并在Hugging Face的開(kāi)源大語(yǔ)言模型排行榜上位列榜首。該排行榜在多個(gè)基準(zhǔn)測(cè)試中跟蹤、排名和評(píng)估大語(yǔ)言模型,最終評(píng)選出最佳模型??蛻?hù)現(xiàn)在可以將Falcon 40B部署在Amazon SageMaker JumpStart上,這是一個(gè)機(jī)器學(xué)習(xí)中心,提供預(yù)訓(xùn)練模型,使客戶(hù)無(wú)需從頭構(gòu)建自己的模型即可獲得Falcon 40B最先進(jìn)的準(zhǔn)確性和行業(yè)領(lǐng)先的性能。要開(kāi)始使用Amazon SageMaker JumpStart,請(qǐng)?jiān)L問(wèn)aws.amazon.com/sagemaker/jumpstart。

大語(yǔ)言模型是機(jī)器學(xué)習(xí)(ML)模型的一個(gè)分支,專(zhuān)注于語(yǔ)言領(lǐng)域,可以支持各類(lèi)生成式AI應(yīng)用,包括文本處理、總結(jié)摘要和會(huì)話(huà)問(wèn)答。雖然這些大語(yǔ)言模型具有改變行業(yè)的潛力,但構(gòu)建、訓(xùn)練和部署大語(yǔ)言模型可能需要數(shù)周甚至數(shù)月的時(shí)間,并耗資數(shù)千萬(wàn)美元,這將許多公司拒之門(mén)外。為了在整個(gè)開(kāi)發(fā)過(guò)程中實(shí)現(xiàn)更好的性能和成本效益,包括Stability AI、AI21 Labs、Hugging Face和LG AI在內(nèi)的眾多客戶(hù)使用亞馬遜云科技端到端的機(jī)器學(xué)習(xí)服務(wù)Amazon SageMaker來(lái)構(gòu)建、訓(xùn)練和部署他們的大語(yǔ)言模型。

這也正是TII使用Amazon SageMaker構(gòu)建其Falcon 40B模型的原因。得益于SageMaker是一項(xiàng)完全托管的服務(wù),TII可以專(zhuān)注于開(kāi)發(fā)自定義的訓(xùn)練機(jī)制和優(yōu)化功能,而無(wú)需管理其機(jī)器學(xué)習(xí)基礎(chǔ)設(shè)施。為了最大限度地降低訓(xùn)練成本并縮短上市時(shí)間,TII采取了多項(xiàng)優(yōu)化措施,包括編寫(xiě)自定義矩陣乘法以加快訓(xùn)練速度。在整個(gè)訓(xùn)練過(guò)程中,亞馬遜云科技還與TII密切合作以利用SageMaker增強(qiáng)可用性,確保訓(xùn)練順利進(jìn)行,減少對(duì)開(kāi)發(fā)人員的干擾。

TII于2023年5月在Apache 2.0許可下發(fā)布了其Falcon 40B模型。自發(fā)布以來(lái),F(xiàn)alcon 40B 在各種基準(zhǔn)測(cè)試中的表現(xiàn)都優(yōu)于當(dāng)下的同類(lèi)模型,展示了無(wú)需專(zhuān)門(mén)微調(diào)的卓越性能。為了讓客戶(hù)更輕松地訪問(wèn)該模型,亞馬遜云科技讓Falcon 40B可以通過(guò)Amazon SageMaker Jumpstart部署?,F(xiàn)在,各個(gè)行業(yè)、各種規(guī)模的客戶(hù)都可以快速輕松地部署自己的Falcon 40B模型,并對(duì)其進(jìn)行定制以滿(mǎn)足他們的特定需求,如翻譯、問(wèn)答、信息總結(jié)、圖像識(shí)別等應(yīng)用程序。

“Falcon 40B的開(kāi)源版本使機(jī)構(gòu)能夠利用其卓越性能來(lái)推動(dòng)AI賦能的解決方案的發(fā)展。這是我們致力于促進(jìn) AI 創(chuàng)新的重要里程碑,也體現(xiàn)阿聯(lián)酋深遠(yuǎn)的科學(xué)貢獻(xiàn)。”TII跨AI研究中心執(zhí)行總監(jiān)兼LLM項(xiàng)目負(fù)責(zé)人表示,“通過(guò)將Falcon大語(yǔ)言模型開(kāi)源,我們希望將這一先進(jìn)的技術(shù)能力普惠化,為全球研究人員和組織賦能。下一步,我們即將推出新模型,為人工智能和先進(jìn)技術(shù)領(lǐng)域的進(jìn)一步發(fā)展做出貢獻(xiàn)?!?/p>

原創(chuàng)文章
最新文章
1
MediaTek 發(fā)布天璣 8400 移動(dòng)芯片,開(kāi)啟高階智能手機(jī)全大核計(jì)算時(shí)代
2
SUSE發(fā)布2025年技術(shù)趨勢(shì)預(yù)測(cè)
3
世界首創(chuàng)、全球引領(lǐng),海信8K激光電視榮獲“創(chuàng)新成果獎(jiǎng)”
4
年末家電消費(fèi)觀察:品質(zhì)生活類(lèi)產(chǎn)品熱賣(mài),將持續(xù)迎來(lái)剛需式普及?
5
信通院何寶宏:大模型“卷”向下半場(chǎng),需要新打法
6
Mini LED技術(shù)再升級(jí),從背光引領(lǐng)顯示行業(yè)實(shí)現(xiàn)技術(shù)迭代
7
1~11月彩電零售量同比下降2%,2025年有望達(dá)到3150萬(wàn)臺(tái)
8
這家清潔電器品牌突然停運(yùn) 背后投資者都是大腕+明星
9
兩新政策加力,2025年國(guó)債補(bǔ)貼預(yù)計(jì)超過(guò)3000億
10
國(guó)產(chǎn)DDR5內(nèi)存首次拆解:基本鎖定來(lái)自長(zhǎng)鑫
11
曝天馬打入果鏈:為蘋(píng)果HomePod供應(yīng)LCD屏 每塊屏僅10美元
12
索尼中國(guó)副總裁金燕敏榮登2024年《財(cái)富》 中國(guó)最具影響力商界女性未來(lái)榜
13
“碳索”美好“視界”,京東方用“科技+綠色”凝聚可持續(xù)生命力
14
智慧健康再進(jìn)化,TCL小藍(lán)翼C7新風(fēng)空調(diào)震撼發(fā)布,開(kāi)創(chuàng)AI空調(diào)發(fā)展新時(shí)代!
15
乘冰雪經(jīng)濟(jì)“冬”風(fēng),中國(guó)品牌跨越式“走出去”
16
2024《世界品牌500強(qiáng)》,長(zhǎng)虹排名再升2位創(chuàng)歷史新高
17
這些家電巨頭,都有一顆“造芯”的心
18
11月中國(guó)家電出口量已公布,空調(diào)同比增長(zhǎng)41.3%
19
大尺寸OLED市場(chǎng)迎來(lái)發(fā)展機(jī)遇,但是依然有很多問(wèn)題待解決
20
美的鮮為人知的一面 絢麗的B端千億矩陣
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512