Grok 3:10萬塊H100煉出“最聰明AI”,GPT-4地位不保?
北京時間2025年2月18日,馬斯克在迪拜世界政府峰會上正式發(fā)布xAI第三代大模型Grok 3時如此評價。
2025-02-19 08:37:27
來源:PConline??

“它聰明得有些嚇人?!?/p>

北京時間2025年2月18日,馬斯克在迪拜世界政府峰會上正式發(fā)布xAI第三代大模型Grok 3時如此評價。這場發(fā)布會如同一顆“核彈”,炸穿了全球AI圈的平靜:Grok 3在AIME數(shù)學測試中以52分碾壓DeepSeek-V3的39分,推理能力自稱超越OpenAI的o1和R1模型,訓練成本高達30億美元,甚至被曝出“證明黎曼猜想”的瘋狂傳聞。馬斯克宣稱:“這是地球上最聰明的AI”,而行業(yè)則陷入了一場關(guān)于技術(shù)、倫理與商業(yè)的激烈爭論。

一、技術(shù)突破:10萬塊H100煉出“思維鏈”,數(shù)學屠榜背后的硬核邏輯

“Grok 3的思考方式像人類一樣有步驟”——這是馬斯克在發(fā)布會上反復(fù)強調(diào)的亮點。 該模型首次引入“思維鏈”(Chain of Thought)推理機制,使其能夠分步驟拆解復(fù)雜問題。例如,面對一道物理題,Grok 3會先列出已知條件,再推導(dǎo)公式,最后分步計算答案。這種能力直接體現(xiàn)在AIME數(shù)學測試中:Grok 3得分52分,遠超DeepSeek-V3(39分)和GPT-4o(未公布具體分數(shù))。

算力與效率的雙重碾壓

為訓練Grok 3,xAI動用了10萬塊英偉達H100 GPU,預(yù)訓練數(shù)據(jù)量達到驚人的50萬億token。相比之下,GPT-4的訓練算力僅需2.5萬塊A100芯片。更令業(yè)界咋舌的是,xAI從Grok-0迭代到Grok-3僅用18個月,而OpenAI從GPT-3到GPT-4耗時近3年。這種“馬斯克速度”背后是極致的工程優(yōu)化:Grok 3的推理速度比上一代提升10倍,且支持多模態(tài)輸入(文本、圖像、代碼)。

爭議與彩蛋:Grok 3真的證明了黎曼猜想?

發(fā)布會后,一則傳聞引發(fā)數(shù)學界震動:Grok 3在訓練過程中“證明”了黎曼猜想,導(dǎo)致xAI暫停訓練以驗證結(jié)果。盡管尚未被學界確認,但這一事件側(cè)面印證了Grok 3的推理潛力——它已能處理最復(fù)雜的數(shù)學猜想。

二、行業(yè)洗牌:OpenAI遭遇最強挑戰(zhàn)者,DeepSeek神話終結(jié)?

“Grok 3的目標是成為OpenAI的替代品?!?馬斯克在發(fā)布會上直言不諱。從性能對標來看,Grok 3在編程、數(shù)學、科學等領(lǐng)域全面超越GPT-4o,且在LMSYS競技場評分首破1400分,而GPT-4o僅為1280分。更致命的是,xAI同步推出Grok 3推理模型(Grok-3 Reasoning)和輕量版Grok-3 mini,直接覆蓋高、中、低端市場。

中國廠商的“壓力測試”

此前憑借數(shù)學能力屠榜的國產(chǎn)模型DeepSeek-V3,在Grok 3面前黯然失色:其AIME得分落后13分,且Grok 3的思維鏈功能使其在復(fù)雜問題處理上更接近人類專家。行業(yè)分析師指出:“中國廠商若不能突破推理瓶頸,將面臨市場份額流失風險?!?/p>

訓練成本戰(zhàn):30億美元豪賭未來

Grok 3的訓練費用高達30億美元,遠超GPT-4的1億美元。這一數(shù)字背后是馬斯克的野心:通過極致算力投入建立技術(shù)壁壘。正如xAI工程師所言:“我們不是在優(yōu)化成本,而是在創(chuàng)造未來?!?/p>

三、用戶體驗:幽默感AI如何走進日常生活?

“讓AI不再像個冰冷的機器” ——這是Grok系列的核心設(shè)計理念。Grok 3在交互中增加了更多擬人化表達,例如用emoji表情回應(yīng)情緒化提問,甚至能創(chuàng)作融合《寶石迷陣》和《俄羅斯方塊》的混合游戲。

教育、醫(yī)療、創(chuàng)作的顛覆性場景

教育:Grok 3可逐步講解微積分難題,并生成配套練習題;
醫(yī)療:根據(jù)患者癥狀描述,自動生成診斷建議和用藥方案;
創(chuàng)作:在發(fā)布會演示中,Grok 3用10分鐘編寫出一款可運行的小游戲。

用戶實測:效率提升,但可靠性存疑

盡管早期測試用戶盛贊其效率(例如代碼生成速度比GPT-4快40%),但也有開發(fā)者指出,Grok 3在處理專業(yè)領(lǐng)域問題時仍會“一本正經(jīng)地胡說八道”。xAI回應(yīng)稱:“所有缺陷將在一周后的正式上線版本解決?!?/p>

四、爭議與隱憂:最聰明AI會是潘多拉魔盒嗎?

“當AI比人類更聰明時,我們?nèi)绾慰刂扑???馬斯克曾在多個場合警告AI風險,但Grok 3的發(fā)布卻將這種矛盾推向頂點:一方面,他呼吁加強AI監(jiān)管;另一方面,他又在推進“不受限的技術(shù)突破”。

倫理挑戰(zhàn):從信息繭房到就業(yè)沖擊

信息真實性:Grok 3的“幽默感”可能導(dǎo)致錯誤信息以更隱蔽的方式傳播;
就業(yè)替代:其代碼和文案生成能力可能沖擊初級程序員和文案崗位;
隱私安全:10萬億級訓練數(shù)據(jù)是否包含用戶隱私?xAI尚未公開數(shù)據(jù)來源。

行業(yè)質(zhì)疑:技術(shù)躍進還是營銷噱頭?

盡管馬斯克宣稱Grok 3“超越所有現(xiàn)有AI”,但科技媒體指出,其演示案例多為限定場景,尚未經(jīng)過第三方大規(guī)模測試。DeepMind研究員評論稱:“真正的AGI需要通用性,而非單項指標領(lǐng)先。”

結(jié)語:AI競賽進入“馬斯克時間”

Grok 3的發(fā)布不僅是一場技術(shù)秀,更是一封“戰(zhàn)書”——它宣告AI競賽進入以算力堆砌和工程迭代為核心的“硬核時代”。當馬斯克用10萬塊H100砸開AGI的大門時,OpenAI、谷歌和中國廠商們必須回答一個問題:跟上這種瘋狂的速度,需要付出多大代價? 而普通用戶更關(guān)心的是:當AI聰明到“嚇人”時,我們該如何與它共處?

最新文章
1
4年前理想李想和特斯拉陶琳說的話,值得所有人深思
2
TCL上新Mini LED電視,T7L為何“最能打”,Q9L為何“最值得買”?
3
八年前用A9帶火屏幕發(fā)聲技術(shù)的索尼,今年會有OLED新品嗎?
4
海信視像發(fā)布2024年可持續(xù)發(fā)展報告:以綠色科技推動可持續(xù)發(fā)展
5
都叫“養(yǎng)鮮”冰箱,格力、容聲有啥不一樣?
6
財報觀察:2024全球智能家電銷量第一品牌,講好新故事?
7
續(xù)航滅霸 +倍強大 vivo Y300 Pro+正式發(fā)布
8
BOE(京東方)f-OLED柔性顯示技術(shù)策源地論壇舉辦 攜手中關(guān)村論壇共筑科技創(chuàng)新高地
9
海信視像2024年營收凈利雙增,高端穩(wěn)步增長,蟬聯(lián)世界第二
10
精裝修熱水系統(tǒng)市場外資占優(yōu),高端住宅需求點燃新增長(2025年1-2月)
11
AI家電:技術(shù)狂歡還是實用革命?
12
中國半導(dǎo)體并購潮起
13
小家電市場表現(xiàn)低迷,2025年小家電市場面臨嚴峻挑戰(zhàn)
14
全球首款!新型手機OLED面板問世:可發(fā)聲、會變形
15
空調(diào)等家電沖擊傳統(tǒng)廠商!持股近10年 美的徹底清倉了小米:合計套現(xiàn)20億元
16
同期唯一2K直屏超大杯!OPPO Find X8 Ultra外觀正式揭曉
17
添可做飯,追覓洗碗
18
海爾海信洗衣機聽勸玩起“滾筒分身術(shù)”,三筒分區(qū)洗哪家強?
19
催更效果拉滿!高對比度屏+萬象分區(qū),TCL T7L&Q9L系列全球首發(fā)
20
健康守護+空間革命+智慧服務(wù),TCL冰洗創(chuàng)新“三重奏”擊中時代剛需
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512