文字有點(diǎn)長(zhǎng),主要總結(jié)就是

優(yōu)點(diǎn):

1. 思維模式強(qiáng)大

Grok 3的“思維模式”強(qiáng)大。它在解決類(lèi)似《卡坦島》游戲網(wǎng)頁(yè)的任務(wù)時(shí),能夠生成一個(gè)簡(jiǎn)潔且功能完整的六邊形棋盤(pán)網(wǎng)頁(yè)。不僅能按要求生成,還能根據(jù)滑塊調(diào)整環(huán)的數(shù)量,表現(xiàn)相當(dāng)精準(zhǔn)。與其他頂尖的模型相比,GroK 3在這類(lèi)任務(wù)中的表現(xiàn)可靠。

我按他的六邊形棋盤(pán)要求輸入給deepseek得到的是這個(gè):

2. 復(fù)雜計(jì)算推理是強(qiáng)項(xiàng)

給Grok 3提了一個(gè)數(shù)學(xué)問(wèn)題——估算訓(xùn)練GPT-2所需的FLOP數(shù)。很多模型在面對(duì)這樣的計(jì)算推理時(shí)都會(huì)陷入困境,但Grok 3不僅沒(méi)有直接放棄,反而提供了一個(gè)相對(duì)精確的估算過(guò)程。它通過(guò)一定的推理和計(jì)算,正確估算了大概的訓(xùn)練量,這是許多模型無(wú)法做到的。

還有就是,Grok 3并沒(méi)有回避困難的數(shù)學(xué)問(wèn)題。提出黎曼猜想問(wèn)題,它并沒(méi)有立即回避,而是嘗試解答。

缺點(diǎn)

1. 一些簡(jiǎn)單的解碼問(wèn)題難倒它

我給Grok 3出了一道關(guān)于表情符號(hào)的“謎題”,涉及Unicode變體選擇符。雖然給了它提示,尤其是一些Rust代碼來(lái)解碼,它依然沒(méi)解答出來(lái)。相比之下,DeepSeek-R1在這方面進(jìn)展稍好,能部分解碼。因此,某些細(xì)節(jié)的處理上,Grok 3還有待改進(jìn)。

2. 生成圖像時(shí)仍顯生硬

在SVG圖像生成方面,Grok 3的表現(xiàn)有些“拗口”。例如,要求它生成一個(gè)騎著自行車(chē)的鵜鶘的SVG時(shí),結(jié)果雖然看得出有鵜鶘,但依然顯得有些不自然,排列不盡人意。相比之下,Claude在這方面的表現(xiàn)稍好一點(diǎn)。

分享到

崔歡歡

相關(guān)推薦