article cover

现在一个比一个能吹:谷歌称Gemma 3用单个GPU实现DeepSeek R1 98%的准确率 经验技巧

根据谷歌的说法,通过利用神经网络的“精华”,Gemma 3不仅在准确性上接近DeepSeek的R1,而且在计算资源需求方面远低于后者。具体来说,为了达到类似的Elo评分(一种用于对国际象棋选手进行排名的方法),DeepSeek的R1需要32个NVIDIA H100 GPU芯片,而Gemma 3只需一个H100 GPU即可。 谷歌在其博客文章中指出,Gemm...
一把老骨头 发布于