网站优化

网站优化

Products

当前位置:首页 > 网站优化 >

LLAMA3.1超越GPT-4o,开源了吗?

GG网络技术分享 2026-04-17 04:17 0


哎呦喂,最近大模型圈真是热闹啊!META的LLAMA3.1终于来了!说实话,我等得花儿都快谢了。今年4月份的时候, META就放出话来LLAMA3还在训练中呢, 放心去做... 后来啊不到三个月就直接亮出LLAMA3.1了这速度… 简直像吃了兴奋剂一样!

LLAMA3.1:横空出世的狠角色

今天发布的时候,这模型竟然已经在Reddit上被泄露出来了!而且还有效果对比图!我真是服了这些网友们,效率高得一批。不过话说回来对比图是真的让人眼前一亮。从下面这张图能看到, LLAMA3.1在boolq、gsm8k、hellaswag等一系列测试中都干翻了GPT-4o!只有HumanEval、 MMLU-social sciences、truthfulqa_mc1这仨测试稍微逊色一点,你看啊...。

首个超越GPT-4o的开源模型:LLAMA3.1开源了

但是等等…别高兴太早!虽然它在某些方面超越了GPT-4o *mini* , 但这并不意味着它就能和GPT-4正面硬刚。毕竟GPT-4o可是GPT-4 TURBO和GPT 4O优化的后来啊啊! 我们都曾是... 一层又一层的进化,不是随便一个新模型就能挑战的。

小模型之战:GPT-4o mini的强势崛起

上周OpenAI搞了个大新闻——发布了GPT-4o mini。这个小家伙可厉害了不仅性能超过了GPT-3.5,价格还便宜到离谱!比GPT-3.5 Turbo便宜60%以上!才每百万个输入token 15美分,输出token 60美分。相当于2500页书的价格!啧啧啧… 这性价比简直让人尖叫。

模型 输入Token价格 输出Token价格
GPT-3.5 Turbo $0.002 $0.004
GPT-4o mini $0.0015 $0.006

说真的, 现在要运行一个像LLAMA3这种大模型,大体上跟用API没什么区别了。普通人想自己玩转?那是不可能的啦!除非你家里有个小型数据中心… 或者有矿。

开源了吗?可以下载吗?

目前可以在huggingface网站上下载LLAMA3.1,META提供了多个不同的版本,也包括经过指令微调过后的模型版本

硬件要求:劝退开发者?

说到LLAMA3.1, META这次玩了个大的——参数高达405B! 这意味着什么?意味着你需要一台配置极高的电脑才能跑起来。网友反馈说就算对 脑子呢? Llama3.1-405B进行大幅度优化,推理速度还是慢得让人抓狂! 对硬件的要求更是高到天上去! 我猜很多开发者光是看到这个配置就直接放弃了。

其他版本选择

我惊呆了。 不过别灰心, LLAMA3.1还有开源的70B和8B版本可以选择。而且这些较小的模型在性能上也相当不错,与同等参数的其他模型相比,在多个测试集上的表现更胜一筹!

逻辑推理能力大考验

第三题是逻辑推理:赵三的父母结婚的时候为什么没有邀请自己参加。 还有9.9和9.11哪个大? 哎呀呀我怎么突然开始思考人生了…,对吧?

未来之路

总而言之... YYDS... OpenAI都在卷小模型市场啦! GPT-4o mini可能成为最具性价比的大模型。 所以呢一直走开源路线的 LLAMA 3 . 1还需要不断继续优化,成为普通人都能用到的一个性价比更好的大模型才是关键。 一边由于这个模型的参数量过大已经有网友觉得性价比不高普通人想要在自己电脑上跑起来肯定是不现实的: 从相应速度来看 GPT -4 o Mini明显比 OpenAI其他模型的推理速度要快得多应该是主要原因是其参数量不大所以速度提升明显.,这就说得通了。


提交需求或反馈

Demand feedback