whatsapp灰头像

ip代理3周前WhatsApp账号注册13

全网最佳IP代理服务商- 9.9元开通-稳定的代理服务
如果您从事外贸、海外视频博主、海外推广、海外广告投放,欢迎选择我们。
让您轻易使用国外主流的聊天软件、视频网站以及社交网络等等

  4月6日消息,Meta于美国当地时间周六发布了其最新开源人工智能软件Llama 4的首批模型,表明该公司正在争取在生成式AI投资竞赛中占得先机。

  但规模最大、性能最强的Llama 4 Behemoth模型仍在训练中。 据Meta透露,这款“庞然大物”不仅在性能上碾压同类AI产品,还将作为“新模型的训练基石”。

  Meta的数据显示,Llama 4 Maverick拥有4000亿参数,但在128个 “专家” 模型中只有170亿个活跃参数。Scout有1090亿个参数,16个 “专家” 模型,活跃参数也是170亿个。而Llama 4 Behemoth具有2万亿参数,仅活跃参数就有2880亿个,但Meta的博客帖子表示该模型仍在训练中,并未给出具体的发布时间。

  另一个特点是它们具有非常长的上下文窗口——Llama 4 Maverick的上下文窗口为100万个token,Llama 4 Scout为1000万个token,分别相当于1500页和15000页的文本,所有这些都可以在单次输入/输出交互中处理。这意味着用户理论上可以上传或粘贴多达7500页的文本,并从Llama 4 Scout获得相应的输出,这在医学、科学、工程、数学、文学等信息密集型领域将非常有用。

  Meta首席产品官克里斯·考克斯3月曾表示,Llama 4将驱动具备新型推理与行动能力的AI智能体。这些智能体既能浏览网页,又能处理对消费者和企业有价值的多种任务。

  Meta首席执行官马克·扎克伯格表示:“我们的目标是构建世界领先的AIwhatsapp灰头像,将其开源,并让全世界都能受益。”

  他补充道:“我已经说过一段时间了,我认为开源AI将成为领先的模型,随着Llama 4的发布,这一目标正在成为现实。今天,Meta AI得到了重大升级。”

  Meta将在4月29日举办首次LlamaCon AI大会,该公司还预计将在第二季度发布其独立的Meta AI聊天机器人应用程序。

  Llama 4的所有三个模型都采用了“专家混合”(MoE)架构,这种架构最早由OpenAI和Mistral在之前的模型发布中推广,基本原理是将多个“专家”小模型整合为一个统一的大模型,以便处理不同的任务、领域和多种媒体格式。

  据称,每个Llama 4模型都由不同的“专家”模型组成,运行效率更高,因为仅需调用与当前任务相关的“专家”及一个“共享专家”处理每个token,而非激活整个模型。

  Meta在博客中解释:“所有参数均存储在内存中,但实际运行时仅需要激活部分参数。这降低了推理成本与延迟,Llama 4 Maverick甚至可在单颗英伟达H100 DGX主机上运行,也可以通过分布式推理实现最高效率。”

  据Meta估算,Llama 4 Maverick的推理成本为每百万个token 0.19美元到0.49美元(按输入输出3:1比例计算)。这使其在成本上远低于像GPT-4o这样的专有模型,后者的成本约为每百万个token 4.38美元。

  上述所有三款Llama 4模型——尤其是Maverick和Behemoth——都明确设计用于推理、编码和分步问题解决优化,但它们似乎并未展现出OpenAI“o”系列或DeepSeek R1那样的“思维链”式推理链条,而是直接对标GPT-4o、DeepSeekV3等传统多模态模型。不过Behemoth除外,其性能似乎在某种程度上可挑战DeepSeek R1。

  ——引入MetaP新技术,它允许工程师在调整超参数(如分层学习率)后,将其泛化至不同规模的模型及token类型,同时保持模型行为一致性

  其中,MetaP的突破性在于:通过小规模模型实验即可推导大规模模型的超参数,极大提升训练效率。业内人士评价:“这能省下大量时间和资金——不必在大模型上反复试错。”

  这一技术对训练Behemoth这样的大模型尤为关键——该模型动用32000颗GPU,采用FP8精度,处理超30万亿token(是Llama 3训练数据的两倍),实现单卡390 TFLOPs算力。

  Llama 4模型是非常强大的,与同等参数规模的其他模型相比,接近顶尖水平,但并未全面刷新性能记录。以下为与其他模型对比:

  与DeepSeek v3.1(458亿参数)相比,虽然使用的活跃参数不到一半(170亿参数),但仍具竞争力

  Meta还通过引入Llama Guard、Prompt Guard和CyberSecEval等工具来强调模型对齐和安全性,帮助开发者检测不安全的输入/输出或对抗性提示,并实施生成性进攻代理测试(GOAT)以进行自动化红队测试。

  该公司还声称Llama 4在“政治偏见”方面有了显著改善。它提到:“众所周知,所有领先的大语言模型中都存在偏见问题——具体来说,它们在有争议的政治和社会话题上,历史上倾向于偏左,而Llama 4在这方面更加平衡。”(腾讯科技特约编译金鹿)

全网最佳IP代理服务商- 9.9元开通-稳定的代理服务
如果您从事外贸、海外视频博主、海外推广、海外广告投放,欢迎选择我们。
让您轻易使用国外主流的聊天软件、视频网站以及社交网络等等

阅读剩余的22%

相关文章

whatsapp两个账号如何合并

whatsapp两个账号如何合并

  据该公司首席执行官称,一家总部位于阿联酋的公司遭受了严重的财务挫折,其品牌和声誉也受到了严重损害,原因是诈骗者涉嫌利用其徽标和产品图片骗取客户数十万迪拉姆。   “自...

whatsapp网页版发不了图片

  WhatsApp网页版是一款基于互联网的即时通讯工具,它允许用户在电脑上使用WhatsApp进行通信。本文将为您介绍如何在WhatsApp网页版中添加新联系人并保存信息的方法。...

怎么和国外客户要WhatsApp

  WhatsApp网页版是WhatsApp Messenger的在线版本,旨在为用户提供一个便捷的方式,随时随地通过电脑进行即时通讯。与手机应用相比,网页版具备了一些独特的功能,使得用户...

whatsapp 列表前没有头像

  WhatsApp与Facebook之间的整合潜力是一个引人关注的话题,尤其在社交媒体日益融合的背景下。WhatsApp自2014年被Facebook收购以来,两者之间的关系不断深化,潜...

whatsapp在国外怎么下不了

whatsapp在国外怎么下不了

  WhatsApp视频通线个月时间。去年十二月一张截图曝光了iOS版本一个基本的视频通话界面。最近,对于所谓“视频通话”翻译请求,显示WhatsApp准备在全球推广此项功能。上周末wha...

whatsapp添加好友上限

whatsapp添加好友上限

  在当今的网络游戏环境中,玩家们经常希望通过交易来获取更好的装备、稀有皮肤或账号。有些时候,急于盈利的心态可能会使玩家陷入坑人不眨眼的诈骗骗局。近期,多起游戏交易诈骗事件曝光,提醒我们在...

 1