当前位置:首页 > 职场八卦 > 正文内容

马斯克的xAI连发两款新模型,有进步但还谈不上领先|界面新闻 · 科技

fengadmin1个月前 (08-15)职场八卦19

界面新闻记者 | 陈振芳

界面新闻编辑 | 宋佳楠

“Grok的进度是火箭。”马斯克如此兴奋地在X上宣布Grok-2的到来。

当地时间8月14日,xAI发布了Grok-2和Grok-2mini两款AI模型的测试版。其中,Grok-2是该公司推理能力最强的语言模型,而轻量化模型Grok-2mini是Grok-2的兄弟产品”,试图实现小参数体型下的强功能。

xAI在博客文章中表示,Grok-2的早期预览版相较于Grok-1.5有了重大进步,具有聊天、编码和推理方面的前沿功能。

该公司声称,Grok-2的早期版本以“sus-column-r”的名称进行测试在LMSYS排行榜上的表现优于Anthropic公司的Claude 3.5 Sonnet和OpenAI的GPT-4-Turbo。LMSYS排行榜通过在大语言模型间进行随机匿名的一对一“对战”,并基于ELO评级系统得出排名。

图源:xAI

sus-column-r(Grok 2早期版本)现已公开凭借超过12000个社区投票,sus-column-r在总体排行榜上获得了第3名,与GPT-4o相当它在编码获得第2名、困难提示获得第4名数学方面也取得第2名

xAI还通过AI导师系统测试Grok与新的模型互动表现Grok-2重点评估模型在两个关键领域的能力:遵循指示和提供准确、真实的信息Grok-2在推理检索到的内容和工具使用能力方面表现出显著进步,例如正确识别缺失信息、通过事件序列进行推理以及丢弃不相关的帖子。

此外,xAI通过一系列学术基准对Grok-2模型进行了评估,这些基准包括推理、阅读理解、数学、科学和编码。该公司表示,“在研究生水平的科学知识、常识和数学竞赛问题等领域的表现可与其他前沿模型相媲美。

马斯克正在将xAI与其收购的社交媒体“X”深度绑定——Grok-2和Grok-2mini将对X的增强搜索功能、深入了解帖子以及改进回复功能提供支持,尽管此前xAI曾因使用X用户数据进行训练而遭致反对。

此次更新的一大亮点是,Grok-2模型可以在X上生成图像,其生图模型使用了近期大火的 Flux.1模型,但目前仅限于X上的Premium和Premium+用户。

由于Grok的图像生成功能没有任何限制,已经有不少用户借此进行政治人物图像创作,例如有用户利用Grok-2生成美国首任总统华盛顿的图片,该帖子还被马斯克转载。然而,OpenAI的ChatGPT会拒绝生成这类图像,避免政治风险。

图源:X

值得注意的是,Grok-2和Grok-2mini目前处于测试阶段。该公司预计,本月晚些时候将通过其企业API向开发人员提供这两种模型。即将推出的API建立在新的定制技术堆栈上,允许多区域推理部署,以实现全球低延迟访问,同时提供增强安全功能,例如强制性多因素身份验证、流量统计数据和高级计费分析。

在与OpenAI分道扬镳后,马斯克曾预测2029年将会实现通用人工智能,而他所创办的xAI最终目标是让消费者、企业甚至所有人都可以使用AI产品,并变成有用的工具。其希望通过AI去帮助人们解决复杂的科学和数学问题,并且“理解”宇宙。

xAI的动作也在不断加速。该公司于2024年1月进行了首次融资,金额为1.35亿美元;5月完成了60亿美元的B轮融资,公司估值也从此前的180亿美元飙升至250亿美元,成为美国又一家AI独角兽。

到了7月,马斯克表示,xAI团队已经开始在“孟菲斯超级集群”上进行训练。该集群由10万个液冷H100 GPU组成,目标是在今年12月前训练出“按每项指标衡量都是世界上最强大的人工智能”。

他的野心还不止于此,曾透露xAI计划打造一台超级计算机“算力的超级工厂”,预计规模是市场上最强大竞争对手的四倍。

作为大模型的“后来者”,马斯克认为xAI可以在人工智能领域带来新的突破和创新,同时强调竞争有利于推动整个行业的进步,避免形成一家公司在人工智能领域占主导地位的单极世界。

但从其最新发布的两款模型来看,并未表现出超越行业的创新性,仍处于追赶者的角色。Grok-2要想在与OpenAI、谷歌等一众科技公司的竞争中突围,需拿出更强有力的产品才行。

扫描二维码推送至手机访问。

版权声明:本文由上海忠信云帆体育资讯网发布,如需转载请注明出处。

本文链接:http://whlrf.cn/news/post/18334.html

分享给朋友:

“马斯克的xAI连发两款新模型,有进步但还谈不上领先|界面新闻 · 科技” 的相关文章

莫斯科交易所将停止使用美元和欧元进行场内交易|界面新闻 · 快讯

据央视新闻,当地时间6月12日晚,莫斯科交易所发布公告称,受制裁影响,从6月13日起该交易所将不再使用美元和欧元进行外汇和贵金属交易,此外在股票市场、货币市场和标准化衍生金融工具市场中也将不再交易以美元和欧元进行结算的金融工具。 公告称远期市场交易不受影响,将按此前规则进行交易。 俄罗...

iQOO Neo9S Pro+获入网许可:定价最便宜的骁龙8 Gen3手机

iQOO Neo9S Pro+获入网许可:定价最便宜的骁龙8 Gen3手机

【TechWeb】5月20日,iQOO推出了全新的iQOO Neo9S Pro,该机首批搭载天玑9300+芯片,将天玑9300+的巅峰性能带到更亲民价位,跑分创安卓新高,成为同档性能之王。而现在有最新消息,近日有数码博主透露,该系列的超大杯机型——iQOO Neo9S Pro+也已入网。 据知名数...

隆基再次刷新晶硅-钙钛矿叠层电池效率世界纪录

隆基再次刷新晶硅-钙钛矿叠层电池效率世界纪录

快讯摘要 【隆基再次刷新晶硅-钙钛矿叠层电池效率世界纪录】证券时报e公司讯,6月14日,隆基宣布其研制的晶硅-钙钛矿叠层太阳电池取得了重大突破。据欧洲太阳能测试机构(ESTI)的权威认证,该电池的光电......

牙科集采后,时代天使押注AI与出海|界面新闻

牙科集采后,时代天使押注AI与出海|界面新闻

界面新闻记者 | 唐卓雅 界面新闻编辑 | 谢欣 医疗行业素有“金眼银牙”的说法,而种植和正畸又被认为是牙科里的两座金矿。但是2022年,种植牙和正畸接连遭遇集采,牙科“暴利”的故事难以为继,AI和出海或成为这个赛道的新故事。 6月11日,时代天使发布了其升级版iOrtho 11....

商业头条No.28|京东苦战低价|界面新闻 · 科技

商业头条No.28|京东苦战低价|界面新闻 · 科技

界面新闻记者 | 李彪 查沁君 界面新闻编辑 | 宋佳楠 当比价成为“悬在头上的一把剑”时,张宇有些不太适应。 以往京东内部也比过价,通常一周一次,且只是每天几百封公司邮件中一个不起眼的要求,和员工绩效也不挂钩。 但在今年,比价成了常态,和张宇一样的采销员工每天都要面对比价...

二手房收房验房时应注意哪些事项?

在购买二手房的过程中,收房验房是一个至关重要的环节。它不仅关系到房产的实际状况,还直接影响到后续的居住体验和投资价值。以下是在进行二手房收房验房时应注意的几个关键事项。1. 房屋结构检查首先,应详细检查房屋的主体结构,包括墙体、梁柱、楼板等是否存在裂缝、变形或渗水现象。这些结构性问题可能会影响房屋的...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。