grok - t11p577

网友用Grok 4拉踩GPT-5,马斯克转发

2025-08-09 11:28 新浪财经

有X用户发帖对比Grok4一秒即可准确解答数学题，不需要切换不同模式，比GPT-5强多了。埃隆·马斯克转发贴文，并称“酷”。

GPT5向所有免费用户开放北京时间8月8日凌晨1点的发布会上，GPT-5总算在

2025-08-08 10:16 名人聊

GPT5向所有免费用户开放北京时间8月8日凌晨1点的发布会上，GPT-5总算在万众期待中姗姗而至，此时，距离GPT-4的发布已过去了两年半。一、整体评价1.发布会平淡：相比前代产品的惊艳亮相，GPT-5发布会缺乏突破性创新，展示的基准测试（Benchmark）和用例难以激发兴趣，甚至出现PPT数据展示错误。2.核心亮点：-价格优势：API定价仅为竞品ClaudeOpus4.1的1/15，低于Gemini2.5Pro。-编程优化：强化了代码理解、错误修复和工具调用能力。-超低幻觉率：比GPT-4o低45%，比o3低80%。-上下文能力跃升：支持400K上下文，精准度翻倍。二、模型能力分析1.智力水平有限提升：-主流测试集小幅领先竞品（如比Grok4高1分），但未实现跨越式进步。-在AGI关键测试（ArcPrize）中远落后于Grok4。-Pro模式例外：处理超高难度科学问题（GPQA）时刷新纪录，盲测胜率近70%。2.编程能力亮点：-智能体式编码（AgenticCoding）：可调用工具长时间协作，主动沟通步骤与计划。-痛点优化：增强代码库理解、自我Bug修复（构建-报错-迭代循环）、前端生成效率（400行代码/2分钟）。-实际体验优于基准测试，但领先Claude4.1Opus仅0.3%。3.多模态短板：仍限于文本和图像理解，不支持音频/视频生成，远落后于Gemini大一统模型。三、其他技术改进1.幻觉与安全：-通过强化学习减少"欺骗行为"（部分维度降90%），结合浏览工具降低知识性错误。2.数据瓶颈回应：采用跨代模型生成合成训练数据，证实"左脚踩右脚"式递归训练，但效果受限。四、新功能与体验1.乏善可陈：-写作润色更"人性化"但效果不直观。-语音助手自然度提升（行业标配水平）。-记忆功能仅整合邮箱/日历，个性化仅支持界面换色。2.用户定价策略：-免费用户限时使用GPT-5，超额转用GPT-5mini。-Plus用户额度大幅提升，API价格极具竞争力（输入$1.25/百万token）。五、发布会问题与行业影响1.公关灾难：-PPT数据图表比例失真（如SWEBenchmark、Tau2测试），引发舆论嘲讽。-演示冗长专业，缺乏冲击力（对比竞品售货机实验、宝可梦演示）。2.行业警示：-GPT-4.5项目失败、Grok-4算力堆砌未达革命性突破，叠加GPT-5渐进式升级，预示ScalingLaw增长见顶。-AI行业进入"务实竞争"阶段，需等待新范式突破。核心结论：GPT-5以价格战和工程优化（编程/幻觉/上下文）守住市场份额，但技术突破乏力，发布会加剧舆论危机，折射AI高速增长期结束。

马斯克宣布开源重大举措,Grok 2 AI模型下周公开源代码

2025-08-08 08:16 新浪财经

马斯克宣布开源Grok2：核心动态与技术解析最新进展：2025年8月6日，马斯克在X平台回复网友提问时宣布：“现在是时候开源Grok2了，我们将于下周实现这一目标。此举被视为对开源社区和竞争对手的回应，也是其长期倡导技术透明化...

马斯克:xAI Grok 2将于下周开源

2025-08-06 15:36 BiaNews

据悉，有网友在社交平台询问：“Grok2和Grok3何时开源？马斯克对此回复表示，现在是时候开源Grok2了，将于下周实现这一目标。2024年8月13日，马斯克旗下xAI公司以Beta版本的形式，发布了Grok-2和Grok-2mini两款AI模型，实测...

马斯克晒VineAI项目“GrokImagine”预告：还找回了已删V

2025-08-03 10:51 游乐看科技

马斯克晒VineAI项目“GrokImagine”预告：还找回了已删Vine视频存档ElonMusk近日在X发帖宣布：“GrokImagineisAIVine!”意味着他旗下的GrokAI正在尝试生成短视频内容，类似曾逝去的Vine平台风格。与此同时，他还透露团队找回了完整的Vine视频存档，正计划为新功能作为素材或灵感来源。这一预告不仅是对Vine的怀旧致敬，更可能是一场对Reels类短视频内容的AI化进击——由AI自动生成Vine样式视频，无需用户创作。如真能生成“AIVine”，这将是AI内容自动化的新尝试，未来用户或许只需一句话prompt，即可生成短视频；存档公开意味着数字遗产可以“复活”，也可能存在版权和传播边界问题；这项功能仍处于初期预告阶段，效果和上线时间尚未可知。🟦你觉得“AIVine”是创作新时代，还是对原创用户的冲击？数码真相集马斯克GrokImagineAI短视频

超越闭源Grok4、Claude4!全球第三,阿里千问3创下开源模型最高分!

2025-08-02 12:20 新浪财经

8月2日凌晨，国际权威大模型评测ChatbotArena更新了最新一期的大模型榜单，上周新鲜开源的阿里千问3新模型斩获1433分，超越顶尖闭源模型Grok4、Claude4，位列所有闭源及开源模型的全球总榜第三，是全球最强非推理（non-...

Grok-4系列模型发布,马斯克:它几乎所有学科都比人类研究生聪明

2025-07-10 14:08 新浪财经

新浪科技讯7月10日下午消息，马斯克旗下xAI公司宣布推出最新的Grok-4系列AI模型。这是前代产品Grok3的重大升级版本，直接跳过了3.5版本。据马斯克介绍，该模型几乎在所有学科领域都比人类研究生更聪明。据悉，Grok-4能够进行...

t11p577

标签: grok