AI资讯新闻榜单内容搜索-AR

谷歌提示词比赛亚军：把AI当同事，而不是机器

最近，谷歌与瑞士邮政下属的 Digitalidag 联合举办了一场提示词比赛，选手们的任务是编写提示词（指令），比如让 AI 助手制定一份详细的学习计划。Joakim Jardenberg 获得了本次比赛的亚军，Wrap News 对其进行了一场专访，就提示词的创作进行了交流。

来自主题: AI资讯

11351 点击 2025-03-03 21:02

Claude 3.7硬控马里奥90秒，GPT-4o开局暴毙！Karpathy直呼基准失效，游戏成LLM新战场

Karpathy发出灵魂拷问，评估AI究竟该看哪些指标？答案或许就藏在经典游戏里！最近，加州大学圣迭戈分校Hao AI Lab用超级马里奥等评测AI智能体，Claude 3.7结果令人瞠目结舌。

来自主题: AI资讯

8605 点击 2025-03-03 16:00

微软原WizardLM团队：代码大模型WarriorCoder，性能新SOTA

近年来，大型语言模型（LLMs）在代码相关的任务上展现了惊人的表现，各种代码大模型层出不穷。这些成功的案例表明，在大规模代码数据上进行预训练可以显著提升模型的核心编程能力。

来自主题: AI技术研报

10617 点击 2025-03-02 14:13

DeepSeek R1也会大脑过载？过度思考后性能下降，少琢磨让计算成本直降43％

原来，大型推理模型（Large Reasoning Model，LRM）像人一样，在「用脑过度」也会崩溃，进而行动能力下降。

来自主题: AI技术研报

8600 点击 2025-03-02 14:04

Claude 3.7 sonnet系统提示词的哲学

这份提示词有很多哲学性思考，很多表达让我看到背后的设计者把claude当成一个人去设计。　我猜，应该是Amanda Askell（Anthropic负责alignment和character design，是学哲学的一位女生，也是我的榜样) 主要设计的。　

来自主题: AI技术研报

9572 点击 2025-03-02 10:22

AI+居家养老，融资4.2亿美元，住院率降70%，政府凭啥买单？

在老龄化浪潮和医疗系统承压的双重挑战下，居家养老成为破局关键。英国 Cera Care 独辟蹊径，以 AI 技术驱动数字化平台，不仅与政府深度合作，更实现住院率降低70%的医疗奇迹，日节省百万英镑，为深陷困境的英国医疗体系带来效率革命。

来自主题: AI资讯

9586 点击 2025-03-01 10:52

Karpathy更新AI科普视频，网友：原本周末打算结个婚，改看视频了

他是真的想教会大家。

来自主题: AI资讯

8814 点击 2025-02-28 15:56

还得是三哥：DeepSeek在印度遭遇全球首起诉讼

2月12日，DeepSeek迎来全球首场诉讼，印度德里高等法院受理了一项公益诉讼（PIL）。公益诉讼申请人律师Bhavna sharma与Nihit Dalmia在诉讼向法院提出禁令，请求印度政府限制DeepSeek在印度提供服务。

来自主题: AI资讯

11626 点击 2025-02-28 15:42

AI引用正确率仅有4.2- 18.5%，怎么破？「Think&Cite」让AI精准归因生成可信内容

AI引用正确率仅有4.2- 18.5%，用Deep Research就提高了引用正确率吗？似乎用Think&Cite框架的SG-MCTS和过程奖励机制PRM可以解决引用问题，生成可信内容。

来自主题: AI技术研报

11859 点击 2025-02-27 15:13

一文详解：DeepSeek 第四天开源的模型设计套件

第四天，DeepSee发布包括三个主要项目： DualPipe- 一种用于 V3/R1 训练的双向流水线并行算法，实现计算和通信完全重叠； EPLB(Expert Parallelism Load Balancer) - 专为 V3/R1 设计的专家并行负载均衡器； Profile-data- 分析 V3/R1 中计算与通信重叠的性能数据集。

来自主题: AI技术研报

10970 点击 2025-02-27 12:16