AI资讯新闻榜单内容搜索-AR

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: AR
谷歌提示词比赛亚军:把AI当同事,而不是机器

谷歌提示词比赛亚军:把AI当同事,而不是机器

谷歌提示词比赛亚军:把AI当同事,而不是机器

最近,谷歌与瑞士邮政下属的 Digitalidag 联合举办了一场提示词比赛,选手们的任务是编写提示词(指令),比如让 AI 助手制定一份详细的学习计划。Joakim Jardenberg 获得了本次比赛的亚军,Wrap News 对其进行了一场专访,就提示词的创作进行了交流。

来自主题: AI资讯
11351 点击    2025-03-03 21:02
Claude 3.7硬控马里奥90秒,GPT-4o开局暴毙!Karpathy直呼基准失效,游戏成LLM新战场

Claude 3.7硬控马里奥90秒,GPT-4o开局暴毙!Karpathy直呼基准失效,游戏成LLM新战场

Claude 3.7硬控马里奥90秒,GPT-4o开局暴毙!Karpathy直呼基准失效,游戏成LLM新战场

Karpathy发出灵魂拷问,评估AI究竟该看哪些指标?答案或许就藏在经典游戏里!最近,加州大学圣迭戈分校Hao AI Lab用超级马里奥等评测AI智能体,Claude 3.7结果令人瞠目结舌。

来自主题: AI资讯
8605 点击    2025-03-03 16:00
微软原WizardLM团队:代码大模型WarriorCoder,性能新SOTA

微软原WizardLM团队:代码大模型WarriorCoder,性能新SOTA

微软原WizardLM团队:代码大模型WarriorCoder,性能新SOTA

近年来,大型语言模型(LLMs)在代码相关的任务上展现了惊人的表现,各种代码大模型层出不穷。这些成功的案例表明,在大规模代码数据上进行预训练可以显著提升模型的核心编程能力。

来自主题: AI技术研报
10617 点击    2025-03-02 14:13
Claude 3.7 sonnet系统提示词的哲学

Claude 3.7 sonnet系统提示词的哲学

Claude 3.7 sonnet系统提示词的哲学

这份提示词有很多哲学性思考,很多表达让我看到背后的设计者把claude当成一个人去设计。  我猜,应该是Amanda Askell(Anthropic负责alignment和character design,是学哲学的一位女生,也是我的榜样) 主要设计的。 

来自主题: AI技术研报
9572 点击    2025-03-02 10:22
AI+居家养老,融资4.2亿美元,住院率降70%,政府凭啥买单?

AI+居家养老,融资4.2亿美元,住院率降70%,政府凭啥买单?

AI+居家养老,融资4.2亿美元,住院率降70%,政府凭啥买单?

在老龄化浪潮和医疗系统承压的双重挑战下,居家养老成为破局关键。英国 Cera Care 独辟蹊径,以 AI 技术驱动数字化平台,不仅与政府深度合作,更实现住院率降低70%的医疗奇迹,日节省百万英镑,为深陷困境的英国医疗体系带来效率革命。

来自主题: AI资讯
9586 点击    2025-03-01 10:52
还得是三哥:DeepSeek在印度遭遇全球首起诉讼

还得是三哥:DeepSeek在印度遭遇全球首起诉讼

还得是三哥:DeepSeek在印度遭遇全球首起诉讼

2月12日,DeepSeek迎来全球首场诉讼,印度德里高等法院受理了一项公益诉讼(PIL)。公益诉讼申请人律师Bhavna sharma与Nihit Dalmia在诉讼向法院提出禁令,请求印度政府限制DeepSeek在印度提供服务。

来自主题: AI资讯
11626 点击    2025-02-28 15:42
AI引用正确率仅有4.2- 18.5%,怎么破?「Think&Cite」让AI精准归因生成可信内容

AI引用正确率仅有4.2- 18.5%,怎么破?「Think&Cite」让AI精准归因生成可信内容

AI引用正确率仅有4.2- 18.5%,怎么破?「Think&Cite」让AI精准归因生成可信内容

AI引用正确率仅有4.2- 18.5%,用Deep Research就提高了引用正确率吗?似乎用Think&Cite框架的SG-MCTS和过程奖励机制PRM可以解决引用问题,生成可信内容。

来自主题: AI技术研报
11859 点击    2025-02-27 15:13
一文详解:DeepSeek 第四天开源的模型设计套件

一文详解:DeepSeek 第四天开源的模型设计套件

一文详解:DeepSeek 第四天开源的模型设计套件

第四天,DeepSee发布包括三个主要项目: DualPipe- 一种用于 V3/R1 训练的双向流水线并行算法,实现计算和通信完全重叠; EPLB(Expert Parallelism Load Balancer) - 专为 V3/R1 设计的专家并行负载均衡器; Profile-data- 分析 V3/R1 中计算与通信重叠的性能数据集。

来自主题: AI技术研报
10970 点击    2025-02-27 12:16