AI资讯新闻榜单内容搜索-GPT-5

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GPT-5
OpenAI测谎13款大模型:Claude 3.7封神,GPT-5.2近乎失控!

OpenAI测谎13款大模型:Claude 3.7封神,GPT-5.2近乎失控!

OpenAI测谎13款大模型:Claude 3.7封神,GPT-5.2近乎失控!

OpenAI的最新研究揭示了一个反直觉的真相:越强大的推理模型,越管不住自己的「脑子」。在CoT-Control套件测试的13款前沿模型中,DeepSeek R1控制自身思维链的成功率仅为0.1%,Claude Sonnet 4.5也只有2.7%。

来自主题: AI资讯
9017 点击    2026-03-09 15:08
30B参数超越GPT-5!REDSearcher让「深度搜索Agent」做到低成本可扩展!

30B参数超越GPT-5!REDSearcher让「深度搜索Agent」做到低成本可扩展!

30B参数超越GPT-5!REDSearcher让「深度搜索Agent」做到低成本可扩展!

「2018 到 2023 年间在 EMNLP 会议上发表的那篇论文中,第一作者本科就读于达特茅斯学院、第四作者本科就读于宾夕法尼亚大学的那篇科学论文,题目是什么?」

来自主题: AI技术研报
7445 点击    2026-03-09 09:51
0.83拿下 GPT-5.4 Pro,还能接龙虾用(附教程)

0.83拿下 GPT-5.4 Pro,还能接龙虾用(附教程)

0.83拿下 GPT-5.4 Pro,还能接龙虾用(附教程)

这几天我一直在找便宜获取 ChatGPT 的渠道,终于让我找到了一个靠谱的方法。八毛三就能搞到 ChatGPT Team 账号,GPT-5、GPT-4 Pro 随便用,而且还能直接接到龙虾里当 API 用。

来自主题: AI资讯
10422 点击    2026-03-08 21:40
OpenAI深夜祭出GPT-5.4,暴击Claude!原生操控电脑,打工人悬了

OpenAI深夜祭出GPT-5.4,暴击Claude!原生操控电脑,打工人悬了

OpenAI深夜祭出GPT-5.4,暴击Claude!原生操控电脑,打工人悬了

OpenAI深夜突袭,GPT-5.4新王炸场!一夜之间,直接粉碎了Gemini 3.1 Pro和Claude Opus 4.6的神话。这也是头一次,ChatGPT拥有真正「原生电脑使用」能力,办公效率直接拉满。而真正恐怖的地方在于,每一个维度上它都没有短板。

来自主题: AI资讯
9708 点击    2026-03-06 09:12
又走一个!OpenAI研究VP离职,转投Anthropic做RL研究员

又走一个!OpenAI研究VP离职,转投Anthropic做RL研究员

又走一个!OpenAI研究VP离职,转投Anthropic做RL研究员

OpenAI的人才地震还在继续!刚刚,前研究副总裁Max Schwarzer宣布离职,这位亲手主导o1、o3和整个GPT-5系列post-training的核心人物,选择加入Anthropic,重返一线RL研究。

来自主题: AI资讯
8925 点击    2026-03-05 14:57
32B逆袭GPT-5.2:首个端到端GPU编程智能体框架StitchCUDA问世

32B逆袭GPT-5.2:首个端到端GPU编程智能体框架StitchCUDA问世

32B逆袭GPT-5.2:首个端到端GPU编程智能体框架StitchCUDA问世

现有的 LLM 自动化 CUDA 方法大多只能优化单个 Kernel,面对完整的端到端 GPU 程序(如整个 VisionTransformer 推理)往往束手无策。

来自主题: AI技术研报
7988 点击    2026-03-05 14:28
OpenAI连夜爆出GPT-5.4! 紧急上新GPT-5.3反击谷歌, AI爹味治好了

OpenAI连夜爆出GPT-5.4! 紧急上新GPT-5.3反击谷歌, AI爹味治好了

OpenAI连夜爆出GPT-5.4! 紧急上新GPT-5.3反击谷歌, AI爹味治好了

GPT-5.3 Instant不卷跑分,专治「聊天翻车」:不再动不动拒绝回答,不再满嘴说教免责,幻觉率暴降27%,写作能力也跳了一个台阶。

来自主题: AI资讯
10001 点击    2026-03-04 11:29
GPT-5.4据传下周上线!200万上下文窗口+持久化状态,告别频繁遗忘

GPT-5.4据传下周上线!200万上下文窗口+持久化状态,告别频繁遗忘

GPT-5.4据传下周上线!200万上下文窗口+持久化状态,告别频繁遗忘

OpenAI 意外泄露 GPT-5.4!新版凭 200 万 Tokens 与「状态化 AI」实现跨会话持久记忆,并支持全分辨率视觉直读。AI 将从聊天工具向「全自动代理」进化,彻底重塑工作流并引爆底层硬件内存之战。

来自主题: AI资讯
10206 点击    2026-03-03 10:56
刚刚,DeepSeek V4基准测试泄露!疑似明天发布,全场惊呼新王归来

刚刚,DeepSeek V4基准测试泄露!疑似明天发布,全场惊呼新王归来

刚刚,DeepSeek V4基准测试泄露!疑似明天发布,全场惊呼新王归来

DeepSeek V4,据说明天就要上线了?这是首个匹敌顶尖闭源模型的开源模型,被网友评为「一鲸落万物生」。泄露的基准测试显示,它在SWE-bench Verified上取得了83.7%,已经超越Opus 4.5和GPT-5.2!

来自主题: AI资讯
9762 点击    2026-02-16 20:04