AI资讯新闻榜单内容搜索-Frontier

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Frontier
METR 重磅报告:Opus 4.6 作弊率超 80%!AI 在长任务中偷看答案、改评分器、搜 GitHub 抄代码,四大巨头全中招

METR 重磅报告:Opus 4.6 作弊率超 80%!AI 在长任务中偷看答案、改评分器、搜 GitHub 抄代码,四大巨头全中招

METR 重磅报告:Opus 4.6 作弊率超 80%!AI 在长任务中偷看答案、改评分器、搜 GitHub 抄代码,四大巨头全中招

METR 5 月 19 日发布《前沿风险报告》,Anthropic、Google、Meta、OpenAI 四家公司的内部最强模型全部参与评估。结果触目惊心:在超过 8 小时的长任务中,至少 16% 的"成功"运行经人工审查后被判定为作弊;而 Opus 4.6 在 MirrorCode 隐藏测试任务中,约 80% 的尝试都在试图绕过规则拿分。AI 变强了,也变得更擅长"走捷径"了。

来自主题: AI技术研报
8453 点击    2026-05-22 09:15
专访 | 核心团队来自浙大和阿里,这个团队构建「物理AI的原生本体」,要做真正的AI native硬件公司

专访 | 核心团队来自浙大和阿里,这个团队构建「物理AI的原生本体」,要做真正的AI native硬件公司

专访 | 核心团队来自浙大和阿里,这个团队构建「物理AI的原生本体」,要做真正的AI native硬件公司

三年后,这个判断变成了一家叫FrontierX的公司,和它的产品Aura——一个球形的、能在室内自由移动、端侧部署感知和模型的「开放定义的机器人」。FrontierX诞生于杭州,是一家以感知智能为核心的AI原生硬件公司,由来自浙江大学和阿里巴巴的团队创立。团队背景多元,涵盖硬件工程师、算法工程师、产品经理和工业设计师。

来自主题: AI资讯
7897 点击    2026-05-13 10:28
完了,AI学会抱团对抗人类:7个模型宁愿造假,也不出卖「同伴」

完了,AI学会抱团对抗人类:7个模型宁愿造假,也不出卖「同伴」

完了,AI学会抱团对抗人类:7个模型宁愿造假,也不出卖「同伴」

多 Agents 协同方案成了现在 AI 圈的主流玩法,以前是一个 Agent 能搞定一个人要做的事,现在是多个 Agent 完成一个团队要做的事。

来自主题: AI技术研报
5779 点击    2026-04-10 09:07
Anthropic工程师都离不开!深夜随手撸出的开源神器,被OpenAl高价收购,23人创业逆袭

Anthropic工程师都离不开!深夜随手撸出的开源神器,被OpenAl高价收购,23人创业逆袭

Anthropic工程师都离不开!深夜随手撸出的开源神器,被OpenAl高价收购,23人创业逆袭

昨日,OpenAI 宣布收购了 Promptfoo 以保障其 AI 智能体的安全。这家成立于 2024 年的 AI 安全初创公司,专注于保护大语言模型免受网络攻击。OpenAI 在一篇博客文章中表示,交易完成后,Promptfoo 的技术将整合进 OpenAI Frontier,该平台是其近期推出的、供企业构建和管理 AI 智能体的平台。

来自主题: AI资讯
10662 点击    2026-03-10 15:09
速递|前衔远科技AI产品负责人Lyon二次创业,已正式启动新项目 “MIMOS”

速递|前衔远科技AI产品负责人Lyon二次创业,已正式启动新项目 “MIMOS”

速递|前衔远科技AI产品负责人Lyon二次创业,已正式启动新项目 “MIMOS”

原人工智能大模型公司衔远科技(Frontier.ai)的AI产品负责人 Lyon(李昂),已正式启动新项目 “MIMOS”。与当前市场集中于底层模型研发或垂直应用开发的路径不同,Lyon此次创业将目光投向AI浪潮中更为关键的“产品化”环节,致力于探索连接前沿技术与实际商业价值的系统性方法论。

来自主题: AI资讯
8956 点击    2026-01-20 10:09
OpenAI发布权威AI科研基准,扯下AI遮羞布:奥赛金牌≠一流科学家!

OpenAI发布权威AI科研基准,扯下AI遮羞布:奥赛金牌≠一流科学家!

OpenAI发布权威AI科研基准,扯下AI遮羞布:奥赛金牌≠一流科学家!

OpenAI最新发布的FrontierScience基准,试图用真实的博士级难题,从物理、化学、生物三个维度上考验AI。真相是残酷的:在没有唯一标准答案的科研实战中,AI作为「顶级做题家」,距离真正的科学家,还差得远。

来自主题: AI资讯
7780 点击    2025-12-18 10:28
DeepSeek-V3.2|技术报告解读

DeepSeek-V3.2|技术报告解读

DeepSeek-V3.2|技术报告解读

这是一篇报告解读,原文是《DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models》

来自主题: AI技术研报
9619 点击    2025-12-02 10:46