奥特曼亲自上阵,Images 2.0登顶王座!大米刻字,生图跨入GPT-5时代
奥特曼亲自上阵,Images 2.0登顶王座!大米刻字,生图跨入GPT-5时代今夜,ChatGPT Images 2.0震撼上线,成为首个「会思考」的图像AI。奥特曼直呼这是从GPT-3到GPT-5的飞跃。它不仅能精准听懂中文指令、渲染复杂UI,甚至能在米粒上刻字。
搜索
今夜,ChatGPT Images 2.0震撼上线,成为首个「会思考」的图像AI。奥特曼直呼这是从GPT-3到GPT-5的飞跃。它不仅能精准听懂中文指令、渲染复杂UI,甚至能在米粒上刻字。
先说一个很多人没意识到的事实:2026年了,每个主流Agent框架底下的工具调用训练数据,格式全是乱的。
这个生物医学视觉推理框架,被CVPR 2026接收了!
北京时间凌晨 3 点,直播准时开始,OpenAI 发布了 ChatGPT Images 2.0。据介绍,「ChatGPT Images 2.0 是下一步进化:一个最先进的模型,能够处理复杂的视觉任务,并生成精确、可直接使用的视觉内容。」
使用 GPT Image 2 甚至不太需要过于复杂的提示词,我们的测试都是一两句简单的画面描述,或者再加上图片尺寸要求,如 21:9、16:9、9:16 等。 例如让它生成广州市小学数学试卷。
Kimi 刚刚发布了 K2.6,Agent 模式也同步大升级。
“给我们剧透一下 M3 吧。”
一直以来,我都觉得,对于 AI Agent 来说,最好的 Skill(技能)就是各种 APP。特别是在国内,大部分 APP 都是不那么 Open 的。不过最近,我发现了一个宝藏开源项目,可以解决这个问题。它叫 Turix CUA。
如果把今天最热门的几个方向摆在一起看,你会发现它们其实在卡同一道坎。
今天,我们发布并开源 Kimi K2.6 模型,带来行业领先(state-of-the-art)的代码、长程任务执行和 Agent 集群能力。Kimi K2.6 现已上线 kimi.com、最新版 Kimi 应用、Kimi API 和 Kimi Code 编程助手,所有用户都可以开始使用。