高效智能体的「幕后推手」是谁?一篇综述带你从记忆×工具学习×规划看透
高效智能体的「幕后推手」是谁?一篇综述带你从记忆×工具学习×规划看透随着大模型能力的跃迁,业界关注点正在从 “模型能不能做” 快速转向 “智能体能不能落地”。过去一年可以看到大量工作在提升智能体的有效性(effectiveness):如何让它更聪明、更稳、更会用工具、更能完成复杂任务。
搜索
随着大模型能力的跃迁,业界关注点正在从 “模型能不能做” 快速转向 “智能体能不能落地”。过去一年可以看到大量工作在提升智能体的有效性(effectiveness):如何让它更聪明、更稳、更会用工具、更能完成复杂任务。
在达沃斯论坛之后,谷歌Deepmind CEO Demis Hassabis又连续上了两个播客,放出了不少谷歌的新动向!
阿里巴巴推出了Qwen3-Max-Thinking,这是阿里千问系列目前能力最强的旗舰级推理模型,在19项权威基准测试中,Qwen3-Max-Thinking跟GPT-5.2-Thinking、Claude-Opus-4.5和Gemini 3 Pro等顶尖模型打得有来有回,搭配测试时扩展(TTS)能力后,能在不少基准测试上达到SOTA。
《读佳》获悉,京东加码AI生活服务赛道,上线了两款AI社交APP“东东”和“JoyAI”,两者定位有所不同,东东APP专为“银发青年”(55岁到64岁)群体打造的贴心智能助手,JoyAI APP则聚焦年轻及泛大众用户的多元化需求,定位能帮用户解决问题的万能数字人助手。两款产品均是打通京东生态服务,从聊天互动到语音点外卖、购物、问诊延展。
AI 员工很美好,但现阶段的它还很「危险」。
近日,北京大学朱毅鑫教授课题组、北京大学毕彦超教授课题组和山西医科大学第一医院王效春团队通过结合 AI 模型和大脑损伤患者的数据,发现语言其实是一副无形的智能眼镜,时刻在悄悄修饰着我们看到的世界。我们可能以为视觉就是眼睛看到什么就是什么,但是这项成果说明了视觉从来都不是孤立的。事实上,当我们在看图片的时候,其实不只是在看,而是在进行被语言调制过的看。
100%是用Codex写的。还有内部爆料说,Codex让他们仅用三天时间就搭出了服务器,三周就发布了APP。人类程序员,真的要退出历史舞台了?
你的童年我的童年好像不一样。
我一直有一个习惯,就每天都会刷 Twitter。倒也不是为了打发时间,而是因为在 AI 这个领域,Twitter 几乎是最前沿的信息源。新论文、新产品、行业八卦、技术突破,很多时候,等中文媒体跟进报道,已经是三五天后的事了。
嗨大家好!我是阿真! 了解我的人都知道,虽然我混得不怎么样,但是我的朋友都牛逼且靠谱,前几天藏师傅(@歸藏的AI工具箱)跟我说有个大佬有新产品要上了,这个情况我都是二话不说直接冲的。