AI资讯新闻榜单内容搜索-RL

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: RL
难绷...懂王做了中转站,提供稳定的 Claude,还踏马七折

难绷...懂王做了中转站,提供稳定的 Claude,还踏马七折

难绷...懂王做了中转站,提供稳定的 Claude,还踏马七折

懂王开始做 API 中转站了,还七折的 Claude 的 API。买多了,还抽送懂王的私人晚宴名额!项目叫 WorldClaw,可以理解为 OpenRouter 的懂王版,在这里,需要用懂王的加密货币 WLFI 结算,聚合了 300 多个 AI 模型,声称比官方定价低 30%

来自主题: AI资讯
8891 点击    2026-05-06 19:57
阿里开源PromptEcho:用冻结多模态大模型为文生图训练提供高质量Reward

阿里开源PromptEcho:用冻结多模态大模型为文生图训练提供高质量Reward

阿里开源PromptEcho:用冻结多模态大模型为文生图训练提供高质量Reward

用强化学习(RL)优化文生图模型的 prompt following 能力,是一条被广泛验证的路径 —— 让模型根据 prompt 用不同随机种子生成多张图片,通过 reward model 计算 reward,再利用相关 RL 算法优化模型。

来自主题: AI技术研报
7047 点击    2026-05-06 14:27
Agent-World:扩展真实世界环境,让智能体与环境协同进化!

Agent-World:扩展真实世界环境,让智能体与环境协同进化!

Agent-World:扩展真实世界环境,让智能体与环境协同进化!

随着MCP、Agent Skills与各类Harness的快速发展,大模型能轻松调用成百上千种外部工具,但在多工具,具备复杂状态、长程交互的任务上仍有明显短板。尽管一系列环境扩展方法尝试复刻真实世界的交互环境(如订票系统,外卖平台),但仍受限于环境扩展的规模与真实性。

来自主题: AI技术研报
6169 点击    2026-05-06 09:06
一句话造世界!开发者用10天婚假爆肝,让AI小镇真正「活」了过来

一句话造世界!开发者用10天婚假爆肝,让AI小镇真正「活」了过来

一句话造世界!开发者用10天婚假爆肝,让AI小镇真正「活」了过来

2023年斯坦福「AI小镇」火了,后续也诞生了大量类似的热门项目,但所有这类项目都有一个共同瓶颈——世界是人工搭建的,固定的。最近,一位独立开发者用10天婚假爆肝了一个项目WorldX:输入一句话、5分钟,一个完整的AI世界就诞生了——地图、角色、动画、人设全部自动生成,AI角色们自主在其中生活、对话、形成记忆、产生戏剧性的涌现行为。

来自主题: AI资讯
9044 点击    2026-05-01 13:35
老黄秘密武器曝光:AI一夜设计芯片,顶人类顶级工程师10个月!

老黄秘密武器曝光:AI一夜设计芯片,顶人类顶级工程师10个月!

老黄秘密武器曝光:AI一夜设计芯片,顶人类顶级工程师10个月!

8人团队干10个月,AI只需一夜!英伟达祭出「造芯」神技:芯片设计效率狂飙百倍,非人类直觉的设计方案惊呆工程师。硅基生命开始自进化,人类正退居二线?进来看黄仁勋的秘密武器。

来自主题: AI资讯
7654 点击    2026-05-01 11:08
Claude 嘴上说不要中国,背地里把中文做得飞起

Claude 嘴上说不要中国,背地里把中文做得飞起

Claude 嘴上说不要中国,背地里把中文做得飞起

我发现:Claude 一边把中国大陆挡在门外,一边在认认真真做简体中文。事情是这样—— 前两天我把 Claude 文档 URL 里的 /en/ 改成了 /zh-CN/。页面唰地就变了。整站简体中文,翻译贼讲究。

来自主题: AI资讯
9499 点击    2026-05-01 10:58
ACL 2026|Doc-V*:读100页文档不如只翻对5页,80页场景「暴打」RAG 10个点

ACL 2026|Doc-V*:读100页文档不如只翻对5页,80页场景「暴打」RAG 10个点

ACL 2026|Doc-V*:读100页文档不如只翻对5页,80页场景「暴打」RAG 10个点

Doc-V* 由小米大模型 Plus 团队和华中科技大学 VLRLab 团队合作提出,一种从「静态阅读」到「主动探索」的多页文档理解新范式,通过交互式视觉推理让模型像人一样有策略地阅读长文档。

来自主题: AI技术研报
8487 点击    2026-04-30 09:00
黑马世界模型 MotuBrain 打破全球纪录,生数科技零宣发登顶双榜!

黑马世界模型 MotuBrain 打破全球纪录,生数科技零宣发登顶双榜!

黑马世界模型 MotuBrain 打破全球纪录,生数科技零宣发登顶双榜!

世界模型黑马横空出世!就在刚刚,生数科技的MotuBrain零宣发登顶双榜,直接打通「看懂世界+执行行动」,而且不同的是,他们把World Action Model适配多个头部机器人本体,完成多个长程任务,这是国产AI的硬核突围!从此,具身智能彻底迈入新纪元。

来自主题: AI资讯
9074 点击    2026-04-29 20:56
AI能自己打红警了!经济拉满零交战惨遭打脸,玩家笑疯

AI能自己打红警了!经济拉满零交战惨遭打脸,玩家笑疯

AI能自己打红警了!经济拉满零交战惨遭打脸,玩家笑疯

红警不再只是童年游戏,而成了AI Agent的硬核训练场:OpenRA-RL把25Hz实时战场、50个工具调用和64局并发打包开源,让大模型第一次真正站上RTS战争迷雾里的公开考场。

来自主题: AI资讯
7859 点击    2026-04-29 09:55
世界模型双冠王诞生!国产世界模型WorldScape 0.2力压谷歌、英伟达等持续领跑

世界模型双冠王诞生!国产世界模型WorldScape 0.2力压谷歌、英伟达等持续领跑

世界模型双冠王诞生!国产世界模型WorldScape 0.2力压谷歌、英伟达等持续领跑

近日,全球具身世界模型权威基准评测 WorldArena 正式更新最新榜单。Manifold AI 流形空间研发的世界模型 WorldScape 0.2,凭借其在物理规律遵循与多源交互理解上的突破取得 WorldArena 榜单全球第一,充分展现了国产世界模型在复杂动态场景生成与具身控制中的高精度、强泛化与物理可信度。与其同场竞技的包括英伟达、谷歌等国外巨头和星动纪元、极佳视界等国内具身智能公司。

来自主题: AI资讯
10216 点击    2026-04-28 11:05