在对齐 AI 时,为什么在线方法总是优于离线方法?
在对齐 AI 时,为什么在线方法总是优于离线方法?在线和离线对齐算法的性能差距根源何在?DeepMind实证剖析出炉
搜索
在线和离线对齐算法的性能差距根源何在?DeepMind实证剖析出炉
Anthropic发布最新Claude宪法,兼具标准性和灵活性。语言模型如何决定它将涉及哪些问题,哪些问题它认为不合适涉及?为什么它会鼓励某些行为,而阻止另一些行为?语言模型有哪些「价值观」?
OpenAI半小时的发布会让很多人第一反应是直呼「失望」,但随着官网放出更多demo以及更多网友开始试用,大家才发现GPT-4o真的不可小觑,不仅在各种基准测试中稳拿第一,而且有很多发布会从未提及的惊艳功能。
还有约165个大模型尚未获得“过审”机会。
火热和洗牌并行,AI赛道到了残酷较量的阶段。
一切都是为了布局具身智能!
文生图模型成熟之后,有多少人苦练Midjourney咒语,还是调不出可用的图像?
“Scaling Law不是万金油”——关于大模型表现,华为又提出了新理论。
许多临床任务需要了解专业数据,例如医学图像、基因组学,这类专业知识信息在通用多模态大模型的训练中通常不存在。
本次公布的获奖论文中,有多位华人作者。