将DSA注意力引入多模态,快手Keye2.0开启强化推理新范式
将DSA注意力引入多模态,快手Keye2.0开启强化推理新范式当你把一段长达9分钟、在“晴空万里”与“冰天雪地”间剧烈切换的冰岛旅行Vlog输入给大模型,并要求它做一份旅行攻略时,常规的视觉大模型通常只能给出一份基于字幕和画面标签拼凑的“流水账”。
搜索
当你把一段长达9分钟、在“晴空万里”与“冰天雪地”间剧烈切换的冰岛旅行Vlog输入给大模型,并要求它做一份旅行攻略时,常规的视觉大模型通常只能给出一份基于字幕和画面标签拼凑的“流水账”。
AI 短剧发展到今天,过去那种靠单打独斗的小作坊模式正在被淘汰。现在复盘榜单上排名靠前的AI短剧内容团队,你会发现里面基本都是几个人、甚至十几人的工作室在共同推进项目。
一家视频公司,用三年时间让全员学会写代码——包括那些从没碰过编程的运营、市场、内容同学。
从来没聊过可灵。
很多人以为,AI视频的终点是“生成一段让人惊艳的画面”。
根据 Sensor Tower 发布的《2026 年全球 AI 应用趋势洞察》,2026 年第一季度,全球 AI 图像视频生成 App 的内购收入达到 1.5 亿美元,环比增长 20%,下载量达到 1.7 亿次,环比增长 12%,均超双位数。
李诞带火了一个AI娱乐应用贝果,带着好奇,我第一时间通过内部朋友要到了内测资格。最上头的是贝果的“现实 Online”这个产品。它的玩法听上去极其简单:拿起手机,随手一扫,但就在这短短几秒钟里,整个办公室瞬间就被改造成了一个可以实时探索的游戏空间。
幽深森林,身着飘逸浅裙的乐手忘情地拉动琴弦。阳光穿透树冠洒落林间,斑驳光影与悠扬的琴声相融。镜头自低处仰拍环绕,营造出如梦似幻的氛围。
那天晚上,《潘神的迷宫》二十周年4K修复版刚放映结束。灯光亮起,大导演德尔·托罗走上台,直接对着麦克风大喊一句:Fuck AI.
过去AI视频是「生成内容」,Omni直接升级成「生成世界」。它懂动能、重力、因果,还能把复杂概念瞬间可视化。人类距离「言出法随」的梦想,还剩几个Gemini Omni的距离?