阿里文生视频挑战Gen-2、Pika,1280×720分辨率无压力,3500万文本-视频对显奇效
阿里文生视频挑战Gen-2、Pika,1280×720分辨率无压力,3500万文本-视频对显奇效文生视频可以精细到什么程度?最近,阿里巴巴的一项研究给出了答案:1280×720 分辨率没有压力,而且生成效果非常连贯。
搜索
文生视频可以精细到什么程度?最近,阿里巴巴的一项研究给出了答案:1280×720 分辨率没有压力,而且生成效果非常连贯。
离圣诞节还有一周了,GPT-4.5是发还是不发?OpenAI还没动作,网上已经是各种爆料漫天飞。各位大V煞有介事,Altman则是急着辟谣。按以往的规律看,这次爆料的真实性倒是不小。
本文讨论了巨头AI受困于巨头垄断的问题,指出在线模型受商业壁垒限制,无法满足用户的个性化需求。文章以旅行计划为例,说明了通过本地部署的通用AI可以更好地满足用户需求。
甲方说的话太模糊,让你全靠想象?最新模型Creative Agents帮你实现创造式任务!
Gemini Pro API今天上线即免费,开发者可以通过Vertex AI定制自己的Gemini。同时,Gemini也将支持谷歌的AI代码助手——Duet AI。
今年10月,《时代》杂志发布了一份「2023最佳发明」榜单,为了呼应AI浪潮,《时代》从去年开始就特别设置了「AI单元」。在今年入选的十几个应用中,排在老牌软件巨头Adobe和屠龙少年OpenAI之后的就是大火的文生视频应用——Runway Gen-2。
上个月,微软 CEO 纳德拉在 Ignite 大会上宣布自研小尺寸模型 Phi-2 将完全开源,在常识推理、语言理解和逻辑推理方面的性能显著改进。
都快到年底了,大模型领域还在卷,今天,Microsoft发布了参数量为2.7B的Phi-2——不仅13B参数以内没有对手,甚至还能和Llama 70B掰手腕!
进入多模态时代,大模型也会操纵无人机了!只要视觉模块捕捉到启动条件,大模型这个“大脑”就会生成动作指令,接着无人机便能迅速准确地执行。
今天,李飞飞携斯坦福联袂谷歌,用Transformer生成了逼真视频,效果媲美Gen-2比肩Pika。2023年俨然已成AI视频元年!