字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍
字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍在生成式模型的迅速发展中,Image Tokenization 扮演着一个很重要的角色,例如Diffusion依赖的VAE或者是Transformer依赖的VQGAN。这些Tokenizers会将图像编码至一个更为紧凑的隐空间(latent space),使得生成高分辨率图像更有效率。
在生成式模型的迅速发展中,Image Tokenization 扮演着一个很重要的角色,例如Diffusion依赖的VAE或者是Transformer依赖的VQGAN。这些Tokenizers会将图像编码至一个更为紧凑的隐空间(latent space),使得生成高分辨率图像更有效率。
按部就班 vs. 好奇心驱动,哪个更容易出研究成果?
芯东西6月21日消息,据The Information报道,研发出世界最大芯片的明星AI芯片独角兽Cerebras Systems已向证券监管机构秘密申请IPO。
据外媒 the Information 报道,月之暗面正在为进军美国市场做准备。据悉,月之暗面正在进行新一轮融资,估值有望达到 30 亿美元,新的投资者包括腾讯。而在今年 2 月,月之暗面才获得了由阿里领投的 10 亿美元融资,当时估值约 15 亿美元。
拯救4bit扩散模型精度,仅需时间特征维护——以超低精度量化技术重塑图像内容生成!
WWDC上展示的苹果AI能力,在秋季iOS 18推出之后,很难用得上了。最新报道称,集成强大Siri的苹果AI将在今年晚些时候推出,而且苹果正设计一款更轻薄的iPhone,预计在2025年上线。
2024 年 5 月,DreamTech 官宣了其高质量 3D 生成大模型 Direct3D,并公开了相关学术论文 Direct3D: Scalable Image-to-3D Generation via 3D Latent Diffusion Transformer。
这几天,最新发布的Stable Diffusion 3和Luma AI的视频生成模型Dream Machine相继发布,但这两个模型却用非常独特的方式震撼到了网友们。Dream Machine加上二创脑洞成为快乐源泉,SD3输出的诡异图片却散发着浓浓的「黑色幽默」。
让AI画漫画角色保持一致的新研究来了!
没想到……Stable Diffusion 3开源即出现翻车案例。 生成一个躺在草地上的女孩,结果长这样?