AI资讯新闻榜单内容搜索-Image

2天手搓商业级App！开源GLM-5.2+Image2太绝了～【附教程】

大家好，我是袋鼠帝。如果你家的猫狗真的能说话，它们开口第一句会说什么？

来自主题: AI技术研报

9701 点击 2026-06-18 15:29

半月内两次问鼎全球：中国创业公司，在AI图像生成赛道掀了桌子

每一次技术范式的重大转换，都是旧秩序松动、新物种诞生的窗口期。

来自主题: AI资讯

7531 点击 2026-06-11 15:00

HiDream-O1-Image-1.5 刷新国产图像生成模型纪录：砍掉 VAE，是图像模型的未来吗？

文生图的"慢思考"，到底有没有用？

来自主题: AI资讯

6603 点击 2026-06-11 10:41

扩散模型里的噪声，原来还有这样的作用：DRDD重新定义统一图像翻译

在图像到图像翻译（Image-to-Image Translation, I2I）这个任务上，扩散模型过去几年几乎形成了一套默认逻辑：先把输入图像和噪声混合，再一步步去噪，把目标图像 “还原” 出来。

来自主题: AI技术研报

9965 点击 2026-06-10 15:15

ICML 2026｜文生图模型也会「忘词」？复旦创智等提出Prompt Reinjection，无需训练提升文生图指令遵循能力

近年来，文生图模型的能力快速提升。从 Stable Diffusion 到 FLUX、Qwen-Image，扩散模型已经能够生成高质量图像，也能处理越来越复杂的文本提示。

来自主题: AI技术研报

9580 点击 2026-06-09 10:02

一步生成 ImageNet FID 1.29！斯坦福用 Wasserstein 梯度流重写一步生成模型

训练时让分布沿最优传输的 “下山方向” 走，推理时只需一次网络前向。W-Flow 把多步演化压进静态生成器，在 ImageNet 256×256 上刷新一步生成指标。

来自主题: AI技术研报

9549 点击 2026-06-03 14:34

文生图开源第一易主，但 HiDream-O1-Image 为什么褒贬不一？

UiT 架构探路者，底牌还没亮。

来自主题: AI资讯

10508 点击 2026-06-02 15:05

AI实验室Agnes AI开放全模态不限时免费API！重点是免费！

在这场日益蔓延的“Token焦虑”中，Agnes AI的举动显得格外扎眼——这家全球榜单排名第九的AI Lab宣布，自6月1日起，旗下全模态模型API无限期免费开放。Agnes AI本次开放覆盖其三款核心模型：文本模型Agnes-2.0-Flash、图像模型Agnes-Image-2.0-Flash以及视频模型Agnes-Video-V2.0。

来自主题: AI资讯

12999 点击 2026-06-01 11:24

李飞飞造了ImageNet，现在她又带人超越了它

就在前两天，斯坦福大学等机构发布了一个名为 GPIC（Giant Permissive Image Corpus，巨型开放图像语料库）的数据集。

来自主题: AI技术研报

9202 点击 2026-05-30 15:57

DeepSeek陈德里开发自动研究Skill，用DeliAutoResearch写一篇论文人类只动脑2小时

DeepSeek研究员陈德里，在个人博客更新一篇研究综述论文。用的是他自己的技能DeliAutoResearch，DeepSeek-V4-Pro研究和写作，GPT-Image2画图。论文共迭代6次（V1：4 次，V2：1 次，V3：1 次），总耗时6天，进行了约108轮Agent调用，消耗64.8万token，写了2234行LaTeX代码。

来自主题: AI资讯

10029 点击 2026-05-27 09:47