AI资讯新闻榜单内容搜索-图像生成模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 图像生成模型
清华、西交联合开源发布了Cheers : 一条更简洁、更高效的统一多模态路线

清华、西交联合开源发布了Cheers : 一条更简洁、更高效的统一多模态路线

清华、西交联合开源发布了Cheers : 一条更简洁、更高效的统一多模态路线

过去几年,多模态模型在理解任务上快速演进,图像问答、OCR、视觉推理、跨模态对话等能力不断提升;与此同时,图像生成模型也在视觉质量、指令遵循和细节表达上持续突破。下一步一个自然的问题是:能否用同一个模型,同时做好理解与生成?这正是统一多模态模型(Unified Multimodal Models, UMMs)正在回答的问题。

来自主题: AI技术研报
6876 点击    2026-03-26 14:45
刚刚,Seedream 5.0上线!字节又一新模型

刚刚,Seedream 5.0上线!字节又一新模型

刚刚,Seedream 5.0上线!字节又一新模型

新模型对标Nano Banana Pro,能免费体验。Seedance 2.0的热度还没下去,字节新模型又来了!今日,字节图像生成模型Seedream 5.0 Preview在视频编辑应用剪映、剪映海外版Capcut、字节AI创作平台小云雀均已上线,在即梦AI平台开启灰度测试,图片生成可限时免费体验。

来自主题: AI资讯
8123 点击    2026-02-10 14:38
国产Nano Banana开源!用华为AI芯片训练,1张图只要1毛钱

国产Nano Banana开源!用华为AI芯片训练,1张图只要1毛钱

国产Nano Banana开源!用华为AI芯片训练,1张图只要1毛钱

今天,首个在国产芯片上完成全程训练的SOTA(最佳水平)多模态模型开源。这是智谱联合华为开源的图像生成模型GLM-Image。从数据到训练的全流程,该模型完全基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成构建。

来自主题: AI资讯
10269 点击    2026-01-14 14:09
阿里开源图片分层新模型Qwen-lmage-Layered,PS危险了?

阿里开源图片分层新模型Qwen-lmage-Layered,PS危险了?

阿里开源图片分层新模型Qwen-lmage-Layered,PS危险了?

抽奖式的生图体验,确实让很多设计师在尝鲜之后又默默打开了 Photoshop。于是乎,阿里千问团队再次出手,开源了一个叫 Qwen-Image-Layered 的模型,试图从底层逻辑上解决这个问题。

来自主题: AI资讯
9996 点击    2025-12-23 17:08
又一国产图像大模型开源!实测连续P图绝了,中文渲染是短板

又一国产图像大模型开源!实测连续P图绝了,中文渲染是短板

又一国产图像大模型开源!实测连续P图绝了,中文渲染是短板

今日,美团正式发布并开源图像生成模型LongCat-Image,这是一款在图像编辑能力上达到开源SOTA水准的6B参数模型,重点瞄准文生图与单图编辑两大核心场景。在实际体验中,它在连续改图、风格变化和材质细节上表现较好,但在复杂排版场景下,中文文字渲染仍存在不稳定的情况。

来自主题: AI资讯
8283 点击    2025-12-08 19:51
破解空间智能数据稀缺难题,影石开源DiT架构全景生成模型,在线可玩

破解空间智能数据稀缺难题,影石开源DiT架构全景生成模型,在线可玩

破解空间智能数据稀缺难题,影石开源DiT架构全景生成模型,在线可玩

空间智能领域的全景数据稀缺问题,有解了。影石研究院团队,推出了基于DiT架构的全景图像生成模型DiT360。通过全新的全景图像生成框架,DiT360能够实现高质量的全景生成。

来自主题: AI技术研报
7267 点击    2025-10-18 12:02
Flux.1 Krea Dev超大杯实测:开源模型能否撼动Midjourney V7 ?

Flux.1 Krea Dev超大杯实测:开源模型能否撼动Midjourney V7 ?

Flux.1 Krea Dev超大杯实测:开源模型能否撼动Midjourney V7 ?

7月底 Black Forest Labs 和 Krea 合作开发的高级文本到图像生成模型 Flux.1 Krea Dev,最近终于有时间进行测评了。Flux.1 Krea Dev 是基于FLUX.1 dev 模型进行蒸馏的,参数规模12B,专注于提升图像的美学和真实感,避免了常见的 AI 生成痕迹(过度饱和或不自然高光等等),更倾向于追求自然细节、照片级真实感和多样性。

来自主题: AI资讯
9017 点击    2025-08-07 10:54
Qwen新开源,把AI生图里的文字SOTA拉爆了

Qwen新开源,把AI生图里的文字SOTA拉爆了

Qwen新开源,把AI生图里的文字SOTA拉爆了

通义模型家族,刚刚又双叒开源了,这次是Qwen-Image——一个200亿参数、采用MMDiT架构的图像生成模型。 这也是通义千问系列中首个图像生成基础模型。

来自主题: AI技术研报
8173 点击    2025-08-05 17:10
智源OmniGen2登场,国产多模态图像生成开源!一周狂揽2000星外网爆火

智源OmniGen2登场,国产多模态图像生成开源!一周狂揽2000星外网爆火

智源OmniGen2登场,国产多模态图像生成开源!一周狂揽2000星外网爆火

智源统一图像生成模型OmniGen2发布后,立刻在AI图像生成领域掀起巨响,多模态技术生态进一步打通。才一周,GitHub星标就已经破了2000,X上的话题浏览数直接破数十万。

来自主题: AI技术研报
8082 点击    2025-07-03 19:04
刚刚,OpenAI图像生成模型API发布,Token计价,一张图花掉1.4元

刚刚,OpenAI图像生成模型API发布,Token计价,一张图花掉1.4元

刚刚,OpenAI图像生成模型API发布,Token计价,一张图花掉1.4元

上个月,OpenAI 在 ChatGPT 中引入了图像生成功能,广受欢迎:仅在第一周,全球就有超过 1.3 亿用户创建了超过 7 亿张图片。就在刚刚,OpenAI 又宣布了一个好消息:他们正式在 API 中推出驱动 ChatGPT 多模态体验的原生模型 ——gpt-image-1,让开发者和企业能够轻松将高质量、专业级的图像生成功能直接集成到自己的工具和平台中。

来自主题: AI资讯
9894 点击    2025-04-24 09:44