AI资讯新闻榜单内容搜索-模型权重

美国政府「AI行动计划」万言书发布！ OpenAI与Anthropic呼吁联手封锁中国AI

就在刚刚，美国政府曝光了各界对「AI行动计划」的全部政策建议。OpenAI措辞激烈地表示，DeepSeek让我们看到，必须马上锁死中国AI，必须限制高端GPU芯片和模型权重流向中国！Anthropic同样呼吁：必须立马补上H20这一关键漏洞，并且严控H100的门槛。

来自主题: AI资讯

9250 点击 2025-04-26 19:49

新国产AI视频生成模型横空出世，一夜间全网刷屏。Magi-1，首个实现顶级画质输出的自回归视频生成模型，模型权重、代码100%开源。整整61页的技术报告中还详细介绍了创新的注意力改进和推理基础设施设计，给人一种视频版DeepSeek的感觉。

来自主题: AI资讯

11448 点击 2025-04-22 14:54

千亿参数内最强推理大模型，刚刚易主了。32B——DeepSeek-R1的1/20参数量；免费商用；且全面开源——模型权重、训练数据集和完整训练代码，都开源了。这就是刚刚亮相的Skywork-OR1 (Open Reasoner 1)系列模型——

来自主题: AI资讯

11766 点击 2025-04-13 23:34

最近的研究强调了扩散模型与表征学习之间的相互作用。扩散模型的中间表征可用于下游视觉任务，同时视觉模型表征能够提升扩散模型的收敛速度和生成质量。然而，由于输入不匹配和 VAE 潜在空间的使用，将视觉模型的预训练权重迁移到扩散模型中仍然具有挑战性。

来自主题: AI技术研报

10548 点击 2025-03-17 14:36

你是否想过在自己的设备上运行自己的大型语言模型（LLMs）或视觉语言模型（VLMs）？你可能有过这样的想法，但是一想到要从头开始设置、管理环境、下载正确的模型权重，以及你的设备是否能处理这些模型的不确定性，你可能就犹豫了。

来自主题: AI技术研报

10490 点击 2024-12-30 16:53

要让大模型适应各不一样的下游任务，微调必不可少。常规的中心化微调过程需要模型和数据存在于同一位置 —— 要么需要数据所有者上传数据（这会威胁到数据所有者的数据隐私），要么模型所有者需要共享模型权重（这又可能泄露自己花费大量资源训练的模型）。

来自主题: AI技术研报

8078 点击 2024-12-19 10:15

Ai2和华盛顿大学联合Meta、CMU、斯坦福等机构发布了最新的OpenScholar系统，使用检索增强的方法帮助科学家进行文献搜索和文献综述工作，而且做到了数据、代码、模型权重的全方位开源。

来自主题: AI技术研报

7248 点击 2024-11-26 14:05

西风

来自主题: AI技术研报

6102 点击 2024-11-05 20:40

视觉语言模型（如 GPT-4o、DALL-E 3）通常拥有数十亿参数，且模型权重不公开，使得传统的白盒优化方法（如反向传播）难以实施。

来自主题: AI技术研报

4645 点击 2024-11-05 15:28

一家刚成立6个月的初创公司Chai Discovery最近发布了能对打甚至超越AlphaFold 3的模型Chai-1，而且放出了模型权重和推理代码。不开源的DeepMind这回还能坐得住吗？

来自主题: AI技术研报

10834 点击 2024-09-16 21:12