AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
月之暗面Kimi的技术一点都不落后。

月之暗面Kimi的技术一点都不落后。

月之暗面Kimi的技术一点都不落后。

2 月 18 日,月之暗面发布了一篇关于稀疏注意力框架 MoBA 的论文。MoBA 框架借鉴了 Mixture of Experts(MoE)的理念,提升了处理长文本的效率,它的上下文长度可扩展至 10M。并且,MoBA 支持在全注意力和稀疏注意力之间无缝切换,使得与现有的预训练模型兼容性大幅提升。

来自主题: AI技术研报
9876 点击    2025-02-23 11:38
黄仁勋:市场对DeepSeek的理解完全搞反了

黄仁勋:市场对DeepSeek的理解完全搞反了

黄仁勋:市场对DeepSeek的理解完全搞反了

DeepSeek的横空出世引发大模型算力逻辑的质疑,英伟达股价一度暴跌。然而,黄仁勋却在最新访谈中表示,市场对DeepSeek的理解“完全搞反了”。

来自主题: AI资讯
8277 点击    2025-02-23 11:33
谷歌Fellow级大佬出走!17年老将吴永辉加盟字节,亲自操刀大模型研发

谷歌Fellow级大佬出走!17年老将吴永辉加盟字节,亲自操刀大模型研发

谷歌Fellow级大佬出走!17年老将吴永辉加盟字节,亲自操刀大模型研发

Google Fellow吴永辉博士离职谷歌,正式加入字节跳动,未来将专注于AI基础研究。这位在谷歌深耕17年AI老将,曾主导了神经机器翻译、RankBrain等突破性项目。

来自主题: AI资讯
4962 点击    2025-02-23 11:19
斯坦福最新AI Agent序列化证伪假设检验自动化框架,向卡尔·波普尔致敬

斯坦福最新AI Agent序列化证伪假设检验自动化框架,向卡尔·波普尔致敬

斯坦福最新AI Agent序列化证伪假设检验自动化框架,向卡尔·波普尔致敬

在人工智能高速发展的今天,我们似乎迎来了一个"假设爆炸"的时代。大语言模型每天都在产生数以万计的研究假设,它们看似合理,却往往难以验证。这让我不禁想起了20世纪最具影响力的科学哲学家之一——卡尔·波普尔。

来自主题: AI技术研报
9685 点击    2025-02-23 11:13
深度|Salesforce CEO:Agent正是开启 “无限劳动力” 时代的起点

深度|Salesforce CEO:Agent正是开启 “无限劳动力” 时代的起点

深度|Salesforce CEO:Agent正是开启 “无限劳动力” 时代的起点

OpenAI与微软的关系出现严重裂痕,主要原因是微软开始开发自己的大型语言模型,并聘请了Mustafa Suleyman,并且OpenAI首次使用非微软的数据中心。

来自主题: AI资讯
8315 点击    2025-02-23 10:55
下周即将发布的AI汇总,太热闹了!

下周即将发布的AI汇总,太热闹了!

下周即将发布的AI汇总,太热闹了!

下周即将发布的AI汇总,太热闹了!Sam亲口宣布要下周发布,一些媒体也报道微软已经开始给GPT4.5和GPT5准备服务器昨天Claude网站更新了,有网友发现有一行提示“Try Anthropic‘s new thinking model”,这意味着Claude有新模型要发了!

来自主题: AI资讯
11435 点击    2025-02-23 10:47
3元+2小时,普通人也能训练自己的AI大模型!GitHub爆火8.9k星项目,技术圈炸了!

3元+2小时,普通人也能训练自己的AI大模型!GitHub爆火8.9k星项目,技术圈炸了!

3元+2小时,普通人也能训练自己的AI大模型!GitHub爆火8.9k星项目,技术圈炸了!

GitHub上一个开源项目彻底打破门槛:只需3块钱、2小时,普通人也能从零训练自己的语言模型!项目“MiniMind”上线即爆火,狂揽8.9k星标,技术圈直呼:“这才是AI民主化的未来!”

来自主题: AI技术研报
12131 点击    2025-02-23 10:30
人类最强大脑AI进化饲料

人类最强大脑AI进化饲料

人类最强大脑AI进化饲料

白天,安迪在一所名校数学系攻读研究生,夜晚,他则化身数据标注员,应招国内外各种大模型的标注任务,时薪大概在150元~300元。当Deepseek在1月下旬横空出世后,这个工作越来越为外人所知。

来自主题: AI资讯
7793 点击    2025-02-23 10:22
1/30训练步骤复刻DeepSeek-R1-Zero,沈向洋姜大昕张祥雨等开源推理模型RL训练方法

1/30训练步骤复刻DeepSeek-R1-Zero,沈向洋姜大昕张祥雨等开源推理模型RL训练方法

1/30训练步骤复刻DeepSeek-R1-Zero,沈向洋姜大昕张祥雨等开源推理模型RL训练方法

DeepSeek啥都开源了,就是没有开源训练代码和数据。现在,开源RL训练方法只需要用1/30的训练步骤就能赶上相同尺寸的DeepSeek-R1-Zero蒸馏Qwen。

来自主题: AI技术研报
9955 点击    2025-02-22 21:30