AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
大模型“天梯赛”来了,让Agent在Kaggle真实任务中进化|佐治亚理工、斯坦福开源

大模型“天梯赛”来了,让Agent在Kaggle真实任务中进化|佐治亚理工、斯坦福开源

大模型“天梯赛”来了,让Agent在Kaggle真实任务中进化|佐治亚理工、斯坦福开源

当前最强大的大语言模型(LLM)虽然代码能力飞速发展,但在解决真实、复杂的机器学习工程(MLE)任务时,仍像是在进行一场“闭卷考试”。它们可以在单次尝试中生成代码,却无法模拟人类工程师那样,在反复的实验、调试、反馈和优化中寻找最优解的真实工作流。

来自主题: AI技术研报
8070 点击    2025-07-27 12:43
在WAIC现场,全球首个拥有「原生记忆力」的大模型亮相,但不是Transformer

在WAIC现场,全球首个拥有「原生记忆力」的大模型亮相,但不是Transformer

在WAIC现场,全球首个拥有「原生记忆力」的大模型亮相,但不是Transformer

国内 AI 创企 RockAI 提出的非 Transformer 架构 Yan 2.0 Preview。这个架构极大地降低了模型推理时的计算复杂度,因此可以在算力非常有限的设备上离线运行,比如树莓派。

来自主题: AI资讯
9674 点击    2025-07-26 19:51
世界首个开源金融平台,Github上4万人Star!

世界首个开源金融平台,Github上4万人Star!

世界首个开源金融平台,Github上4万人Star!

前几天逛 X 的时候,偶然间刷到一个声称“彭博终端”的替代品,不仅免费而且开源。

来自主题: AI资讯
9097 点击    2025-07-26 12:44
bootstrap 到十亿美元 ARR:Surge AI 这匹黑马如何颠覆 Scale 霸权 ?

bootstrap 到十亿美元 ARR:Surge AI 这匹黑马如何颠覆 Scale 霸权 ?

bootstrap 到十亿美元 ARR:Surge AI 这匹黑马如何颠覆 Scale 霸权 ?

Surge AI 成立于 2020 年,是一家专注于数据标注的公司。自成立以来,主创团队都极为低调,社交平台上鲜有公开动态。即便如此,Surge AI 仍在短短几年内实现了业绩大爆发,并成为业内公认的“领域最大且最好的玩家”。截至 2024 年,Surge AI 的 ARR 已突破 10 亿美元,超越了行业巨头 Scale AI 的 8.7 亿美元收入,成为其最大的竞争对手。

来自主题: AI资讯
7690 点击    2025-07-26 12:14
训练数据爆减至1/1200!清华&生数发布国产视频具身基座模型,高效泛化复杂物理操作达SOTA水平

训练数据爆减至1/1200!清华&生数发布国产视频具身基座模型,高效泛化复杂物理操作达SOTA水平

训练数据爆减至1/1200!清华&生数发布国产视频具身基座模型,高效泛化复杂物理操作达SOTA水平

机器人能通过普通视频来学会实际物理操作了! 来看效果,对于所有没见过的物品,它能精准识别并按照指令完成动作。

来自主题: AI技术研报
8004 点击    2025-07-26 11:58
上下文工程难吗?试下Claude Code写入Kiro的Spec,自动搞定上下文

上下文工程难吗?试下Claude Code写入Kiro的Spec,自动搞定上下文

上下文工程难吗?试下Claude Code写入Kiro的Spec,自动搞定上下文

10天前Amazon发布了他们自己的开发平台,Kiro IDE,其中有一个很厉害的交互功能“Spec(Specification)”,强调的是规范的文档,说明书,以一套非常结构化的方法确保开发过程的系统性、可控性和质量,堪称现代软件工程的最佳实践。让vibe coding有一个规范的范式。

来自主题: AI资讯
8787 点击    2025-07-26 11:46
Step-3 发布:包括发布会上没说的,都在这了

Step-3 发布:包括发布会上没说的,都在这了

Step-3 发布:包括发布会上没说的,都在这了

今天下午,阶跃星辰在 WAIC 2025 开幕前夕发布新一代基础大模型 Step 3,并宣布将在 7 月 31 日面向全球企业和开发者开源。MoE 架构,321B 总参,38B 激活

来自主题: AI资讯
10825 点击    2025-07-25 23:25
刚刚,阿里发布全球最强开源模型,AI 圈迎来「中国时刻」

刚刚,阿里发布全球最强开源模型,AI 圈迎来「中国时刻」

刚刚,阿里发布全球最强开源模型,AI 圈迎来「中国时刻」

就在刚刚,阿里正式发布全球最强开源推理模型——Qwen3-235B-A22B-Thinking-2507。就在刚刚,阿里正式发布全球最强开源推理模型——Qwen3-235B-A22B-Thinking-2507。

来自主题: AI资讯
9835 点击    2025-07-25 23:11
WAIC抢先爆料:金融“黑马”大模型超DeepSeek刷新SOTA,论文已上线

WAIC抢先爆料:金融“黑马”大模型超DeepSeek刷新SOTA,论文已上线

WAIC抢先爆料:金融“黑马”大模型超DeepSeek刷新SOTA,论文已上线

又到了一年一度“中国AI春晚”WAIC,各家大厂动作频发的时候。 今年会有哪些看点?你别说,我们还真在扒论文的过程中,发现了一些热乎线索。 比如蚂蚁数科的金融推理大模型,发布会还没开,技术论文已悄咪咪上线。 金融领域的推理大模型,你可以理解为金融领域的DeepSeek,带着SOTA的刷榜成绩来了。

来自主题: AI资讯
8472 点击    2025-07-25 17:40
150PB工业数据+智能体革命,西门子开启AI制造新纪元

150PB工业数据+智能体革命,西门子开启AI制造新纪元

150PB工业数据+智能体革命,西门子开启AI制造新纪元

那是 1964 年,德国南部的小城爱尔兰根,阳光洒落在西门子数据中心的窗格上,一台名为 Zuse Graphomat Z64 的绘图仪静静运转着。 它并不懂何为艺术,却在工业数学家 Georg Nees 的指令下,画出了世界上最早一批由计算机生成的图像。

来自主题: AI资讯
9861 点击    2025-07-25 17:28