AI资讯新闻榜单内容搜索-2

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 2
蚂蚁EGSS算法破解Test Time Scaling困局 | ACL 2026

蚂蚁EGSS算法破解Test Time Scaling困局 | ACL 2026

蚂蚁EGSS算法破解Test Time Scaling困局 | ACL 2026

更聪明的计算远比更多的计算更有效。

来自主题: AI技术研报
6666 点击    2026-06-17 14:06
ICML 2026 | 大模型为什么算不对加法?南大团队提出等本位和轨迹,揭示LLM算术错误的几何机制

ICML 2026 | 大模型为什么算不对加法?南大团队提出等本位和轨迹,揭示LLM算术错误的几何机制

ICML 2026 | 大模型为什么算不对加法?南大团队提出等本位和轨迹,揭示LLM算术错误的几何机制

尽管大语言模型(Large Language Models, LLMs)在复杂数学推理、代码生成和知识问答上表现突出,但它们仍常在多位数加法这类基础算术任务上犯错。

来自主题: AI技术研报
7435 点击    2026-06-17 14:05
ICML 2026 | Agentic强化学习训练的信息自锁问题

ICML 2026 | Agentic强化学习训练的信息自锁问题

ICML 2026 | Agentic强化学习训练的信息自锁问题

随着大语言模型逐步从「单轮问答」走向「真实环境中的持续交互」,LLM agents 正在被用于越来越复杂的 agentic applications:deep research、coding、computer use、customer service、medical inquiry、troubleshooting 等等。

来自主题: AI技术研报
6060 点击    2026-06-17 14:05
葬AI基准测试发布:GLM 5.2第一,超越Opus 4.8

葬AI基准测试发布:GLM 5.2第一,超越Opus 4.8

葬AI基准测试发布:GLM 5.2第一,超越Opus 4.8

这是葬AI起号以来工作量最大的一篇文章。为了严肃评测国产模型的能力,我自研了一个Benchmark,完整测试了智谱、Qwen、Kimi、Minimax、Deepseek这些最新国产模型,还引入了境外势力Claude作对照组。

来自主题: AI资讯
8716 点击    2026-06-17 13:30
小米云端办公龙虾Xiaomi MiMo Claw来了!打通了WPS,14.9元交个朋友

小米云端办公龙虾Xiaomi MiMo Claw来了!打通了WPS,14.9元交个朋友

小米云端办公龙虾Xiaomi MiMo Claw来了!打通了WPS,14.9元交个朋友

昨晚,小米正式上线了Xiaomi MiMo Claw,一款云端Claw类产品,搭载与OpenClaw框架深度适配的MiMo-V2.5-Pro旗舰模型,同时联动了金山办公生态,实现一站式办公,现在可以在MiMo Studio上进行体验。

来自主题: AI资讯
9125 点击    2026-06-17 11:08
如何用 6 倍速 Kimi K2.7 Code,做「小红书端到端排版 Skill」?

如何用 6 倍速 Kimi K2.7 Code,做「小红书端到端排版 Skill」?

如何用 6 倍速 Kimi K2.7 Code,做「小红书端到端排版 Skill」?

昨天 Kimi K2.7 Code 高速版 上线了,我上手试了下,最大的感受就一个字:快。

来自主题: AI技术研报
9537 点击    2026-06-17 10:52
GLM-5.2 正式发布:开源之王来了,摸到了Opus-4.8

GLM-5.2 正式发布:开源之王来了,摸到了Opus-4.8

GLM-5.2 正式发布:开源之王来了,摸到了Opus-4.8

GLM-5.2 正式发布,震撼全网,主打长程任务能力,配合 1M token 上下文窗口,且完全开源(MIT 协议)。在相近的 token 消耗下,GLM-5.2 的能力大致介于 Opus 4.7 和 Opus 4.8 之间,参数仅为753B。

来自主题: AI资讯
10113 点击    2026-06-17 10:50
PaddleOCR:82k+ Stars的国产OCR天花板,0.9B小模型精度反超GPT-5.5

PaddleOCR:82k+ Stars的国产OCR天花板,0.9B小模型精度反超GPT-5.5

PaddleOCR:82k+ Stars的国产OCR天花板,0.9B小模型精度反超GPT-5.5

大模型再强,也读不懂你公司那一柜子的合同、发票和扫描件。在"纸张世界"和"LLM世界"之间,缺一座桥——而百度开源的 PaddleOCR,可能就是当下最稳的那座。

来自主题: AI技术研报
7296 点击    2026-06-17 10:32