AI资讯新闻榜单内容搜索-不

有人只用API就猜出了GPT、Claude、Gemini的参数量？社区吵翻了

基于此，研究者在 89 个参数量已知的开源模型（规模从 1.35 亿到 1.6 万亿参数）上拟合出事实准确率与参数量的对数线性关系，拟合优度 R² = 0.917，并据此对闭源模型进行参数估算。

来自主题: AI技术研报

9201 点击 2026-05-01 13:13

腾讯混元CL-bench续作发布，让大模型读懂你的日常生活

在 AGI-Next 前沿峰会上，腾讯姚顺雨举了一个很生活化的例子：当你问 AI “今天吃什么” 时，真正限制答案质量的，可能不是模型不够大，也不是推理不够强，而是它不知道你今天冷不冷、想不想吃热的、最近和朋友聊过什么、家人又有什么偏好需要纳入考虑。

来自主题: AI技术研报

7322 点击 2026-05-01 13:12

「生物信息学」评测，Claude 反超人类专家

今天 Anthropic 放出了一项评估数据，对于新的生物信息学评测集 BioMysteryBench：人类能搞定的，Claude 也能搞定；在人类搞不定的，Mythos 也能搞定

来自主题: AI技术研报

9036 点击 2026-05-01 11:08

最终仅拿下50万美元，龙虾陪伴硬件的一次失败尝试

这不是恐怖故事，也不是田螺姑娘的寓言故事，而是 3 月 17 日，HooRii 在 Kickstarter 上线的众筹项目「ClawStage」的宣传。它的定位是“OpenClaw 的现实世界游乐场”——用一个小方块，让 OpenClaw 来到现实世界，并能担任你的家庭管家。

来自主题: AI资讯

7021 点击 2026-05-01 11:07

ChatGPT数学进阶之路！OpenAI研究员自爆：ChatGPT从数不清数到给出埃尔德什问题全新解法；数学是衡量模型进步的重要基准；AI自动化研究员

今天，OpenAI 官方播客发布了一期节目，让内部研究员 Sebastian Bubeck 和 Ernest Ryu 出来回答这一问题，毕竟大家都十分好奇。Ernest 近期刚加入 OpenAI 担任研究员，他之前是加州大学洛杉矶分校（UCLA）数学系的教授，研究优化和机器学习理论。他是最早尝试用 ChatGPT 解数学开放问题的那批人之一。

来自主题: AI资讯

8387 点击 2026-05-01 10:59

Claude 嘴上说不要中国，背地里把中文做得飞起

我发现：Claude 一边把中国大陆挡在门外，一边在认认真真做简体中文。事情是这样—— 前两天我把 Claude 文档 URL 里的 /en/ 改成了 /zh-CN/。页面唰地就变了。整站简体中文，翻译贼讲究。

来自主题: AI资讯

9932 点击 2026-05-01 10:58

实测千问新出的PPT Agent，可算不用为了风格化牺牲二次编辑了。

这段时间做了巨多PPT。多到我现在都条件反射了，好不好看先放一边，先看AI容易错的细节。文字有没有糊，布局是不是在装高级，图片是不是只是看起来有氛围感，该有的信息都没放进去，再就是画面上有没有一

来自主题: AI产品测评

10181 点击 2026-05-01 10:51

当我用Codex做PPT，这可能是目前最好的解法之一。

嗨大家好！我是阿真！朋友们，好像标题党了，先别骂，看完指定有灵感。整了点不错的东西，这次真的可以把 PPT 做得很好看了！快放假之前给大家再分享一波，这个真的很棒的不容错过。首先我其实是很早就想做

来自主题: AI资讯

8306 点击 2026-05-01 10:50

谷歌Gemini开启王炸模式：一句话直接生成PDF、Word、Excel，30多种不同格式文件，实用效率神器，改变游戏规则！

今天凌晨，谷歌 Gemini 突然放大招，它在 X 上宣布：现在 Gemini 可以直接生成PDF、Word、Excel 或 Google Workspace 等文件，无需上传模板，只用和Gemini交流要做什么和讲清文件格式。

来自主题: AI资讯

10405 点击 2026-04-30 16:34

AI原生团队协作场景，CodeBanana来给大家打样了。

最近朋友推荐了 CodeBanana，说它跟之前用过的那些 AI 写代码的工具的体验感完全不同。我最近挑了几个真实工作场景跑了一遍，读项目、拆需求、写需求、生成测试用例、定时任务等等都和日常工作很贴近的任务进行了尝试。今天挑五个我自己觉得最值得讲的，跟你聊聊我的体验。

来自主题: AI资讯

8512 点击 2026-04-30 16:22