有人只用API就猜出了GPT、Claude、Gemini的参数量?社区吵翻了
有人只用API就猜出了GPT、Claude、Gemini的参数量?社区吵翻了基于此,研究者在 89 个参数量已知的开源模型(规模从 1.35 亿到 1.6 万亿参数)上拟合出事实准确率与参数量的对数线性关系,拟合优度 R² = 0.917,并据此对闭源模型进行参数估算。
搜索
基于此,研究者在 89 个参数量已知的开源模型(规模从 1.35 亿到 1.6 万亿参数)上拟合出事实准确率与参数量的对数线性关系,拟合优度 R² = 0.917,并据此对闭源模型进行参数估算。
GEO服务商每天往互联网里灌多少内容? 一家中型GEO公司,在部分批量化运营模式下,月度内容产出可以达到很高规模。背后是自动发稿机、批量账号、几乎一模一样只换了平台名字的通稿。逻辑很简单,他们认为铺得
在 AGI-Next 前沿峰会上,腾讯姚顺雨举了一个很生活化的例子:当你问 AI “今天吃什么” 时,真正限制答案质量的,可能不是模型不够大,也不是推理不够强,而是它不知道你今天冷不冷、想不想吃热的、最近和朋友聊过什么、家人又有什么偏好需要纳入考虑。
ElatoAI 是一个开源免费的实时AI语音交互系统,采用Arduino 编程,运行在乐鑫 ESP32 主控制器上,通过安全WebSocket连接至部署在Deno边缘函数构建的服务端,通过OpenAI Realtime API等技术实现低成本、长时长、跨设备的自然对话体验,支持多种AI模型,
3 月 30 日,爱奇艺正式官宣发布的专业级影视制作平台纳逗 Pro,正是其中代表。通过将行业领先基座模型与爱奇艺深耕多年的影视内容制作经验深度结合,纳逗 Pro 直接将目标对准了电视剧、院线级内容从剧本生成、分镜设计到成片输出的创作全流程。
魔法原子在会上推出了新一代人形机器人 MagicBot X1 和灵巧手 MagicHand H01,而且第一次把其世界模型 Magic-Mix、数据生成与训练反馈闭环,作为一套完整的具身智能底层能力集中展示出来。
AI科技评论从多处独家获悉,前蔚来 AI平台负责人白宇利已创立新公司“上海补天石科技”,公司业务聚焦具身数据Infra方向。企查查信息显示,上海补天石科技有限公司于2025年11月成立,法人正是白宇利。
今天 Anthropic 放出了一项评估数据,对于新的生物信息学评测集 BioMysteryBench:人类能搞定的,Claude 也能搞定;在人类搞不定的,Mythos 也能搞定
8人团队干10个月,AI只需一夜!英伟达祭出「造芯」神技:芯片设计效率狂飙百倍,非人类直觉的设计方案惊呆工程师。硅基生命开始自进化,人类正退居二线?进来看黄仁勋的秘密武器。
GPT Image 2的发布给整个AI圈带来了亿点点震撼。但很多人可能没注意到,幕后最会玩梗的居然是他——主力训练者陈博远。他和奥特曼同台主持,悄悄修好了中文渲染;给模型起代号“布基胶带”,还拿香蕉艺术品玩梗;为了秀模型的文字能力,设计了米粒刻字、漫画套娃、视觉证明题这些“彩蛋级”测试。
这不是恐怖故事,也不是田螺姑娘的寓言故事,而是 3 月 17 日,HooRii 在 Kickstarter 上线的众筹项目「ClawStage」的宣传。它的定位是“OpenClaw 的现实世界游乐场”——用一个小方块,让 OpenClaw 来到现实世界,并能担任你的家庭管家。
《DT商业观察》留意到,即便是电商常见的“图搜找同款”场景,自从淘宝图像搜索产品@拍立淘新上线了“AI模式”,把“图搜”功能进化成“启发式图搜”,用户的玩法也已升级。
谷歌母公司Alphabet营收达到1099亿美元,每股收益5.11美元,远超华尔街预期的2.62美元;亚马逊净销售额1815亿美元,净利润303亿美元,每股收益2.78美元,几乎是预期的两倍;微软营收829亿美元,同比增长18%;Meta净利润268亿美元,同比接近翻倍。
今天,OpenAI 官方播客发布了一期节目,让内部研究员 Sebastian Bubeck 和 Ernest Ryu 出来回答这一问题,毕竟大家都十分好奇。Ernest 近期刚加入 OpenAI 担任研究员,他之前是加州大学洛杉矶分校(UCLA)数学系的教授,研究优化和机器学习理论。他是最早尝试用 ChatGPT 解数学开放问题的那批人之一。
我发现:Claude 一边把中国大陆挡在门外,一边在认认真真做简体中文。事情是这样—— 前两天我把 Claude 文档 URL 里的 /en/ 改成了 /zh-CN/。页面唰地就变了。整站简体中文,翻译贼讲究。
这段时间做了巨多PPT。 多到我现在都条件反射了,好不好看先放一边,先看AI容易错的细节。 文字有没有糊,布局是不是在装高级,图片是不是只是看起来有氛围感,该有的信息都没放进去, 再就是画面上有没有一
嗨大家好!我是阿真! 朋友们,好像标题党了,先别骂,看完指定有灵感。整了点不错的东西,这次真的可以把 PPT 做得很好看了!快放假之前给大家再分享一波,这个真的很棒的不容错过。 首先我其实是很早就想做
基于视觉语言模型(VLM)的多智能体系统(MAS)正成为复杂多模态协作的核心方案,却被一个致命痛点死死卡住:多智能体视觉幻觉滚雪球——单个智能体的视觉误判通过纯文本信息流逐级放大,早期细微错误最终演变成系统性崩溃。
MONTEE AI 近日宣布完成首轮融资,成立于2025年,MONTEE AI是全球首款玩偶交互式AI故事机。公司身后是一支来自硅谷、字节跳动、Google 和常青藤的团队,联动幼教出版世家五十年资源沉淀,正在重新定义儿童故事机品类。
Pictoria是一家专注于AI虚拟主播(vTuber)运营的日本公司。近期,该公司完成了2.2亿日元的A轮融资,投资方包括B Dash Ventures和Adways Ventures,至此其累计融资金额已达4.8亿日元。
AI医疗最成熟的领域,迎来了一款重磅产品——颅脑CT超级智能体“小君医生2.0”。这是全球首个临床可用+检查项目级的颅脑CT智能体,能够覆盖90%的颅脑病变,诊断准确率达87.8%,90%以上病例无需修改或仅小幅度修改即可使用,将报告时效从15分钟大幅压缩至1分钟,已落地中国顶流三甲北京天坛医院,极大提升了医院影像诊断的效率。
刚刚,DeepSeek 在 Github 上正式发布了多模态模型,公布了背后的技术报告。实打实的新鲜出炉!而且是开创性的推理范式。下面我们就基于 DeepSeek 这篇技术报告,具体看看 DeepSeek、北京大学、清华大学又创造了怎样的奇迹。
今天凌晨,谷歌 Gemini 突然放大招,它在 X 上宣布:现在 Gemini 可以直接生成PDF、Word、Excel 或 Google Workspace 等文件,无需上传模板,只用和Gemini交流要做什么和讲清文件格式。
最近朋友推荐了 CodeBanana,说它跟之前用过的那些 AI 写代码的工具的体验感完全不同。我最近挑了几个真实工作场景跑了一遍,读项目、拆需求、写需求、生成测试用例、定时任务等等都和日常工作很贴近的任务进行了尝试。今天挑五个我自己觉得最值得讲的,跟你聊聊我的体验。
就在昨天,Zed 正式发布了 1.0 版本。这个历时五年开发、经历超过 1000 个预发布版本、累计百万行 Rust 代码,Atom 编辑器原班人马打造的“下一代代码编辑器”,终于走到了——官方称“大多数开发者可以安心切换的时刻”。
刚刚,Anthropic 公布了 Claude Code 比赛的六组获奖作品。这是 Claude 和 Cerebral Valley 联合办的一场黑客松,规则是:用 Opus 4.7 + Claude Code,一周时间,做个东西出来。
刚刚,宇树发布其迄今定价最低的人形机器人——R1系列双臂人形机器人,支持工业及日常家用多元场景应用,售价2.69万元起。这是宇树首款主打桌面、面向工业场景的低成本轻量化上半身双臂方案。该系列机器人支持5/7自由度单臂、固定/移动底盘,头部模组算力达10TOPS,末端可快速换装,手臂最大负载2kg,腰部±150°、头部±115°/±36°大运动范围。
4 月 30 日,阿里发布全新 Agent 产品 QoderWake,定位是“生产可用、安全可控、自进化的数字员工”。它不是再做一个“更聪明的 AI 助手”,而是试图回答一个更难的问题:Agent 如何从工具变成岗位。
OpenAI正儿八经写了一篇研究复盘,标题看起来却像个段子: GPT-5.5爱说哥布林,正是这两天OpenAI用户最热议话题。起初,是有人发现Codex系统提示词中特别强调了两遍:禁止谈论哥布林、妖精、巨魔等生物。