PaddleOCR:82k+ Stars的国产OCR天花板,0.9B小模型精度反超GPT-5.5
PaddleOCR:82k+ Stars的国产OCR天花板,0.9B小模型精度反超GPT-5.5大模型再强,也读不懂你公司那一柜子的合同、发票和扫描件。在"纸张世界"和"LLM世界"之间,缺一座桥——而百度开源的 PaddleOCR,可能就是当下最稳的那座。
搜索
大模型再强,也读不懂你公司那一柜子的合同、发票和扫描件。在"纸张世界"和"LLM世界"之间,缺一座桥——而百度开源的 PaddleOCR,可能就是当下最稳的那座。
他们对触乐说,变化发生在今年春节后。数字天空《烽沙》项目组目前有25人。今年1月,他们一共调用了2亿Token,到了2月,调用的Token数变成了149亿,“暴涨70倍”。“AI已经完全成为我们日常开发流程的一部分,虽然核心设计方向仍然需要把关,但已经很难再回到纯手工模式,”《烽沙》制作人Niko半开玩笑地告诉我:“如果今天用不了AI,我们都不会编程了,手动敲(代码)太慢了。”
曲凯:梦琪创业这一年,其实走完了很多 AI 软件创业者这几年的典型流程:字节背景,一个梦幻团队,讲一个当下 AI 里很流行的故事,融几轮钱,然后随着技术和热点变化 pivot。当然,也和大家一样遇到了今天这个软件行业的低点。
这是个一个月前的旧消息, 4月28日,达摩院联合广东省人民医院, 发布了一个叫DAMO COCA的, 肠癌筛查AI模型。
2026 年,会不会用 AI 不再看 Prompt(提示词)能力了,而是要看会不会设计循环。
这绝对是近期把“反向创新”和“互联网幽默”玩到极致的一个案例,当整个 AI 行业都在比拼模型参数、Agent 框架、推理能力和算力规模时,一个 17 岁印度高中生却用一种近乎恶作剧的方式,创造了 2026 年最幽默的一个产品。
昨晚,字节新模型Seedance 2.0 Mini深夜来袭,该模型主打性价比,侧重于提供更低的价格以及更快的生成速度。Seedance 2.0 Mini虽然定价更低,但保留了核心能力参考生成,用户可以通过融合提示词与最多12个多种模态的参考素材(包括6张图片、3段音频、3段视频)来锁定人物一致性、精细化控制运动轨迹、卡准剧情节奏。
AI公司还在拼模型,另一门更底层的生意正在变大。
Agent + 无限画布带来的想象力。
在一个什么都能吵翻天的国家,71%的美国人难得达成共识:AI必须有人管——但管它的,绝不能是造它的人。