完全透明开源的共情语音大模型,三阶段训练,四大模块实现端到端对话 | 紫东太初联合长城汽车开源OpenS2S
完全透明开源的共情语音大模型,三阶段训练,四大模块实现端到端对话 | 紫东太初联合长城汽车开源OpenS2SGPT-4o、Gemini这些顶级语音模型虽然展现了惊人的共情对话能力,但它们的技术体系完全闭源。
GPT-4o、Gemini这些顶级语音模型虽然展现了惊人的共情对话能力,但它们的技术体系完全闭源。
涌现(Emergence),是生成式AI浪潮的一个关键现象:当模型规模扩大至临界点,AI会展现出人类一般的智慧,能理解、学习甚至创造。
AI 浏览器,还需要颠覆式创新。
翟星吉受GPT-4启发创立语核科技,聚焦制造业售前Agent,解决核心痛点如方案生成。采用结果付费模式,通过垂直场景抽象提升客户转化率。团队快速迭代,年营收目标1000万,并计划出海日韩东南亚。
大家好,我是袋鼠帝。 最近有一件挺有意思的事,时间拉回到6月底,我收到了一个官方邀请,来自百度。
就在近日,凭借一段演示视频走红全球的 AI Agent 公司 Manus 宣布已将总部迁至新加坡,并对国内团队进行大规模调整——仅将核心技术人员随总部一并搬迁,其余员工留在国内或被裁撤。这一举动不仅凸显了新加坡在对抗国际政治与投资压力方面的独特优势,也为“将新加坡作为出海第一站”的策略提供了最新佐证。
MIRIX,一个由 UCSD 和 NYU 团队主导的新系统,正在重新定义 AI 的记忆格局。
上周五(711),月之暗面蛰伏半年,憋了个大的,正式发布Kimi K2模型,总参数1T,同步开源。具体模型效果就不过多赘述了,网上已经有很多实测。
7 月 1 日,国际顶级学术期刊《Nature》旗下子刊《Nature Communications》正式刊登了来自清华、面壁等研究团队联合研发的高效端侧多模态大模型MiniCPM-V 核心研究成果。
大家好,我是袋鼠帝 上周五kimi开源了他们最新最强的旗舰模型K2https://github.com/MoonshotAI/Kimi-K2。K2这几天很多博主都写过了,确实很强,如果能搭配世界最强AI编程神器Claude Code,那不得起飞啊!