月之暗面Kimi模型升级:200万字窗口版可申请,新增“继续”功能
月之暗面Kimi模型升级:200万字窗口版可申请,新增“继续”功能继2月以投后约25亿美金估值炸场后,杨植麟的大模型公司月之暗面终于有了一次公开对媒体的活动。
搜索
继2月以投后约25亿美金估值炸场后,杨植麟的大模型公司月之暗面终于有了一次公开对媒体的活动。
说到做到,马斯克承诺的开源版大模型 Grok 终于来了!
AI对字节广告和云业务的影响,比想象中更大。
哈工大联合度小满推出针对多模态模型的自适应剪枝算法 SmartTrim,论文已被自然语言处理顶级会议 COLING 24 接收。
人类设计 prompt 的效率其实很低,效果也不如 AI 模型自己优化。2022 年底,ChatGPT 上线,同时引爆了一个新的名词:提示工程(Prompt Engineering)。
近日,来自MIT的研究人员发表了关于大模型能力增速的研究,结果表明,LLM的能力大约每8个月就会翻一倍,速度远超摩尔定律!硬件马上就要跟不上啦!
左手融钱,右手投资,还刚刚发布了过去一年与商业化博弈的成果。这就是智谱AI在发布ChatGLM千亿对话模型一周年之际,对外界的一顿狂轰乱炸。
在 AI 落地如何 ToB 业务上,有赞是属于「跑得快」的一批玩家。在 2024 年 1 月 FounderPark 的一场直播中,有赞创始人兼 CEO 白鸦就从 SaaS 产品经理的角度,聊了聊大模型时代的产品应该怎么做。而在最近的一场直播中,白鸦则详细分享了有赞如何用 AI 改造他们的 SaaS 服务流程。
早在 2020 年,陶大程团队就发布了《Knowledge Distillation: A Survey》,详细介绍了知识蒸馏在深度学习中的应用,主要用于模型压缩和加速。随着大语言模型的出现,知识蒸馏的作用范围不断扩大,逐渐扩展到了用于提升小模型的性能以及模型的自我提升。
首先先来看看模型底座,阶跃星辰发布了两款,分别是Step-1V和Step-2。其中Step-1V具有千亿参数,支持多模态能力,和GPT4-Turbo一样,128K上下文,不过这款不算惊艳,只能算主流大模型中的正常水平。