小米大模型提效新框架:训练最高提速34%,推理最高提速52%!Kaldi之父合作出品
小米大模型提效新框架:训练最高提速34%,推理最高提速52%!Kaldi之父合作出品大模型推理速度提升50%以上,还能保证少样本学习性能!
搜索
大模型推理速度提升50%以上,还能保证少样本学习性能!
就在刚刚,竞技场排名再次刷新:深度求索DeepSeek-Coder-v2成竞技场最强开源编码模型!
今年 2 月,Sora 吸引了人们对视频生成赛道的关注。而这一赛道的头部创业公司爱诗科技,也开始进入人们的视野。
参加 2024 河南高考,豆包和文心 4.0 过了一本线,但比 GPT-4o 还差点。
等了半年,微软视觉基础模型Florence-2终于开源了。它能够根据提示,完成字幕、对象检测、分割等各种计算机视觉和语言的任务。网友们实测后,堪称「游戏规则改变者」。
最近在美国最火的社交软件是哪一款?答案列表上,一定有Character AI的一席之地。但和其他所有同类产品不同的是,用户是在和AI聊天机器人而非真实人类进行互动。
一年一届的AI行业顶级路演又来了!这次,继续征集国内外新生的AI初创公司前来参赛,不仅有千万算力等着你,还有超豪华的投资天团齐聚“模都”上海。报名倒计时7天!
是时候把数据Scale Down了!Llama 3揭示了这个可怕的事实:数据量从2T增加到15T,就能大力出奇迹,所以要想要有GPT-3到GPT-4的提升,下一代模型至少还要150T的数据。好在,最近有团队从CommonCrawl里洗出了240T数据——现在数据已经不缺了,但你有卡吗?
或许是个朱啸虎看好的项目。 根据外媒消息,成立不到1年的日本人工智能初创公司SakanaAI,即将斩获超1亿美元融资,估值飚至1800亿日元(约合人民币82亿,11.5亿美元),即将跻身AI独角兽行列。
百度港股的市盈率从一年前的20多倍,跌到了11,不仅远低于携程的22,还低于不少消费股(海底捞市盈率17,安踏体育市盈率20,泡泡玛特市盈率43)。