一行代码Post-Train任意长序列!360智脑开源360-LLaMA-Factory
一行代码Post-Train任意长序列!360智脑开源360-LLaMA-Factory大模型长序列的处理能力已越来越重要,像复杂长文本任务、多帧视频理解任务、以及 OpenAI 近期发布的 o1、o3 系列模型的高计算量模式,需要处理的输入 + 输出总 token 数从几万量级上升到了几百万量级。
搜索
大模型长序列的处理能力已越来越重要,像复杂长文本任务、多帧视频理解任务、以及 OpenAI 近期发布的 o1、o3 系列模型的高计算量模式,需要处理的输入 + 输出总 token 数从几万量级上升到了几百万量级。
交接之际,拜登政府放出最后一搏:英伟达AMD等AI芯片出口,限制升级!新规规定,全球国家将被分为三级,第三级管控的国家和地区,AI芯片的进口将遭到几乎全面的禁止。
搜索大变天?
OpenAI o1 给大模型规模扩展 vs 性能的曲线带来了一次上翘。它在大模型领域重现了当年 AlphaGo 强化学习的成功 —— 给越多算力,就输出越多智能,一直到超越人类水平。
本文根据智联招聘集团执行副总裁李强在刺猬公社第五届新内容探索者大会上的发言整理: 我分享的大部分内容,来自于智联招聘3.6亿的求职用户和累计合作的将近1400万家企业给出的答案。
2024年的创业与融资市场里,人形机器人赛道的热度持续升温,科技巨头纷纷布局、初创公司相继涌现、行业发展迅速。
人工智能(AI)专家普遍认为,2025 年将是智能体(agent)爆发之年。
新年新气象!谷歌内部AI人才来了个大迁移—— 统一归拢到DeepMind旗下,归诺奖得主哈萨比斯领导。
论文能不能中?可以用AI提前预测~ 港大黄超教授团队提出多智能体自动化框架GraphAgent,能自动构建和解析知识图谱中的复杂语义网络,应对各类预测和生成任务。
2025 年 1 月 9 日,拜登政府计划在离任前夕对英伟达等公司的 AI 芯片出口实施新一轮限制。