AI资讯新闻榜单内容搜索-语言模型

探索LLM推理全阶段的JSON格式输出限制方法

文章详细讨论了如何确保大型语言模型（LLMs）输出结构化的JSON格式，这对于提高数据处理的自动化程度和系统的互操作性至关重要。

来自主题: AI技术研报

11783 点击 2024-10-31 10:14

重磅！IBM：PDL提示词声明语言，帮你拿回Prompt控制权

在当前大语言模型（LLM）蓬勃发展的环境下，Prompt工程师们面临着一个两难困境：要么使用像LangChain这样功能强大但学习曲线陡峭的框架，要么选择自动化程度更高DSPy但牺牲了对提示词精确控制的工具。IBM研究院和UC Davis大学最近推出的PDL（Prompt Declaration Language，提示词声明语言）或许打破了这个困境，让AI开发者能真正拿回Prompt的控制权。

来自主题: AI技术研报

6585 点击 2024-10-31 09:54

PUMA：商汤科技迈向多模态任务统一框架的多粒度视觉生成模型

PUMA（emPowering Unified MLLM with Multi-grAnular visual generation）是一项创新的多模态大型语言模型（MLLM），由商汤科技联合来自香港中文大学、港大和清华大学的研究人员共同开发。它通过统一的框架处理和生成多粒度的视觉表示，巧妙地平衡了视觉生成任务中的多样性与可控性。

来自主题: AI技术研报

5575 点击 2024-10-29 14:32

新扩散模型OmniGen一统图像生成，架构还高度简化、易用

大型语言模型（LLM）的出现统一了语言生成任务，并彻底改变了人机交互。然而，在图像生成领域，能够在单一框架内处理各种任务的统一模型在很大程度上仍未得到探索。近日，智源推出了新的扩散模型架构 OmniGen，一种新的用于统一图像生成的多模态模型。

来自主题: AI技术研报

12135 点击 2024-10-29 13:38

把大语言模型打造成赛博裁判需要几步？DeepMind 说，只需要两步

AI裁判通过反馈生成更公正报告，接近共识。

来自主题: AI资讯

8618 点击 2024-10-29 11:06

扔掉 Google 翻译！这个超强 AI 翻译工作流才是你的最佳选择

吴恩达老师提出了一种反思翻译的大语言模型 (LLM) AI 翻译工作流程

来自主题: AI技术研报

5967 点击 2024-10-29 09:56

AutoBA：一个用于生信多组学分析的完全自动化AI代理

分享一篇近期由华为和阿卜杜拉国王科技大学合作完成的一项生信分析与大语言模型相结合的工作，相关成果发表在《Advanced Science》上。

来自主题: AI技术研报

5986 点击 2024-10-29 09:53

字节跳动计划在欧洲设立AI研发中心，已开始招募大模型等领域技术人才

10月28日，澎湃新闻记者获悉，字节跳动准备在欧洲设立AI研发中心，已开始在欧洲积极招募LLM（大语言模型）和AI领域的顶尖技术人才，以加强其在全球第二大经济体中的人工智能研发能力。

来自主题: AI资讯

5744 点击 2024-10-28 20:34

突破时间序列组合推理难题！南加大发布一站式多步推理框架TS-Reasoner

TS-Reasoner是一个创新的多步推理框架，结合了大型语言模型的上下文学习和推理能力，通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估，有效提高了复杂时间序列任务的推理能力和准确性。实验结果表明，TS-Reasoner在金融决策、能源负载预测和因果关系挖掘等多个任务上，相较于现有方法具有显著的性能优势。

来自主题: AI技术研报

6692 点击 2024-10-28 18:30

谷歌AI播客刚火，Meta就开源了平替，效果一言难尽

随着谷歌和 Meta 相继推出基于大语言模型的 AI 播客功能，将极大地丰富人类用户与 AI 智能体互动的体验。

来自主题: AI资讯

4707 点击 2024-10-28 14:57