新闻

亚马逊云科技独家首推Writer新一代自适应推理模型Palmyra X5

2025-04-29亚马逊云科技

13阅

亚马逊云科技宣布,在Amazon Bedrock上正式推出Palmyra X5——这是一款全新的具备一百万token上下文窗口的自适应推理模型。该模型由企业级生成式AI领军企业Writer发布,是首批在Amazon Bedrock提供如此大规模上下文窗口的模型之一。该模型在速度和成本效率方面进行了优化,使客户能够构建先进的多步骤AI agents,并能精确处理海量企业数据,从根本上改变了推理方式。亚马逊云科技现已成为首家且目前唯一提供Writer完全托管、无服务器模型的云提供商,包括最新Palmyra X5及Palmyra X4,其他更多模型也将很快上线。

随着生成式AI技术的加速发展,客户需要广泛的模型选择以精准匹配业务需求。Writer模型在Amazon Bedrock的推出,进一步丰富了Amazon Bedrock广泛的完全托管模型的选择,这些模型均来自领先的AI企业,帮助客户能更轻松、安全地构建和扩展生成式AI应用,推动业务转型与创新。

Palmyra X5是首批在Amazon Bedrock提供一百万token上下文窗口的模型之一,为亚马逊云科技的客户提供更多选择(上下文窗口指一个模型每次输入/请求能处理和"记忆"的信息量。它以模型处理的最小文本单位token为计量单位,可视为模型的"短期记忆")。凭借这种规模的上下文窗口,Palmyra可精准处理1500页内容(相当于6本书)。该模型还是业界首批企业级自适应推理模型之一,并兼具先进的大语言模型能力以及扩展的记忆、处理能力。企业现可在预算范围内处理广泛任务,包括财务报告、法律合同分析、医疗记录整合、客户反馈挖掘等。

除推理能力外,Palmyra X5 还具有多项强大功能,能够支持与系统交互的agents、支持高级代码生成与部署,并支持超过30种语言。

Palmyra X5 介绍:

若将Palmyra X5模型拟人化,它就像具有超能力——可在22秒内读完一百万个单词的内容,并即时生成可执行的见解。它不仅能完整记忆200页战略文档的全部内容,更能理解其与昨天的客户会议、上个季度财务数据的内在关联。面对复杂的问题时,它能系统化地逐步推进解决方案,全程清晰阐述思考路径——无论是帮助分析海量客户反馈以提炼共性,还是排查技术故障。

Writer 首席技术官兼联合创始人 Waseem AlShikh 表示:"我们选择亚马逊云科技作为首家提供Writer完全托管模型的主流云服务提供商,源于其无与伦比的安全性,以及双方在变革企业AI应用方式、驱动创新增长愿景上的高度契合。Palmyra X5是Writer迄今最先进的模型,它能高速处理海量企业数据,这对于扩展多代理系统(multi-agent systems)至关重要。通过Amazon Bedrock,我们将这些强大功能带给全球更多企业,帮助客户在安全、可扩展的环境中部署。"

亚马逊云科技 Amazon Bedrock 总监 Atul Deo 表示:"基于与Writer的深度战略合作,我们很高兴通过Amazon Bedrock提供Writer的Palmyra系列模型,赋能企业开启智能Agent创新的新时代。Palmyra X5在长上下文窗口中提供卓越性能,兼具企业级可靠性与速度。无缝接入Writer的Palmyra X5将让开发者和企业利用亚马逊云科技的安全性、扩展性和性能,构建和扩展AI agents,实现海量企业数据推理范式的革新。"

数据解析:

  • Palmyra X5是最高效的大规模上下文大语言模型之一,对速度与成本均进行了优化。它可在约22秒内处理完整百万token提示词,单次函数调用响应仅需约0.3秒。
  • 在最新Longbench v2评测中,Palmyra X5以53%的平均得分展现其同类领先的性价比。企业在大幅降低每百万token成本的同时,可获得接近顶级的准确性,在预算可控的情况下,可执行大量agents与长上下文处理任务。
  • 支持30多种语言,为全球企业提供真正的多语言处理能力。
  • 定价为每百万输入token 0.60美元,每百万输出token 6美元,是目前最具成本效益的大规模上下文大语言模型之一。
  • 在BigCodeBench (完整版, 指令版)评估中,Palmyra X5以48.7分位列顶级模型,展现了其解决实用且具有挑战性的复杂编程任务的能力。

尽管生成式AI正在改变我们创建、分析和交互信息的方式,但Agentic AI将从根本上重塑工作本质。AI的这一新前沿超越了内容生成与洞察提炼,转向能够自主规划、执行和调整复杂动作序列的AI agents。通过Amazon Bedrock提供的Palmyra X5,亚马逊云科技的客户可使用Writer的模型安全私密地构建和扩展AI agents,无需管理底层基础设施。此外,对各行业的企业来说,Palmyra X5最令人振奋的是能够构建和部署更复杂的AI agents,这些agents可以处理海量数据,并与其他agents、大语言模型及外部系统工具进行交互。

Writer提供精确且完全自主的模型,杜绝后期训练量化与知识蒸馏,确保今天验证的行为模式与明天的行为模式保持一致。Palmyra X5在此基础上强化技术承诺,严格保持后向兼容性以避免团队重复调优流程的痛苦,同时发布客户可参与制定的公开企业技术路线图,并通过优化推理延迟,使即便在百万token量级下,大语言模型交互和检索增强生成(RAG)也能实现近乎即时的响应。

Writer宣布,得益于创新型Transformer设计(一种支持输入数据并行处理而非顺序处理的架构)与混合注意力机制(允许多种方式同时关注信息,既保证效率也确保效果),其未来发布的所有大语言模型将以一百万token作为最小上下文窗口规模。这意味着企业可基于持续扩展的AI能力制定长期战略,而不受限于上下文窗口的规模约束。

访问亚马逊云科技新闻博客获取Palmyra X5的详细信息,包括模型在Amazon Bedrock的部署方法与潜在用例,并查看Amazon Bedrock中的Writer产品页面。立即访问Amazon Bedrock控制台开始使用Palmyra X5和 Palmyra X4。

关于亚马逊云科技

自2006年以来,亚马逊云科技(Amazon Web Services)一直以技术创新、服务丰富、应用广泛而享誉业界。亚马逊云科技一直不断扩展其服务组合以支持几乎云上任意工作负载,目前提供超过240项全功能的服务,涵盖计算、存储、数据库、网络、数据分析、机器学习与人工智能、物联网、移动、安全、混合云、媒体,以及应用开发、部署与管理等方面;基础设施遍及36个地理区域的114个可用区,并已公布计划在新西兰和沙特阿拉伯等新建4个区域、12个可用区。全球数百万客户,包括发展迅速的初创公司、大型企业和领先的政府机构,都信赖亚马逊云科技,通过亚马逊云科技的服务支撑其基础设施,提高敏捷性,降低成本。要了解更多关于亚马逊云科技的信息,请访问:www.amazonaws.cn

责任编辑:王力
读者评论 (0)
请您登录/注册后再评论