亚马逊云科技正在计算资源、开发工具、数据管理、模型优化以及社区等多个方面,为企业构建和应用生成式AI提供了全栈支持,助力企业在生成式AI领域实现创新和发展,提升市场竞争力。
“优胜劣汰,适者生存。”从达尔文的《进化论》中可以得知:当自然环境发生巨大改变时,能够存活下来的不是最聪明的,也不是最强壮的,而是对环境变化能做出快速反应,适应力最强的。面对生成式AI应用浪潮,企业数字化加速觉醒,成为创新与发展的重要引擎。通过覆盖基础设施、模型和应用的全栈联动创新助力企业应用生成式AI,亚马逊云科技正在全面重塑客户云上AI的创新体验,之前在2024 re:Invent全球大会上的一系列重磅发布,更是对此进行了强有力的印证。
“目前企业的应用程序基本上都能够拆解为若干核心的构建单元,而亚马逊云科技所聚焦的,就是帮助用户构建高效、出色的核心单元,助力业务增长。”在2024亚马逊云科技2024 re:Invent中国行北京站上,亚马逊云科技大中华区产品部总经理陈晓建针对全球大会上的系列发布进行了解读,他表示亚马逊云科技正在计算资源、开发工具、数据管理、模型优化以及社区等多个方面,为企业构建和应用生成式AI提供了全栈支持,助力企业在生成式AI领域实现创新和发展,提升市场竞争力。
筑基:为计算注入澎湃动力
自2006年推出首个云计算服务,长期的实践使亚马逊云科技能不断推出满足各类需求的计算实例类型。其中,Amazon EC2 能够为用户给予更多的选择、更丰富的实例类型以及更全面的功能,方便客户针对应用和工作负载去探寻性价比更高的解决方案。在去年底的re:Invent全球大会上,亚马逊云科技在云计算基础设施方面持续发力,推出了一系列性能卓越的自研芯片与高效的计算实例。
特别是面对AI浪潮,亚马逊云科技及时推出适用于相关场景的计算实例,例如新一代Graviton4芯片计算性能大幅提升,其中vCPU的数量显著增加,为各类工作负载提供了强大的计算支持。同时,基于Trainium2芯片的Amazon EC2 Trn2实例及UltraServer超级服务器正式上线,新发布的产品功能通过先进的封装技术,实现了CPU与内存的无缝集成,大幅提升了计算性能与能效,为用户带来了更高性价比的选择。
其中,专为大型、前沿的生成式AI工作负载设计Amazon Trainium2,其实例Amazon Elastic Compute Cloud(Amazon EC2)Trn2正式可用,与当前基于GPU的EC2 P5e和P5en实例相比,Amazon EC2 Trn2实例的性价比提升30-40%。它配备16个Trainium2芯片,可提供高达20.8 Petaflops浮点算力的性能,更适合训练和部署具有数十亿参数的大型语言模型(LLMs)。
从用户的角度,Adobe在使用Trainium2测试其Firefly frontier图像模型时,已经收获了令人振奋的初步成果。此外,Poolside也计划在Trainium2上训练其未来的模型,预计借此可使训练成本降低40%。
值得一提的是,亚马逊云科技还宣布推出新一代AI训练芯片Amazon Trainium3。Trainium3是亚马逊云科技首款采用3纳米工艺制造的芯片,在性能、能效和密度上树立了新标杆。搭载Trainium3的UltraServers性能预计将是Trn2 UltraServers的4倍,使客户在构建模型时能够更快迭代,并在部署时提供卓越的实时性能。针对通用云计算场景,亚马逊云科技推出了强大的Graviton 芯片 ——Amazon Graviton4。这款芯片有着令人瞩目的性能提升,其单核计算性能相较于以往提升了足足30%,并且虚拟CPU数量以及内存容量皆是上一代的3倍。
标杆:扩展性与高性能赋能各类工作负载
在人们心中,亚马逊云科技的Amazon S3一直是可靠、便捷的代名词,作为亚马逊云科技的首个云服务,Amazon S3在10年前的存储容量达到1PB的客户还不到100家。如今,Amazon S3目前存储的对象数量已突破400万亿。此外,有超过100万个客户把Amazon S3作为数据湖的首选平台,凭借出色的扩展性、性能、成本效益、易用性和先进功能,Amazon S3成了企业数据湖构建的不二选择。这些数据湖为不同领域的分析、金融建模、广告投放等各项工作提供支持。
在去年年底的re:Invent全球大会上,亚马逊云科技宣布Amazon S3 Tables正式可用,这是一种专门为Iceberg表设计的新型存储桶类型,其查询速度是常规存储桶的3倍,每秒可处理的事务数量是常规Amazon S3存储桶的10倍。
此外,亚马逊云科技还发布了全新的Amazon S3 Metadata元数据服务,这是一项全新服务,能帮助客户即时发现和理解Amazon S3中的数据,能够自动为客户创建可查询的元数据,并且几乎实时进行更新。
创新:革新事务处理,赋能多元业务场景
企业在使用数据库的时候,理想的数据库解决方案应具备以下关键功能:拥有极高的可用性,支持跨区域部署,具备低延迟性能,确保强一致性,将运维负担降至近乎为零,并且必须与SQL兼容。
基于这些需求,亚马逊云科技研发出一种全新的事务处理方法。通过把事务处理与存储层相分离,如此一来,无需每条语句都对存储层进行查询,仅在提交时执行一次性检查即可。在提交阶段可以把所有写操作并行地执行到各个区域,这一举措既保障了强一致性,又实现了数据库的极速写入。
从关系型数据库,到图数据库,再到文档数据库,每种使用场景都能找到适配的数据库工具。如今,新的数据库产品不断涌现并带来更多惊喜。例如,Amazon Aurora DSQL作为一款全新的无服务器分布式SQL数据库,结合Amazon Time Sync服务,采用完全无服务器设计,可在多区域实现近乎无限扩展,可用性高达99.999%,支持强一致性,具备低延迟的读写性能,且完全兼容PostgreSQL。与其他流行分布式SQL数据库相比,其读写速度提升了4倍,极大地满足了对高性能数据库有需求的场景。
此外,亚马逊云科技新推出的Amazon DynamoDB global tables现已支持多区域强一致性。这意味着无论客户选择SQL还是NoSQL数据库,都能享受到这些优势:支持主动 - 主动的多区域部署,同时具备强一致性、低延迟和高可用性。这些专门构建的数据库广受欢迎,使得许多以往无法实现的工作负载得以成为现实。不过,关系型数据库仍然是众多应用的最佳选择之一,这也是亚马逊云科技加速在该领域创新的原因。
突破:全面助力生成式AI应用释放价值
目前,企业正在积极融入到大模型应用浪潮中,在生成式AI领域,亚马逊云科技全面强化基础设施、模型和应用三层技术栈,帮助企业更轻松、更经济地将生成式AI应用于实际业务场景。
在去年年底的re:Invent全球大会上,亚马逊云科技推出Amazon Nova六款基础模型,并在Amazon Bedrock中新接入100多款模型,并推出AI防护、多智能体协作和模型蒸馏等重磅更新,全面优化推理场景的准确性、成本和响应速度。Amazon Q更加深入软件开发和商业应用场景,并为传统工作负载转型开辟新途径,Amazon SageMaker AI将帮助客户更快更轻松地构建、训练和部署模型。
从市场表现看,Amazon Nova大幅降低基础模型成本。Amazon Nova包括Nova Micro、Nova Lite、Nova Pro和Nova Premier基础模型,以及用于生成高质量图像的Nova Canvas和生成高质量视频的Nova Reel。在各自智能类别中,Amazon Nova Micro、Lite和Pro应用成本比Amazon Bedrock中表现最佳的模型至少降低75%,同时也是Amazon Bedrock中对应类别速度最快的模型。
●亚马逊云科技作为首家提供Luma AI和poolside模型,不仅更新了Stability AI的最新模型,并通过新推出的Amazon Bedrock Marketplace功能为客户提供100多个热门、新兴及专业模型;同时,Amazon Bedrock推出了低延迟优化推理、模型蒸馏、提示词缓存等功能,大幅提升推理效率;支持GraphRAG等知识库功能增强数据利用能力;通过自动推理检查功能和多智能体协作等创新,进一步增强AI安全性并推动智能体发展。
●Amazon Q Developer引入三款全新智能体,可自动执行单元测试、文档编制以及代码审查流程。通过与 GitLab 的深度集成,显著拓展了应用场景。此外,推出转型功能,旨在加速Windows.NET、VMware及大型机工作负载的迁移与现代化进程,有效缩短转型周期并降低成本。在洞察能力方面,Amazon Q Business 和 Amazon Q in QuickSight得到进一步强化,同时,复杂工作流程的自动化实现方式得以简化,提升了整体效率与便捷性。
在基础设施领域,亚马逊云科技推出Amazon SageMaker AI的四项创新,包括Amazon SageMaker HyperPod的新训练配方功能、灵活训练计划和任务治理功能,以及在Amazon SageMaker中使用亚马逊云科技合作伙伴的热门AI应用。这些功能将帮助客户更快开始训练流行模型,通过灵活训练计划节省数周时间,并将成本降低高达40%。
伴随数字化技术的不断进步,企业业务融入AI的应用场景将不断拓展,通过深厚的积累将技术创新和生态融合兼收并蓄,亚马逊云科技为企业提供了全方位的支持,帮助企业从云端到本地、从数据分析到智能决策,充分释放企业数字化转型升级潜能,迈向更加高效和可持续的未来。
本文为e-works原创投稿文章,未经e-works书面许可,任何人不得复制、转载、摘编等任何方式进行使用。如已是e-works授权合作伙伴,应在授权范围内使用。e-works内容合作伙伴申请热线:editor@e-works.net.cn tel:027-87592219/20/21。