GB_T 45288.2-2025 人工智能大模型 第2部分:评测指标与方法

文档大小:581KB
发布时间:2025-04-21
资料简介:本标准旨在规范人工智能大模型的评测体系。该标准详细定义了大模型的理解能力和生成能力的评测指标,涵盖文本、图像、音频等单模态及图文、文音等多模态任务。评测方法包括自动化测试、人工测试及使用大模型作为裁判的测试,确保评测结果的客观性和准确性。标准还对评测数据集、评测环境和工具提出了具体要求,适用于模型提供者、应用服务者和消费者对大模型能力的评估与测试,为大模型的设计、开发和应用提供指导。
资料等级: 
下载费用:免费    如何获取V币?