VIP
推荐
资料
视频
专题
更多
GB_T 45288.2-2025 人工智能大模型 第2部分:评测指标与方法
文档大小:
581KB
在线浏览
作者:
国家市场监督管理总局
国家标准化管理委员会
国家市场监督管理总局
国家标准化管理委员会
关键词:
人工智能大模型
评测指标
评测方法
单模态与多模态
发布时间:
2025-04-21
资料简介:
本标准旨在规范人工智能大模型的评测体系。该标准详细定义了大模型的理解能力和生成能力的评测指标,涵盖文本、图像、音频等单模态及图文、文音等多模态任务。评测方法包括自动化测试、人工测试及使用大模型作为裁判的测试,确保评测结果的客观性和准确性。标准还对评测数据集、评测环境和工具提出了具体要求,适用于模型提供者、应用服务者和消费者对大模型能力的评估与测试,为大模型的设计、开发和应用提供指导。
资料等级:
下载费用:
免费
如何获取V币?
非VIP会员只能预览前0页,购买该资料可完整预览。开通VIP即可无限畅览!
购买
开通VIP
预览
下载内容:GB_T 45288.2-2025 人工智能大模型 第2部分:评测指标与方法
下载费用:0v币
您有V币:0个 (含普通V币0个,赠送v币0个)
系统将优先扣除赠送V币,同一资料重复下载不扣费,确定后开始下载?
购买资料:GB_T 45288.2-2025 人工智能大模型 第2部分:评测指标与方法
购买费用:0v币
您有V币:0个 (含普通V币0个,赠送v币0个)
系统将优先扣除赠送V币,同一资料重复购买不扣费,确定后开始下载?