湖南省健康医疗行业高质量数据集建设项目(第二次)
招标计划公告
资格预审公告/招标公告
- 项目名称: 湖南省健康医疗行业高质量数据集建设项目
- 项目地址: /
- 范围: 主要建设包括数据基础、开发、治理、资产运营、安全管理与服务开放等在内的高质量数据集服务平台。(1)预训练集涵盖文本、图像、视频3种模态数据,文本数据集源数据规模≥20TB,清洗后≥2TB;图像数据集源数据规模≥25TB,清洗后≥5TB,图像≥500万张;视频数据集清洗后≥500TB,总时长≥2万小时;清洗后的预训练集重复率不高于50%;(2)清洗后的指令微调数据集≥45万条,重复率不高于1%;(3)测试数据集≥12万条;(4)项目建成后,数据集每年服务不少于5个大模型研发
- 概况: 2.1招标项目或标段(以下简称:招标项目)名称:湖南省健康医疗行业 高质量数据集建设项目(第二次); 2.2供货地点:湖南省健康医疗大数据中心产业园; 2.3项目基本情况:主要建设包括数据基础、开发、治理、资产运营、安全管理与服务开放等在内的高质量数据集服务平台
项目详情
湖南省健康医疗行业高质量数据集建设项目【招标计划】
发布日期: 2025年11月18日
|
项目名称
|
湖南省健康医疗行业高质量数据集建设项目
|
||
|
招标人名称
|
湖南健康大数据发展有限公司
|
||
|
投资估算
|
1800.000000 万元
|
资金来源
|
自筹
|
|
项目概况
|
主要建设包括数据基础、开发、治理、资产运营、安全管理与服务开放等在内的高质量数据集服务平台。(1)预训练集涵盖文本、图像、视频3种模态数据,文本数据集源数据规模≥20TB,清洗后≥2TB;图像数据集源数据规模≥25TB,清洗后≥5TB,图像≥500万张;视频数据集清洗后≥500TB, 总时长≥2万小时;清洗后的预训练集重 复率不高于50%;(2)清洗后的指令微调数据集≥45万条,重复率不高于1%;(3)测试数据集≥12万条;(4)项目建成后,数据集每年服务不少于5个大模型研发。
|
||
|
招标范围
|
主要建设包括数据基础、开发、治理、资产运营、安全管理与服务开放等在内的高质量数据集服务平台。(1)预训练集涵盖文本、图像、视频3种模态数据,文本数据集源数据规模≥20TB,清洗后≥2TB;图像数据集源数据规模≥25TB,清洗后≥5TB,图像≥500万张;视频数据集清洗后≥500TB, 总时长≥2万小时;清洗后的预训练集重 复率不高于50%;(2)清洗后的指令微调数据集≥45万条,重复率不高于1%;(3)测试数据集≥12万条;(4)项目建成后,数据集每年服务不少于5个大模型研发。
|
||
|
计划招标时间
|
2025-11-19 00:00
|
||
|
其他
|
|
||
|
备注
|
本次公开的招标计划是本项目的初步安排,仅供各方提前知悉,提高招投标活动透明度,后期存在因故取消、变更的可能,具体情况以招标公告和招标文件为准
|
||