GSA(Genome Sequence Archive,基因组序列存档)由中科院基因组所主办,是国内权威的组学数据存储与共享平台,为全球科研人员提供基因组、转录组等高通量测序数据的提交、存储与开放获取服务,支撑生命科学研究与数据共享。那么,如何将多组学数据高效、合规地提交至GSA?本文将结合实操经验,为你梳理完整的上传流程与关键注意事项。
1. 准备
1.1 注册及登录账号
网址:https://ngdc.cncb.ac.cn/gsa/
建议:使用实验室公共邮箱或PI(导师)的邮箱进行注册,避免因学生毕业离职导致账号无法找回
激活:注册后需查收激活邮件。若未收到,请检查垃圾邮件,或将 `@big.ac.cn` 加入白名单

1.2 数据库选择
(1) 普通数据(动植物、微生物等):选择 GSA数据库(https://ngdc.cncb.ac.cn/gsa)

(2)人类遗传资源数据:选择GSA-Human 子库(https://ngdc.cncb.ac.cn/gsa-human/),需进行科技部备案或审批(https://ngdc.cncb.ac.cn/hgrip/login/)

2.信息收集
| 类型 | 信息 |
| 项目 | 项目标题/涉及领域/项目说明/项目资金来源/项目数据类型/样本涉及范围 |
| 样本 | 数据类型/样本名称/样本描述/物种/组织类型/性别/年龄 |
| 实验数据 | 实验信息/材料来源/设计策略/测序平台/模式/数据格式/数据及MD5检验码 |
3.上传流程
GSA的数据结构是层级式的:BioProject (项目) -> BioSample (样本) -> GSA (数据),需按顺序创建。
|
|
步骤 |
描述 |
|
Step1 |
创建BioProject |
对研究项目的总体描述,一个BioProject可包含多个BioSample |
|
Step2 |
创建BioSample |
收集生物样本信息,每一个独立的生物学样本都应该创建一个对应的BioSample |
|
Step3 |
创建 GSA 数据集 |
实验信息、数据等元数据信息提交、修改和数据文件上传 |
3.1创建BioProject
(1) 进入BioProject提交入口(https://ngdc.cncb.ac.cn/gsub/submit/bioproject/list) -> 新建 BioProject
(2) 跳转新界面,依次补充信息,保存并进入下一步
|
|
信息栏 |
必填项 |
|
01 |
提交者信息 |
姓名/邮箱/单位/国家/城市/街道/邮编 |
|
02 |
基本信息 |
项目标题/涉及领域/项目说明/项目资金来源-项目批准号(可无) |
|
03 |
项目类型 |
项目数据类型(可多选)/样本范围(根据提示选择) |
|
04 |
出版信息 |
无 |
|
05 |
概览 & 提交 |
确认信息,点击提交 |
(3) 提交后系统会分配一个 BioProject 编号,请记录下来,下一步要用。
3.2 创建BioSample
(1) 在系统首页(https://ngdc.cncb.ac.cn/gsub/)点击BioSample -> 新建 BioSample
(2) 跳转新界面,依次补充信息,保存并进入下一步。

|
|
信息栏 |
必填项 |
|
01 |
提交者信息 |
姓名/邮箱/单位/国家/城市/街道/邮编 |
|
02 |
基本信息 |
项目编号(BioProject 编号) |
|
03 |
样本类型 |
根据提示选择样本类型 |
|
04 |
样本属性 |
下载Excel模板,补充信息:样本名称、描述、物种、性别、器官等信息后提交文件 |
|
05 |
概览 & 提交 |
确认信息,点击提交 |
(3) 提交后系统会分配一个提交编号
3.3创建 GSA 数据集
(1)在系统首页(https://ngdc.cncb.ac.cn/gsub/)点击 GSA/GSA-Human -> 新建GSA

(2) 跳转新界面,依次补充信息,保存并进入下一步

|
|
信息栏 |
必填项 |
|
01 |
提交者信息 |
姓名/邮箱/单位/国家/城市/街道/邮编 |
|
02 |
基本信息 |
数据标题/描述信息/项目编号(BioProject 编号) |
|
03 |
元数据信息 |
下载Excel模板,补充信息: Experiment Sheet:实验信息、材料来源、测序平台、设计策略等信息 Run Sheet: 测序数据的样本名称,数据格式,MD5检验码等信息 |
|
04 |
文件 |
提交数据,可选ftp格式,根据提示上传数据:
|
|
05 |
概览 & 提交 |
确认信息,点击提交 |
(3) 提交后系统会分配一个 GSA 编号, 等待审核
审核通过后,你将获得一个CRA编号,至此数据提交即告完成。多组学数据不仅是论文的支撑,更关乎国家战略资源安全。GSA作为国内权威平台,致力于为高质量数据提供安全、规范的存储环境。按本文流程完成提交,你收获的不仅是一个编号,更是一份对科研诚信与数据主权的承诺。愿每一份数据资产,都能在合规轨道上释放长久的科学价值。






沪公网安备31011502400759号
营业执照(三证合一)