多组学数据如何高效上传GSA?这份流程指南请收好
浏览次数:24 分享:

GSA(Genome Sequence Archive,基因组序列存档)由中科院基因组所主办,是国内权威的组学数据存储与共享平台,为全球科研人员提供基因组、转录组等高通量测序数据的提交、存储与开放获取服务,支撑生命科学研究与数据共享。那么,如何将多组学数据高效、合规地提交至GSA?本文将结合实操经验,为你梳理完整的上传流程与关键注意事项。

                     

1. 准备

             

1.1 注册及登录账号

               

网址:https://ngdc.cncb.ac.cn/gsa/

建议:使用实验室公共邮箱或PI(导师)的邮箱进行注册,避免因学生毕业离职导致账号无法找回

激活:注册后需查收激活邮件。若未收到,请检查垃圾邮件,或将 `@big.ac.cn` 加入白名单

                                        

                   

                                     

1.2 数据库选择 

          

(1) 普通数据(动植物、微生物等):选择 GSA数据库(https://ngdc.cncb.ac.cn/gsa)

                                          

 

                                

(2)人类遗传资源数据:选择GSA-Human 子库(https://ngdc.cncb.ac.cn/gsa-human/),需进行科技部备案或审批(https://ngdc.cncb.ac.cn/hgrip/login/)

                         

                      

2.信息收集

                             

类型 信息
项目 项目标题/涉及领域/项目说明/项目资金来源/项目数据类型/样本涉及范围
样本 数据类型/样本名称/样本描述/物种/组织类型/性别/年龄
实验数据 实验信息/材料来源/设计策略/测序平台/模式/数据格式/数据及MD5检验码

                       

3.上传流程

                      

GSA的数据结构是层级式的:BioProject (项目) -> BioSample (样本) -> GSA (数据),需按顺序创建。

             

 

步骤

描述

Step1

创建BioProject

对研究项目的总体描述,一个BioProject可包含多个BioSample

Step2

创建BioSample

收集生物样本信息,每一个独立的生物学样本都应该创建一个对应的BioSample

Step3

创建 GSA 数据集

实验信息、数据等元数据信息提交、修改和数据文件上传

                              

3.1创建BioProject

                       

(1) 进入BioProject提交入口(https://ngdc.cncb.ac.cn/gsub/submit/bioproject/list) -> 新建 BioProject

                 

                                          

(2) 跳转新界面,依次补充信息,保存并进入下一步

                       

 

信息栏

必填项

01

提交者信息

姓名/邮箱/单位/国家/城市/街道/邮编

02

基本信息

项目标题/涉及领域/项目说明/项目资金来源-项目批准号(可无)

03

项目类型

项目数据类型(可多选)/样本范围(根据提示选择)

04

出版信息

05

概览 & 提交

确认信息,点击提交

                              

(3) 提交后系统会分配一个 BioProject 编号,请记录下来,下一步要用。

                       

                                                    

3.2 创建BioSample

                        

(1) 在系统首页(https://ngdc.cncb.ac.cn/gsub/)点击BioSample -> 新建 BioSample

          

                                              

(2) 跳转新界面,依次补充信息,保存并进入下一步。

                       

                               

 

信息栏

必填项

01

提交者信息

姓名/邮箱/单位/国家/城市/街道/邮编

02

基本信息

项目编号(BioProject 编号)

03

样本类型

根据提示选择样本类型

04

样本属性

下载Excel模板,补充信息:样本名称、描述、物种、性别、器官等信息后提交文件

05

概览 & 提交

确认信息,点击提交

                              

(3) 提交后系统会分配一个提交编号

                       

                                               

3.3创建 GSA 数据集

               

(1)在系统首页(https://ngdc.cncb.ac.cn/gsub/)点击 GSA/GSA-Human -> 新建GSA

                                           

                      

(2) 跳转新界面,依次补充信息,保存并进入下一步

             

 

信息栏

必填项

01

提交者信息

姓名/邮箱/单位/国家/城市/街道/邮编

02

基本信息

数据标题/描述信息/项目编号(BioProject 编号)

03

元数据信息

下载Excel模板,补充信息:

Experiment Sheet:实验信息、材料来源、测序平台、设计策略等信息

Run Sheet: 测序数据的样本名称,数据格式,MD5检验码等信息

04

文件

提交数据,可选ftp格式,根据提示上传数据:

05

概览 & 提交

确认信息,点击提交

                              

(3) 提交后系统会分配一个 GSA 编号, 等待审核

                       

                                        

审核通过后,你将获得一个CRA编号,至此数据提交即告完成。多组学数据不仅是论文的支撑,更关乎国家战略资源安全。GSA作为国内权威平台,致力于为高质量数据提供安全、规范的存储环境。按本文流程完成提交,你收获的不仅是一个编号,更是一份对科研诚信与数据主权的承诺。愿每一份数据资产,都能在合规轨道上释放长久的科学价值。

                 


 

乐备实(上海优宁维生物科技股份有限公司旗下全资子公司),是国内专注于提供高质量蛋白检测以及组学分析服务的实验服务专家,自2018年成立以来,乐备实不断寻求突破,公司的服务技术平台已扩展到单细胞测序、空间多组学、流式检测、超敏电化学发光、Luminex多因子检测、抗体芯片、PCR Array、ELISA、Elispot、PLA蛋白互作、多色免疫组化、DSP空间多组学等30多个,建立起了一套涵盖基因、蛋白、细胞以及组织水平实验的完整检测体系。

 
我们可提供从样本运输、储存管理、样本制备、样本检测到检测数据分析的全流程服务。凭借严格的实验室管理流程、标准化实验室操作、原始数据储存体系以及实验项目管理系统,已经为超过3000家客户单位提供服务,年检测样本超过100万,受到了广大客户的信任与支持。

声明:本篇文章在创作中部分采用了人工智能辅助。如有任何内容涉及版权或知识产权问题,敬请告知,我们承诺将在第一时间核实并撤下。

详见LabEx网站( www.u-labex.com)或来电咨询!
基因水平:PCR Array、RT-PCR、PCR、单细胞测序
蛋白水平:MSD、Luminex、CBA、Elispot、Antibody Array、ELISA、Sengenics
细胞水平:细胞染色、细胞分选、细胞培养、细胞功能
组织水平:空间多组学、多重荧光免疫组化、免疫组化、免疫荧光
数据分析:流式数据分析、组化数据分析、多因子数据分析
联系电话:4001619919
联系邮箱:labex-mkt@u-labex.com
公众平台:蛋白检测服务专家