在线工具 - 2019新型冠状病毒信息库

国家生物信息中心
2019新型冠状病毒信息库

国家生物信息中心
2019新型冠状病毒信息库 (2019nCoVR)

De novo-Assembly

功能描述

      序列组装(De novo-Assembly)可将NGS二代测序原始数据进行序列拼接,拼接得到的序列与新冠病毒参考基因组进行BLASTN比对,检测样本组装结果中含有的新冠病毒序列,评估组装结果,分析比对上新冠病毒基因组的序列覆盖度、测序深度等。

测序类型:

上传单端文件

此流程目前仅支持illumina测序数据,后续计划部署三代测序数据分析流程(PacBio /Nanopore);建议上传gzip压缩文件以减少上传时间。

邮件地址(当计算时间较长时,通过邮件通知计算结果)
邮箱
 
邮件主题
运行
提示:目前队列运行的任务有个,排队任务有个;预计处理时间参考下面表格结果
数据处理流程
结果示例
帮助文档
1. 运行参考时间:

      运行参考时间为服务器系统在空闲状态下,采用真实数据集测试出的运行时间(不包含数据上传至服务器的时间),实际递交任务的运行时间取决于系统的负荷状况、数据集的大小及数据的质量等因素。

Data1Data2Data3Data4Data5Data6
单/双端SINGLEPAIREDPAIREDPAIREDPAIREDPAIRED
测序量118Mb203Mb1.0Gb1.5Gb2.2Gb8.0Gb
计算时间*1m34s1m48s23m12s41m18s1h5m28s41m12s
数据编号SRR11247077SRR10903402SRR11092064SRR11092057SRR11092058SRR10971381

*按使用10线程,50G内存

2. 软件版本和主要参数
  1. Trimmomatic (Version: 0.39)
    1. Paired-End Model: ILLUMINACLIP:TruSeq3-PE-2.fa:2:30:10 SLIDINGWINDOW:4:15 LEADING:3 TRAILING:3 MINLEN:36
    2. Single-End Model: ILLUMINACLIP:TruSeq3-SE.fa:2:30:10 SLIDINGWINDOW: 4:15 LEADING:3 TRAILING:3 MINLEN:36
  2. MEGAHIT (Version: 1.2.9)
    1. Default parameters
  3. QUAST (Version: 5.0.2)
    1. Default parameters
  4. BLASTN (ncbi-blast-2.10.0+)
    1. -outfmt “6 qseqid qlen sseqid slen pident length qcovs qcovhsp qcovus mismatch gapopen qstart qend sstart send gaps evalue bitscore stitle” -subject_besthit -perc_identity 80 -max_hsps 5
  5. BBMap (Version: Last modified February 13, 2020)
    1. kfilter=22 subfilter=15 maxindel=80
  6. Samtools (Version: 1.3.1)
    1. Default parameters
  7. Deeptools/bamCoverage (Version: 3.4.3)
    1. -bs 1
3. 结果文件
  1. Trimmomatic.log
    1. 原始数据质量过滤统计
  2. sample_all_assembly.fa
    1. 通过MEGAHIT组装得到的所有contigs序列
  3. Assembly_statistics.tar.gz
    1. QUAST组装质量评估结果
  4. sample_2019nCoV_blastn_6.tsv
    1. SARS-CoV-2 参考基因组 BLASTN 比对结果 (格式6-表格)
  5. sample_2019nCoV.fa
    1. BLASTN鉴定得到的比对上 SARS-CoV-2 参考基因组的contigs序列
  6. viral_contigs_coverage directory
    1. Viral_contigs_bowtie2_mapped.log
      1. 比对上SARS-CoV-2 contigs的reads统计
    2. Viral_contigs_coverage_statistics.tsv
      1. SARS-CoV-2 contigs覆盖度统计
    3. Viral_contigs_coverage.bw
      1. SARS-CoV-2 contigs可视化(BigWig格式)