基因测序施展中出现的专科词汇是什么意念念?——名词讲明
图片
单核苷酸多态性 single nucleotide polymorphism; SNP在基因组水平,由单个核苷酸位点的变异(替代、插入或缺失)所引起的脱氧核糖核苷酸序列多态性。图片
插入缺失型变异 insertion and deletion; Indel
在基因组的某个位置上所发生的小片断序列的插入大致缺失,插入或缺失片断的长度<50bp。
图片
结构性变异 structural variation;SV
包括大片断缺失、大片断重迭、倒位、易位。
大片断缺结怨大片断重迭又叫拷贝数变异(copy number variation,CNV),即畅达较长的序列发生了缺失大致重迭,与插入删除型变异的分别在于变异的长度。
倒位指染色体上某一段序列发生了180度的倒置。易位指染色体上的某一派段飘扬到了其他位置上。
测序通说念 lane
高通量检测平台测序功能在芯片上完了,整张芯片不错物理分隔成更小部分,每个物理分隔的栏称为lane。
原始数据产出(Mb)
测序下机的原始数据量,即测序得到的碱基数量,以Mb为单元,1 Mb=1000, 000 base。
主见区域解除度 covered length
测序数据在主见区域的解除百分比。
主见区域长度(bp):拿获测序的主见区域总长,举例全外显子拿获即是全外显子区间总长。
探针解除度(bp):拿获芯片中探针解除区域总长,由于探针磋磨特质,拿获探针解除区域长度一般比主见区域长度要长。
图片
平均测序深度 sequencing depth
测序得到碱基总量与基因组大小比值。
图片
1倍测序深度 1X
测序得到碱基总量与基因组大小比值为1。
4倍测序深度 4X
测序得到碱基总量与基因组大小比值为4。
20倍测序深度 20X
测序得到碱基总量与基因组大小比值为20。
FASTQ款式 FASTQ format
FASTQ 基于文本的、保存生物序列(频繁是核酸序列)和其测序质地信息的、每四行暗意一条序列的标准款式。
惟一下机序列 uniq reads
测序得到的惟一的下机序列。
Q20
测序数据中,碱基识别质地值>20的碱基占所有这个词碱基的比例。
注:碱基识别质地值为20时,暗意碱基的正确率为99%以上,Q20≥95%,则暗意测序数据中95%以上的碱基质地值大于20。
Q30
测序数据中,碱基识别质地值>30的碱基占所有这个词碱基的比例。
注:碱基识别质地值为30时,暗意碱基的正确率为99.9%以上,Q30≥85%,则暗意测序数据中85%以上的碱基质地值大于30。
碱基质地值(Base Quality Score, Q-score)是该碱基测序诞妄率的体现,不才机数据中每个序列的每个碱基王人有一个质地值信息,咱们通过识别这个质地值信息就不错了解到这个碱基被识别出错的概率是几许。质地值=-10log10(p),p为该碱基的测序诞妄率。即碱基质地值为30的时辰,这个碱基测错的概率为千分之一,标明该碱基可靠性尽头高。 碱基的质地信息咱们不错在数据的原始文献中稽查到的。二代测序平台双端测序得到的原始数据为fastq(或为压缩文献fq.gz)款式,每个样本有 fq1 和 fq2 两个文献,文献中为测序两头的 reads信息,序列频繁按轨则逐一双应。
图片
平均读长 read length
测序的下机数据里,所有这个词序列的平均长度。以碱基(bp)为单元,常见的读长有50 bp、90 bp、100bp、150 bp。
图片
测序数据质控联系名词图片
图片
生物信息学联系的名词图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
测序仪及平台图片
图片
图片
图片
图片
本站仅提供存储工作,所有这个词本体均由用户发布,如发现存害或侵权本体,请点击举报。