Sequencher 是 DNA 序列分析的工业标准软件。它可以和所有的自动序列分析仪一同工作,并且因为它的极速 Contig 组装、很短的学习曲线、用户友好的编辑工具,以及卓越的技术支持而众所周知。从差不多 15 年前释出第一个版本到现在,Sequencher 在每个基因专业和制药公司中都应用与于序列分析任务,同时在全球超过40个国家里为数众多的学术和政府实验室中使用。Sequencher 被生命科学研究者们使用于许多不同的 DNA 序列分析应用方面,包括基因重组、突变检测、法医的人体辨别,以及分类学等等...
Sequencher 的能力包括杂合子和 SNP 的检测和分析,cDNA 到 染色体 DNA 的大型间隙对准,比较排序,对置信评分的支持、ORF 转换、基因银行特性化导入、以及限制酶映射等等。
Sequencher 产品特性:
◆Traditional Sequencing传统测序
●Sequence Editing
●Sequence Trimming
●Sequence Assembly
●Confidence Values
●SNP Detection
●Automated Analysis
◆Next-Generation Sequencing 新一代测序
●Maq
●GSNAP
●SNP Analysis
●Methylation Studies
●Viewers
◆General Analysis 常规分析
●Reference Alignment
●Variance Table
●Translated Variance Table
●Restriction Mapping
●Clustal
●Customize your Workspace
●Reports
Traditional Sequencing 传统测序
Sequencher使传统测序组装容易和可控。对于低质量的数据,进行序列修饰也很容易。使用者可以保留修饰准则来实现简便的操作。并且选择最优算法来处理数据。当对不同来源样本进行序列分析时可以自动使用Assmeble by Name。编辑功能能用于简便查找模棱两可的数据,杂合子并进行数据移动。confidence values功能用于辅助修饰数据,查找数据及SNP检出,从而提高了用户结果的质量。
Sequence Editing 序列编辑
Sequencher提供了DNA序列编辑工具,使用者需要知道序列是否绝对正确。使用者可以在chromatogram图框中查看一条序列或多条序列比对的情况,同时还可以查看正反向序列信息。Sequencher可以快速和容易的查看序列比对结果或者使用selection工具高亮不一致或低质量区段。
.jpg)
Sequence Trimming 序列修饰
自动化测序偶尔会产生质量较低的阅读片段,尤其在靠近测序引物断,及长片段末端。从DNA库中获得的克隆序列常常包含载体序列,polyA尾,或其他无关序列。内含子和引物序列常常出现在扩增外显子的两边。除非使用修饰去除,任何的这些人工痕迹将扰乱序列拼接和下游的序列分析。
Sequencher提供了容易使用却功能强大的工具帮助Sequencher用户修饰低质量序列或模棱两可的数据:
●Trim Ends 从序列片段末端删除误导数据。
●Trim Vector 去除特异片段两端的载体序列。
●Trim to Reference 消除序列末端超过参考组装序列的延伸部分。
.jpg)
在进行修饰前,Sequencher提示参考修饰的对话框,从而允许使用者进一步优化修饰方案。
.jpg)
Sequence Assembly 序列组装
Sequencher的直观控制允许使用者对序列组装进行设置,并对DNA片段进行快速准确的组装。Sequencher自动比较正反向原始序列并组装出最可能的contig,因此用户可以轻松完成组装不用担心序列的方向问题。
Sequencher组装工具的应用:
●比较基因变异
●确认载体结构
●组装病毒和细菌基因组
●从cDNA文库中对上万条序列进行进化分析
●装配cDNA到基因组序列
●建立引物图谱


Confidence Values 置信度值
Sequencher在Project window, Sequence Editor及Sequence Get Info window中均显示置信度及相关信息,因此用户可以很容易的监测数据质量。

另外,用户可以自己设置自信区间,并用不同颜色标识。

SNP Detection SNP侦测
Sequencher拥有多项工具用于侦测DNA序列中的突变及SNP位点。Sequencher可以将一组序列进行序列比对,或者将一条或多条序列与参考序列进行比较。Sequencher的Call Secondary Peaks功能可用于分析序列中所有潜在的杂合子。识别杂合子的过程可以进行简便而严谨的控制。
.jpg)
在DNA组装的Overview中绘制所有潜在杂合子。
.jpg)
用户可以逐一浏览各个杂合子,只要在Bases view中点击空格。在一致序列下方可以看到翻译的一致蛋白序列及参考蛋白序列。参考序列用于确认用户序列的SNP位点数与DNA的组装相符。
.jpg)
Automated Analysis 自动化分析
Sequencher批量处理DNA序列的方式,是透明的,用户自定义的,并可收回的。并且Sequencher的这种自动化从不危害用户科学结论的有效性。 Sequencher总是在序列编辑中给用户最终的选择。
Sequencher始终保持两个拷贝的客户数据:编辑的数据及原始输入的数据。用户可以选择一个序列或选择一组序列撤消全部或部分的编辑。
Assemble by Name工具允许使用片段名称的一部分作为一个共享的标识符,或选择“assembly handle”进行操作。然后,Sequencher自动选择和名称相符的重叠群。 Sequencher甚至支持设立与单一ID匹配的表达规则!

当遇到大量样本进行多个测序,且测序引物为标准设置时,Assemble by Name是非常有用的工具。另外一些Assemble by Name的应用包括:
●MHC及线粒体基因测序用于鉴定及群体研究
●候选基因PCR产物分析
●保守序列分析用于物种分类学研究
●监测病毒基因组序列及相关抗病毒试剂和疫苗
Next-Generation Sequencing 新一代测序
如何在台式电脑上比对用户的新一代测序结果?选择Maq或者GSNAP算法作为比对算法,同时使用Sequencher的GUI用于保护用户的命令行。SNP分析(SNP analysis)或者甲基化分析(Methylation analysis)都只需要几步设置就能完成。在Maqview或Tablet中可以看到分析结果。Maq,GSNAP或者Tablet都只能在Sequencher中使用。在未来的几个月,Sequencher将增加更多的算法和工具来帮助科学家。

Maq Maq算法
Sequencher在 5.0版本中增加了Maq算法[1]。Maq算法可以用于新一代测序中单一结尾和配对结尾的序列比对。设计Maq本身是用于比对Illumina-Solexa的数据,事实上,Maq也可用于任何短片短的比对(63个碱基或更少)。参考的序列可以是FastA格式,或者GenBank文件格式。Maq使用二进制格式来压缩参考序列文件和需要比对的序列文件。Maq算法最大的优势在于只需要很小的内存在进行运算,这使得用台式电脑计算新一代测序变得很容易。

Maq使用命令行的方式来运算。Sequencher提供了直接和简单方法用来帮助客户使用命令行。用户可以以Maq自己的格式或者SAM格式来保存自己的结果,这样可以在Maqview或者Tablet里进行结果查看。
[1] Heng Li, Jue Ruan and Richard Durbin, Mapping short DNA sequencing reads and calling variants using mapping quality scores, Genome Research 2008 18:1851-1858
GSNAP GSNAP算法
Sequencher在 5.0版本中增加了GSNAP算法[1]。GSNAP算法可以用于比对Illumina-Solexa的数据或者Sanger法的FastQ数据。这一方法可以用于分析从非常短的序列(14碱基)到任意长的数据。GSNAP同样可以用于单一结尾和配对结尾的新一代测序数据比对。参考的序列可以是FastA格式,或者GenBank文件格式。GSNAP使用高效的方法来压缩参考序列文件并且提高程序速度,从而使得用台式电脑计算新一代测序变得很容易。

GSNAP使用命令行的方式来运算。Sequencher提供了直接和简单接口用来帮助客户使用命令行。用户可以以SAM格式来保存自己的结果,这样可以在Tablet里进行结果查看。
[1] Thomas D. Wu and Serban Nacu,Fast and SNP-tolerant detection of complex variants and splicing in short reads,Bioinformatics 2010 26: 873-881
SNP Analysis SNP分析
在上百万由新一代的测序结果中寻找潜在的SNP位点对于科学家来说是一个很大的挑战。Maq算法和GSNAP算法都可以用于SNP位点的筛选。
Maq[1]有2个程序用于最初的测序结果和参考序列之间的差异搜索。接下来通过过滤步骤进行进一步的搜索用来缩小候选位点范围。结果显示在一个综合的报告里,使用者也可以通过浏览Maqview或者Tablet来查看结果。

而GSNAP[2]则采用不同的方式来同时关注已经报道的SNP位点和新的可能的SNP位点。用户需要事先输入已知的SNP位点信息同时提供参考序列。GSNAP采用SNP-tolerant比对来阅读所有的显性和隐性等位基因。这样的算法可以用于区分错配和隐性等位基因。结果显示在一个综合的报告里,使用者也可以通过浏览Tablet来查看结果。
[1] Heng Li, Jue Ruan and Richard Durbin, Mapping short DNA sequencing reads and calling variants using mapping quality scores, Genome Research 2008 18:1851-1858
[2] Thomas D. Wu and Serban Nacu,Fast and SNP-tolerant detection of complex variants and splicing in short reads,Bioinformatics 2010 26: 873-881
Methylation Studies 甲基化研究
几十年来,科学家们认为DNA甲基化在基因表达中发挥重要作用。当亚硫酸氢钠处理DNA以后,所有的胞嘧啶都会转换为尿嘧啶,而甲基化的胞嘧啶不会发生变化。GSNAP[1]在阅读新一代测序结果时,在亚硫酸氢钠处理的序列中,暴露的没有甲基化的C都会转换为T,而甲基化的C则依旧被读成C,在未被亚硫酸氢钠处理的序列中,则所有的C依旧都会读作C。通过这样的对比,就能找到发生甲基化的位点。

[1] Thomas D. Wu and Serban Nacu,Fast and SNP-tolerant detection of complex variants and splicing in short reads,Bioinformatics 2010 26: 873-881
Viewers 浏览器
Tablet[1]作为一个高性能的浏览器可以用于浏览新一代测序比对结果:可以浏览和再次浏览Maq及GSNAP的装配结果,并有多种模式可以选择。Tablet从单个序列或者序列对获得信息,然后进行序列对装配。另外Tablet可以在浏览器中翻译DNA序列,放大缩小,高亮突变碱基。

Maqview专门用来Maq比对结果的浏览。Maqview可以浏览错配,碱基质量,序列阅读方向,轻松移动Maq比对的contig。Maqview对内存要求较低从而使台式机也能很容易的进行结果浏览。
[1] Ian Milne, Micha Bayer, Linda Cardle, Paul Shaw, Gordon Stephen, Frank Wright and David Marshall Tablet next generation sequence assembly visualization BioInformatics 2010 26: 40-402
General Analysis 常规分析
Sequencher的Reference Sequence有着强大的功能。将Variance Table和Reference Sequence一起使用可以方便的用于查找已知SNP位点,发现未知SNP位点。
从Sequencher的桌面直接选择Clustal可用于比对序列。当比对多个不同来源样本时,也可以用Assemble by Name功能来实现。
所有的工作都可以生成报告。从Variance Table生成的PDF格式的报告可用于科研数据的分享,实验记录以及大会报告。报告可以客至化工作空间,控制窗口位置,用标签区分序列和contig。用图标和高亮来标识序列区段。所有的客户设置可以保存成模板,在以后的使用用可以调用同样的标准程序进行分析。

Reference Alignment 参考比对
参考序列在测序和后续分析的许多方面都有很强大的用途。不论用于SNP寻找,法医学研究还是系统发生研究,或是医学遗传学和群体遗传学的研究都需要使用参考序列。
输入一个GenBank格式的序列及该序列的特征,然后可以把它标记成参考序列。根据参考序列进行装配是指将用户测序结果和参考序列进行比对。如果多个序列来自不同来源,可以用Assemble by Name来自动完成。

参考序列也可以帮助研究者舍弃超出研究范围的那些序列以及填补序列之间的gap。使用Variance Table和相应的报告可以获得可视化的结果。
The Variance Table 差异分析表
强大的SNP分析工具
目前有一种简单的方法来比较DNA序列或者contig序列,并且在很短的时间里找出序列间的差异。通过差异分析表可以对大量序列数据进行筛选然后可以快速将使用者最感兴趣的部分进行可视化。差异分析表的每个单元格都链接到它的原始数据,这样可以很容易的对每一个潜在差异位点进行验证或直接编辑,并可以自动进行序列和颜色信息的更新。一旦找到了所有的差异,Sequencher将提供多种输出格式和报告选项。在报告(Report)页面里有更详细的描述。
多重contig差异分析表
.jpg)
单个contig差异分析表

Translated Variance Table 翻译后的差异分析表
翻译后的差异分析表总结了选定样本的所有氨基酸差异。由于这个分析表与序列数据相关联,可以作为验证翻译成氨基酸后的测序结果中的突变位点及检查表达载体的理想工具。

差异分析表中和参考序列相符的情况用空白单元格标识,而翻译后的差异分析表中则用亮灰色表示。这样可以显示出在DNA水平某些编码具有差异但在氨基酸水平的序列是一致的结果。通过同时使用2种差异分析浏览模块,从而获得在DNA水平和蛋白水平都发生改变的序列信息。

Restriction Mapping 限制性内切酶标识序列图
Seequencher提供了丰富的工具用于DNA序列上限制性内切酶酶切位点的标识。可以随机筛选酶切位点,剔除某些位点以及测量序列长度。

用户还可以选择设置特异的载体和poly序列用于帮助克隆策略的选择。

Clustal 聚类分析
Clustal[1]是从Sequencher 4.9版本开始增加的模块,它是一种广泛使用的多序列比对程序,通过两两序列比对来构建聚类分析关系。
确定两两一组序列上的所有路线,然后构造一个近似的相似序列的聚类分组,然后终于为指导的dendogram执行对齐。您可以使用您的序列用Clustal对齐,直接从Sequencher项目窗口。从一系列参数选择来控制校准过程。可以直接从Sequencher的窗口中选择Clustal来进行操作,选择相应的参数来控制比对过程。

一旦比对结果生成,可以看到一个或多个contig然后进行进一步的分析。当进行多来源多序列比对时,可以使用Sequencher的Assemble by Name功能结合Clustal从而加速进行聚类分析。最终的数据结果输出格式可以是MSF,Phylip,NEXUS或者FastA等用户习惯的使用格式或者自己建立一个简单的输出格式。
[1] Chenna R, Sugawara H, Koike T, Lopez R, Gibson TJ, Higgins DG, Thompson JD (2003). "Multiple sequence alignment with the Clustal series of programs". Nucleic Acids Res 31 (13): 3497-3500
Customize your Workspace 客至化工作空间
用户可以自定义Sequencher默认工作窗口的基本设置,并保存所有的设置,包括参考序列,以及作为重复使用的模板,从而节省分析序列时所花的时间。

●用图标来高亮定义亚序列。
●保存用户设置规则。
●为客户工作风格选择最合适的布局并进行保存。
●客至化显示程序窗口。
![]()
![]()
Reports 输出报告
Sequencher的最新版输出报告可以进行打印,报告提供了分析工具的说明,比如说群体分析报告中会显示进行了聚类分析。
群体报告在差异分析表里是一个独特的数据汇总类型。每个群体报告包括2种类型表格:一个总表以及一个描述每一个类群的详细差异分析表。

在详细差异分析表里,提供了Sequencher所有可以提供的信息来支持差异分析表的数据。和单个差异分析报告一样,汇总表格里罗列了所有的样本差异。另外在详细的差异分析报告里,会有一个更详细的表格进行差异描述。这些描述包括:序列名称,物种,数据来源及差异信息。如果数据是可用的,在表格里还会包括具体的序列信息和相应的颜色标识。颜色标识包括了测序结果里的峰值信息和其他一些变异信息。

