文件格式转换工具支持的格式
abi: 读取ABI “Sanger” 毛细管测序文件, 包括对碱基判定的PHRED质量得分,因此可以执行ABI 到 FASTQ 的格式转换.
abi-trim: 和“abi”一样,但是是经过Mott算法修剪过的序列.
ace: ace格式拼接结果文件
cif-atom: 根据原子坐标确定结构中出现的(部分)蛋白质序列
cif-seqres: 读取大分子晶体信息文件(mmCIF),确定蛋白质的完整序列
clustal: Clustal X 和 Clustal W软件的比对结果.
embl: EMBL平面文件格式
fasta: 一种基于文本的、用于表示核苷酸序列或氨基酸序列的格式。第一行是由大于号">"开头的任意文字说明,用于序列标记
fasta-2line: FASTA格式变体,没有换行,每条记录只有两行。.
fastq-sanger or fastq: FASTQ是一种存储了生物序列(通常是核酸序列)以及相应的质量评价的文本格式。FASTQ格式的序列一般都包含有四行,第一行由'@'开始,后面跟着序列的描述信息,这点跟FASTA格式是一样的。第二行是序列。第三行由'+'开始,后面也可以跟着序列的描述信息。第四行是第二行序列的质量评价(quality values,注:应该是测序的质量评价),字符数跟第二行的序列是相等的,用ACSII表示,转成数值时加33。
fastq-solexa: 原始的Solexa/Illumina风格的FASTQ文件,质量得分转数值时加64.
fastq-illumina: 早期的Solexa/Illumina风格的FASTQ文件,质量得分转数值时加64.
gck: 基因构建软件包(Gene Construction Kit)使用的原生格式
genbank or gb: Genbank文件
ig: IntelliGenetics文件格式, 与MASE比对格式一样.
imgt: EMBL纯文本文件格式的IMGT变体.
nexus: NEXUS对序列比对格式, 又称PAUP格式.
pdb-seqres: 读取Protein Data Bank (PDB)文件来确定蛋白的完整序列.
pdb-atom: 读取Protein Data Bank (PDB)文件来确定蛋白的部分序列..
phd: PHD文件从PHRED输出,可以作为PHRAP和CONSED的输入文件.
phylip: PHYLIP文件,如果名称超过10个字符,那么将会被截取.
pir: 美国国家生物医学研究基金会(NBRF)为蛋白质信息资源(PIR)数据库引入的 "类似FASTA "的格式,现在是UniProt的一部分。
seqxml: 简单的序列XML文件格式.
sff: 罗氏454和IonTorrent/IonProton测序仪产生的标准流程图格式(SFF)二进制文件。
sff-trim: Standard Flowgram Format applying the trimming listed in the file.
snapgene: SnapGene使用的原生格式。
stockholm: Stockholm比对格式,也被称为PFAM格式。
swiss: Swiss-Prot aka UniProt format.
tab: 简单的两列制表符分隔的序列文件,其中每一行都有一个记录的标识符和序列。例如,当Aligent的eArray软件将微阵列探针保存在一个最小的制表符分隔的文本文件中时,就会用到这个文件。
qual: Qual文件有点像FASTA文件,但不是序列,而是记录空格分隔的整数序列值作为PHRED质量分数。一对匹配的FASTA和QUAL文件经常被用来替代单个FASTQ文件。
uniprot-xml: UniProt XML格式
xdna: Christian Marck的DNA Strider和Serial Cloner使用的原生格式。