纽普生物

格式转换工具

文件格式转换

1. 选择输入文件的格式:

2. 选择输出文件的格式:

文件格式转换工具支持的格式

abi: 读取ABI “Sanger” 毛细管测序文件, 包括对碱基判定的PHRED质量得分,因此可以执行ABI 到 FASTQ 的格式转换.

abi-trim: 和“abi”一样,但是是经过Mott算法修剪过的序列.

ace: ace格式拼接结果文件

cif-atom: 根据原子坐标确定结构中出现的(部分)蛋白质序列

cif-seqres: 读取大分子晶体信息文件(mmCIF),确定蛋白质的完整序列

clustal: Clustal X 和 Clustal W软件的比对结果.

embl: EMBL平面文件格式

fasta: 一种基于文本的、用于表示核苷酸序列或氨基酸序列的格式。第一行是由大于号">"开头的任意文字说明,用于序列标记

fasta-2line: FASTA格式变体,没有换行,每条记录只有两行。.

fastq-sanger or fastq: FASTQ是一种存储了生物序列(通常是核酸序列)以及相应的质量评价的文本格式。FASTQ格式的序列一般都包含有四行,第一行由'@'开始,后面跟着序列的描述信息,这点跟FASTA格式是一样的。第二行是序列。第三行由'+'开始,后面也可以跟着序列的描述信息。第四行是第二行序列的质量评价(quality values,注:应该是测序的质量评价),字符数跟第二行的序列是相等的,用ACSII表示,转成数值时加33。

fastq-solexa: 原始的Solexa/Illumina风格的FASTQ文件,质量得分转数值时加64.

fastq-illumina: 早期的Solexa/Illumina风格的FASTQ文件,质量得分转数值时加64.

gck: 基因构建软件包(Gene Construction Kit)使用的原生格式

genbank or gb: Genbank文件

ig: IntelliGenetics文件格式, 与MASE比对格式一样.

imgt: EMBL纯文本文件格式的IMGT变体.

nexus: NEXUS对序列比对格式, 又称PAUP格式.

pdb-seqres: 读取Protein Data Bank (PDB)文件来确定蛋白的完整序列.

pdb-atom: 读取Protein Data Bank (PDB)文件来确定蛋白的部分序列..

phd: PHD文件从PHRED输出,可以作为PHRAP和CONSED的输入文件.

phylip: PHYLIP文件,如果名称超过10个字符,那么将会被截取.

pir: 美国国家生物医学研究基金会(NBRF)为蛋白质信息资源(PIR)数据库引入的 "类似FASTA "的格式,现在是UniProt的一部分。

seqxml: 简单的序列XML文件格式.

sff: 罗氏454和IonTorrent/IonProton测序仪产生的标准流程图格式(SFF)二进制文件。

sff-trim: Standard Flowgram Format applying the trimming listed in the file.

snapgene: SnapGene使用的原生格式。

stockholm: Stockholm比对格式,也被称为PFAM格式。

swiss: Swiss-Prot aka UniProt format.

tab: 简单的两列制表符分隔的序列文件,其中每一行都有一个记录的标识符和序列。例如,当Aligent的eArray软件将微阵列探针保存在一个最小的制表符分隔的文本文件中时,就会用到这个文件。

qual: Qual文件有点像FASTA文件,但不是序列,而是记录空格分隔的整数序列值作为PHRED质量分数。一对匹配的FASTA和QUAL文件经常被用来替代单个FASTQ文件。

uniprot-xml: UniProt XML格式

xdna: Christian Marck的DNA Strider和Serial Cloner使用的原生格式。