甲木是什么意思| 属虎的和什么属相最配| 偏光是什么意思| 什么胆忠心| 回南天什么意思| 什么是荷尔蒙| 澳门回归是什么时候| 枸杞泡酒有什么作用和功效| 红霉素软膏和眼膏有什么区别| 脸部爱出油是什么原因| 手心脚心出汗什么原因| 六月六是什么节| 正山小种是什么茶| 咳嗽不能吃什么水果| 乙肝两对半定量是什么意思| 珀莱雅适合什么年龄| 尿频尿多是什么原因| 探病是什么意思| 脂肪肝挂什么科| 尿毒症什么症状| 中医四诊指的是什么| cac是什么意思| 什么是抽动症| 喝醋有什么好处和坏处| 泌乳素高是什么原因| 手机服务密码是什么| 苏州秋裤楼叫什么| 风景旧曾谙是什么意思| 耳朵发痒是什么原因| 聤耳是什么意思| 着凉拉肚子吃什么药| 白砂糖是什么糖| 小腿有血栓是什么症状| 准备好了吗时刻准备着是什么歌| 血离子是检查什么的| 怀孕是什么症状| 啮齿是什么意思| 孕妇放屁多是什么原因| 柠檬有什么作用| 慢性肠胃炎吃什么药| 绾色是什么颜色| 运动后出汗多是什么原因| 胆囊胆固醇结晶是什么| 去医院看乳房挂什么科| 小儿割包皮挂什么科| 吃竹笋有什么好处和坏处| 小孩肠胃感冒吃什么药| 荷叶有什么功效和作用| 忆字五行属什么| 入户口需要什么资料| 不能生育的女人有什么特征| 就请你给我多一点点时间是什么歌| 怀孕初期有什么表现| 腿有淤青是什么原因| 割包皮有什么好处和坏处| canon什么牌子| 什么是膝关节退行性变| 胸导联低电压什么意思| 淋巴转移什么意思| 卵巢早衰是什么引起的| 宫颈癌是什么| 胳膊肘疼痛是什么原因| 6月29号是什么星座| 突然勃不起来是什么原因造成的| 夏天脚出汗是什么原因| 喝什么茶可以降血脂| 梦见抓蛇是什么预兆| 隐翅虫咬了用什么药| 女生什么时候最想要| 胃镜挂什么科| 梦见喝水是什么意思| 白猫进家有什么预兆| 抗衰老吃什么| 男人吃什么容易生儿子| 憬五行属什么| 睡觉做梦多是什么原因| 汗水里面有什么成分| 夹层是什么意思| 糖尿病吃什么主食最好| peony是什么意思| 东成西就是什么生肖| 吃什么能减肥| 皮肤干燥缺什么维生素| 29是什么生肖| 以下是什么意思| 胃酸反流吃什么药| 臭氧是什么味道| opo是奶粉里的什么成分| 分野是什么意思| 清华大学前身叫什么| 盆腔肿物是什么意思| 5月3日什么星座| 视力sca分别代表什么| boys是什么意思| 刻骨铭心是什么意思| 吹空调流鼻涕吃什么药| 晕车喝什么| 男生什么情况想种草莓| 早起嘴苦是什么原因| 血脂低是什么原因| 胆结石吃什么药| 八月六号是什么星座| 蜈蚣最怕什么东西| 脾胃虚寒者有什么症状| 小学生什么时候放假| 肝实质弥漫性回声改变什么意思| 珉字五行属什么| 11月14日什么星座| as医学上是什么意思| 什么布料| 什么是中成药| 柔然人是现在的什么人| 头总出汗是什么原因| 上海有什么特色美食| 愚不可及是什么意思| 蒙圈什么意思| 健脾益气是什么意思| 如花似玉是什么生肖| 小孩流鼻血吃什么好| 踮脚有什么好处| cnn是什么意思| 12.28是什么星座| 燕窝是什么做的| 左侧小腹疼是什么原因| 梦见新坟墓是什么预兆| 梦到和别人打架是什么意思| 检查尿液能查出什么病| 普陀山求什么最灵| 心属于五行属什么| 脚转筋是什么原因| 二垒是什么意思| 女人取环什么时候最好| 甲亢的早期症状是什么| 肾病到什么程度腿会肿| 乌龟喜欢吃什么食物| 乙肝有抗体是显示什么结果| 7月7号是什么节日| 女人代谢慢吃什么效果最快| 名什么中外| 轻度强化是什么意思| 补肾壮阳吃什么| 口了又一是什么字| 鹅拉绿色粪便是什么病| 周星驰是什么星座| 舌头溃疡是什么原因造成的| 北京市长什么级别| 肝内高回声是什么意思| 鸡奸是什么意思| 枫叶是什么颜色的| 月出念什么| 怀孕两天会有什么反应| 怀孕初期需要注意什么| 儿童身高矮小挂什么科| 来福是什么意思| 潘多拉魔盒是什么意思| 低筋面粉是什么面粉| 碘过量会导致什么疾病| 农历七月初六是什么星座| 热脸贴冷屁股是什么意思| 腰酸是什么原因女性| 龟头上抹什么药能延时| 脚抽筋是什么原因引起的| 眼泪为什么是咸的| 下面外面瘙痒用什么药| 宫腔内囊性结构是什么意思| 无印良品属于什么档次| 智障什么意思| 洛阳有什么好吃的| 电波系是什么意思| 流产吃什么药可以堕胎| 闹心是什么意思啊| 头发拉焦了有什么补救| aaa是什么意思| 叉烧肉是什么肉| 儿保做些什么检查项目| 手指发麻是什么原因| 屁股下垂穿什么裤子| 胃酸是什么| 为什么会心肌梗死| 什么牌子的电动车好| 鞑虏是什么意思| 男人嘴角有痣代表什么| 补钙吃什么好| 结肠炎吃什么药效果最好| 怀孕一个月吃什么对宝宝发育好| 黑茶金花是什么菌| 婴儿便秘怎么办什么方法最有效| 经常的近义词是什么| 切除甲状腺有什么影响| 松脂是什么| 打蛇打七寸是什么意思| 为什么腋下会长小肉揪| 犹太人说什么语言| april什么意思| 珍珠婚是什么意思| 除湿是什么意思| 手莫名其妙的肿了因为什么| 牛子是什么意思| 猫什么时候打疫苗| 欺山莫欺水是什么意思| 小孩便秘吃什么药| 钼靶检查是什么意思| 蛇鼠一窝什么意思| 长疖子用什么药| 碧螺春是什么茶| 阴道痒用什么药| 电泳是什么| 脚后跟疼用什么药好| 吃柿子有什么好处和坏处| 经常熬夜喝什么汤好| 完全性右束支阻滞是什么意思| 3月26日是什么节日| 5月12号是什么星座| 阿弥陀佛什么意思| 固表是什么意思| 女人银屑病一般都长什么地方| 拉肚子挂什么科室| 四眼狗有什么迷信说法| 什么是短语| sample是什么意思| 4月什么星座| 银手镯为什么会变黑| 实名认证是什么意思| o型血和ab型血生的孩子是什么血型| 什么叫格局| 经期吃什么让血量增加| 太白金星叫什么| 玄关是什么| 宝鸡以前叫什么| 尿道感染流脓吃什么药| 腊肉配什么菜炒好吃| imax是什么意思| 胆囊切除有什么危害| 皿是什么意思| 一日三餐是什么意思| 伽马射线是什么| 梦见别人流血是什么预兆| 尿毒症的尿是什么颜色| sansay是什么牌子| 血热吃什么药可以凉血| 口腔溃疡挂什么科室| 什么叫扁平疣| 鱼油功效和作用是什么| 舌苔发白厚吃什么药| 17点到19点是什么时辰| 手上长毛是什么原因| 什么时候可以上环最好的| 失眠睡不着吃什么药好| 长期干咳无痰是什么原因引起的| 老是口腔溃疡是什么原因| 盗汗是什么原因造成的| 24号来月经什么时候是排卵期| 牙齿黄用什么牙膏| 什么什么相什么的成语| 吃什么补气血| 首肯是什么意思| 过氧化氢一个加号什么意思| 脾胃虚吃什么调理| 岑岑是什么意思| at什么意思| 坐飞机不能带什么物品| 1989是什么生肖| 肛裂用什么药膏| 类风湿关节炎吃什么药效果好| 百度
Edit this page on GitHub

 劳拉的欧派有香气?纵观TPS游戏21年兴衰!

百度 佛教史传典籍的编纂具有宗教性目的,就是要建立佛教的历史系谱,并试图利用中国既已成形的经典形式,来为自己的著作背书。

The Multiple Alignment Format, described by UCSC, stores a series of multiple alignments in a single file. Suitable for whole-genome to whole-genome alignments, metadata such as source chromosome, start position, size, and strand can be stored.

Biopython 1.69 includes a MAF reader and writer accessible via Bio.AlignIO, and an indexer accessible via Bio.AlignIO.MafIO.

All examples below make use of the Multiz 30-way alignment to mouse chromosome 10 available from UCSC.

Getting the AlignIO code from GitHub

If you can’t wait for Biopython 1.69 to be released, get the latest Biopython from GitHub:

First, clone the repository with git from the command line, like so:

git?clone git@github.com:biopython/biopython.git

This will give you the default master branch. Then install from source.

Reading in a MAF file

Parsing a MAF file is similar to any other alignment file in AlignIO. Additional data, however, is stored as a dict in the .annotations property of SeqRecords belonging to returned MultipleSeqAlignment objects.

Annotations available in SeqRecords

Key Type Value
start integer The start position in the source sequence of this alignment
size integer The ungapped length of this sequence
strand enum(“+”, “-“) The strand this sequence originates from on the source sequence/chromosome
srcSize integer The total length of the source sequence/chromosome

Example

from Bio import AlignIO

for multiple_alignment in AlignIO.parse("chr10.maf", "maf"):
    print("printing a new multiple alignment")

    for seqrec in multiple_alignment:
        print(
            "starts at %s on the %s strand of a sequence %s in length, and runs for %s bp"
            % (
                seqrec.annotations["start"],
                seqrec.annotations["strand"],
                seqrec.annotations["srcSize"],
                seqrec.annotations["size"],
            )
        )

MafIndex

Biopython may soon provide an interface for fast access to the multiple alignment of several sequences across an arbitrary interval: for example, chr10:25,079,604-25,243,324 in mm9. As MAF files are available for entire chromosomes, they can be indexed by chromosome position and accessed at random. This functionality would be available in the class Bio.AlignIO.MafIO.MafIndex.

Creating or loading a MAF index

Indexes are created by determining the chromosome start and end position for a specific sequence name (generally a species), which must appear in every alignment block in the file. An index can be generated for only one species at a time. In whole-genome alignments generated by Multiz, the chromosome of one species is generally used as the reference to which other species are aligned. This reference species will appear in every block, and should be used as the target_seqname parameter. For UCSC multiz files, the form of species.chromosome is used.

To index a MAF file, or load an existing index, create a new MafIO.MafIndex object. If the index database file sqlite_file does not exist, it will be created, otherwise it will be loaded.

# index mouse chr10 from UCSC and store it in a file for later use

from Bio.AlignIO import MafIO

# idx = MafIO.MafIndex(sqlite_file, maf_file, target_seqname)
idx = MafIO.MafIndex("chr10.mafindex", "chr10.maf", "mm9.chr10")

Retrieving alignments overlapping a given interval

The MafIO.MafIndex.search() generator function accepts a list of start and end positions, and yields MultipleSeqAlignment objects that overlap the given intervals. This is particularly useful for obtaining alignments over the multiple exons of a single transcript, eliminating the need to retrieve an entire locus.

# count the number of bases in danRer5 (Zebrafish) that align to the
# Pcmt1 locus in mouse

from Bio.AlignIO.MafIO import MafIndex

idx = MafIndex("chr10.mafindex", "chr10.maf", "mm9.chr10")
results = idx.search([7350034], [7383048])

total_bases = 0

for multiple_alignment in results:
    for seqrec in multiple_alignment:
        if seqrec.id.startswith("danRer5"):
            # don't count gaps as bases
            total_bases += len(str(seqrec.seq).replace("-", ""))

print("a total of %s bases align" % total_bases)

Retrieving a pre-spliced alignment over a given set of exons

The MafIO.MafIndex.get_spliced() function accepts a list of start and end positions representing exons, and returns a single MultipleSeqAlignment object of the in silico spliced transcript from the reference and all aligned sequences. If part of the sequence range is not found in a particular species in the alignment, dashes (“-“) are used to fill the gaps, or “N”s if the sequence is not present in the reference (target_seqname) sequence. If strand is opposite that in the reference sequence, all sequences in the returned alignment will be reverse complemented.

# convert the alignment for mouse Foxo3 (NM_019740) from MAF to FASTA

from Bio import AlignIO

idx = AlignIO.MafIO.MafIndex("chr10.mafindex", "chr10.maf", "mm9.chr10")

multiple_alignment = idx.get_spliced(
    [41905591, 41916271, 41994621, 41996331],
    [41906101, 41917707, 41995347, 41996548],
    strand="+",
)

AlignIO.write(multiple_alignment, "mm9_foxo3.fa", "fasta")
# find every gene on chr10 in the current UCSC refGene database,
# retrieve its spliced multiple alignment, and write it to
# a FASTA file in the current directory
#
# depends: MySQLdb

import MySQLdb
from Bio import AlignIO

# connect to UCSC's live MySQL database
mysql_conn = MySQLdb.connect(
    host="genome-mysql.cse.ucsc.edu", user="genome", passwd="", db="mm9"
)

db_conn = mysql_conn.cursor(MySQLdb.cursors.DictCursor)

# load MAF index
idx = AlignIO.MafIO.MafIndex("chr10.mafindex", "chr10.maf", "mm9.chr10")

# fetch all records on chr10
db_conn.execute("SELECT * FROM refGene WHERE chrom = 'chr10'")

for record in db_conn.fetchall():
    multiple_alignment = idx.get_spliced(
        map(int, record["exonStarts"].split(",")[:-1]),
        map(int, record["exonEnds"].split(",")[:-1]),
        strand=record["strand"],
    )

    print("writing %s.fa" % record["name"])

    AlignIO.write(multiple_alignment, "%s.fa" % record["name"], "fasta")

Format

track name=euArc visibility=pack
##maf version=1 scoring=tba.v8
# tba.v8 (((human chimp) baboon) (mouse rat))

a score=23262.0
s hg18.chr7    27578828 38 + 158545518 AAA-GGGAATGTTAACCAAATGA---ATTGTCTCTTACGGTG
s panTro1.chr6 28741140 38 + 161576975 AAA-GGGAATGTTAACCAAATGA---ATTGTCTCTTACGGTG
s baboon         116834 38 +   4622798 AAA-GGGAATGTTAACCAAATGA---GTTGTCTCTTATGGTG
s mm4.chr6     53215344 38 + 151104725 -AATGGGAATGTTAAGCAAACGA---ATTGTCTCTCAGTGTG
s rn3.chr4     81344243 40 + 187371129 -AA-GGGGATGCTAAGCCAATGAGTTGTTGTCTCTCAATGTG

a score=5062.0
s hg18.chr7    27699739 6 + 158545518 TAAAGA
s panTro1.chr6 28862317 6 + 161576975 TAAAGA
s baboon         241163 6 +   4622798 TAAAGA
s mm4.chr6     53303881 6 + 151104725 TAAAGA
s rn3.chr4     81444246 6 + 187371129 taagga

a score=6636.0
s hg18.chr7    27707221 13 + 158545518 gcagctgaaaaca
s panTro1.chr6 28869787 13 + 161576975 gcagctgaaaaca
s baboon         249182 13 +   4622798 gcagctgaaaaca
s mm4.chr6     53310102 13 + 151104725 ACAGCTGAAAATA
ct是什么 榴莲有什么营养价值 雷峰塔为什么叫雷峰塔 edp是什么意思 幽门螺旋杆菌的症状是什么
创伤弧菌用什么抗生素 斑秃去医院挂什么科 事宜是什么意思 一月来两次月经是什么原因 吃什么能减肥最快还能减全身
1988年什么命 四叶草是什么意思 农村适合养殖什么 巴马汤泡脚有什么功效 亚铁是什么
6月份能种什么菜 阳强易举是什么意思 为什么学习 吃洋葱有什么好处和坏处 突然流鼻血是什么征兆
梦见偷别人东西是什么意思xinjiangjialails.com 最贵的烟是什么hcv9jop3ns9r.cn 后背酸疼是什么原因hcv7jop6ns9r.cn 有什么好看的三级片hcv8jop7ns0r.cn 什么叫npchcv9jop3ns3r.cn
黄褐斑是什么样的图片bjcbxg.com 二甲双胍为什么晚上吃hcv8jop9ns9r.cn 三叉神经痛有什么症状hcv9jop1ns1r.cn 沙棘原浆有什么作用hcv7jop7ns2r.cn 黑胡椒和白胡椒有什么区别hcv9jop1ns4r.cn
生殖激素常规检查是查什么的hcv9jop4ns2r.cn 绿茶不能和什么一起吃hcv7jop7ns1r.cn 蜘蛛吃什么zhongyiyatai.com 刁子鱼是什么鱼hcv8jop6ns1r.cn 父母什么血型会溶血zsyouku.com
县纪委副书记什么级别dajiketang.com 左肾肾盂分离什么意思beikeqingting.com 二型血糖高吃什么药好fenrenren.com 茯茶是什么茶hcv9jop7ns3r.cn 三个羊念什么hcv9jop1ns2r.cn
百度