Entry information : MpRboh02 (Mapoly0258s0001)
Entry ID 7357
Creation 0000-00-00 (Christophe Dunand)
Last sequence changes 2017-11-29 (Christophe Dunand)
Sequence status complete
Reviewer Not yet reviewed
Last annotation changes 2018-04-24 (Christophe Dunand)
Peroxidase information: MpRboh02 (Mapoly0258s0001)
Name (synonym) MpRboh02 (Mapoly0258s0001)
Class Respiratory burst oxidase homolog    [Orthogroup: Rboh001]
Taxonomy Eukaryota Viridiplantae Streptophyta Marchantiaceae Marchantia
Organism Marchantia polymorpha    [TaxId: 3197 ]
Cellular localisation N/D
Tissue type Reproductive organs
Inducer N/D
Repressor N/D
Best BLASTp hits
Perox score E-value MpRboh02
start..stop
S start..stop
PtRboh03 1024 0 103..1023 32..948
PtRboh02 1019 0 103..1023 32..949
ThasRboh06 1017 0 105..1023 40..949
NbRboh01 1017 0 80..1023 9..962
Literature and cross-references MpRboh02 (Mapoly0258s0001)
Literature Yamato,K.T., et al., Gene organization of the liverwort Y chromosome reveals distinct sex chromosome evolution in a haploid system. Proc. Natl. Acad. Sci. U.S.A. 104 (15), 6472-6477 (2007).
EST ref. GenBank:   BJ858368.1 [5' end]   BJ871901.1 [3' end]   BJ862799.1 [Fragment]
Protein sequence: MpRboh02 (Mapoly0258s0001)
Sequence Properties
first value : protein
second value (mature protein)
Length (aa):   %s   1023
PWM (Da):   %s   114823.58 Transmb domain:   %s   o435-452i567-589o622-644i799-816o
PI (pH):   %s   9.53
Sequence
Send to BLAST
Send to Peroxiscan
.........1 .........2 .........3 .........4 .........5 .........6 .........7 .........8 .........9 .........0 .........1 .........2
MNRSGELPRS GPAEMPKAMK PALKGKPAFS GELNSSGEPA EPQKAPRAAK TTRFSGELSV VHSDGQHVVT VDPSTGNSPK SWTMNDIVRT ARNERQNEHL LGDQGDQMVE VMLDVNQNEV  TLRSVNPTPA SVITPMDAQI LVEGLERRPS MRNPMTLKQS ASRRVQAISQ ELKRLSRTGS RVLSVRFSPD FDPLVNDPNG NEPNIVKPAN LNPANPRLAR SASSAEHALQ GLRFINRATG  TADQQQQWEA VKTRFHKLKN ADGLLPKSQF ANCIEMKESK EFAGELFEAL TRRKGKKVEA ITEDDLYEYW VQISDQGFDS RMQIFFDLCD KNADGRISGA EVKEVIMLSA SANRLSKLQE  QAEEYAALIM EELDQENNGY IELWQLEALM RGPVGGFSRD AYLQYSQSLA PQRNKTRFQV LAGGTKYFFS DNWKRIWVIL VWLATMAGLF AWKFKQYEKR AAFEIMGYCL PTAKGAAETL  KLNMALILLP VCRNTITWLR STGLGIIVPF DDNLNFHKVI ASAIAVGVIV HGGVHLACDF PRIIAADNEL FERSVGNDFH HKQPDYLWFL TSIEGITGVI MVILMSISFT LATRWFRRSL  IKLPWPFQNM TGFNAFWYSH HLFAVVYVLL IIHGIFLILS HGFWKKTTWM YLCVPLVLYC GERTLRSLRA GQYKVTVVKA AIYPGNVLAL HFAKPPNFKY KSGMYMFLKC PEISPFEWHP  FSITSAPGDA YLSVHIRTLG DWTQALRNLF QEASGGKKRL QTVNNWGLSG ELVQNVSFPK VCIDGPYGAP AQDYRNYDVL LLVGLGIGAT PFISILKDML NHIKDDSVHH SMQSVASLTS  MGSDISIGES VGNSSMGSAS PFVEAGSKNS NGMPPASPAR KPRKHGTTNA YFYWVTREQG SFDWFRGVMK EVEEIDHKQV IEMHNYLTSV YEEGDARSAL IMMVQALHHA KNGVDFVSGT 
RARTHFARPN WKKVFSRLAA THKDKRVGVF YCGPSVLAKE LDHLAKRYTH KSSTRFEFHK ENF* 

Retrieve as FASTA  
Remarks Complete sequence from geneomic and 3 ESTs. Strain="E".
DNA
Send to BLAST
.........1 .........2 .........3 .........4 .........5 .........6 .........7 .........8 .........9 .........0 .........1 .........2
ATGAATCGAT CTGGGGAGCT GCCGAGGAGT GGCCCCGCAG AAATGCCGAA GGCGATGAAG CCAGCATTGA AAGGAAAACC AGCATTCTCA GGAGAGTTGA ACAGCTCAGG AGAGCCGGCA  GAACCCCAGA AGGCCCCGCG GGCTGCGAAG ACGACGAGAT TTTCTGGAGA GCTCAGTGTG GTGCACAGCG ACGGACAGCA CGTAGTTACA GTGGATCCCA GCACCGGGAA CTCGCCCAAG  TCCTGGACTA TGAACGACAT CGTGAGAACG GCGAGGAACG AGCGGCAAAA TGAGCATCTA TTAGGTGATC AAGGAGATCA AATGGTGGAA GTGATGCTGG ATGTGAACCA GAATGAGGTC  ACTTTACGCA GCGTGAATCC AACTCCGGCT TCTGTGATCA CTCCCATGGA CGCTCAGATA CTTGTAGAGG GTCTGGAGAG GAGGCCGAGC ATGAGGAATC CAATGACTTT GAAGCAGTCT  GCTTCCAGGC GAGTGCAAGC CATCTCGCAG GAGCTCAAGC GCTTGTCAAG GACTGGATCC CGCGTTTTGT CGGTGAGATT TTCTCCGGAC TTCGATCCTC TGGTAAATGA TCCCAACGGC  AACGAGCCGA ATATTGTGAA ACCGGCCAAC CTGAATCCCG CCAATCCTCG GCTAGCGAGG TCTGCGTCCT CTGCAGAGCA TGCCTTGCAA GGGCTGCGCT TCATCAACAG AGCCACCGGA  ACGGCTGACC AGCAGCAGCA GTGGGAGGCC GTAAAGACCC GTTTCCACAA ATTGAAGAAT GCTGACGGGC TGCTGCCCAA ATCGCAGTTC GCAAATTGCA TAGGTACTGT GTCCACCTTT  GGGTTTTCTC GCGCTACTTG AGGGATCAGT GTTGCATCTA GCCGCATGCA AGCCTGTCTG TAAACCTGAA AATGCTGATT TGCTGCCGAT TCTGAAACCG CGTCGCCCAT CTCTGTTTTG  CCTTCATGTG CCCAAAACTG GAGGAGTCAT TCTCACACAT ACATGGATGA TTGTGGACTG CAGAGATGAA AGAATCGAAA GAATTTGCTG GTGAGCTTTT CGAAGCTCTC ACACGTCGTA  AAGGCAAGAA GGTGGAGGCA ATTACTGAAG ACGACCTTTA CGAGTACTGG GTCCAGATTA GTGATCAGGG ATTCGATTCC AGGATGCAGA TCTTTTTTGA TCTGTAAGTA AAACCTTTGT  ATTGGGTTAC AACTCAACAC AGTTTCTCGA ATCTTCCATG AATAGAATTT CGGTGGGCGG CTTTTTCCAA GTCCTGATCT GAAATTGTGC ATGTTCAGGT GTGACAAGAA TGCAGATGGG  CGCATCTCTG GGGCGGAGGT GAAGGAGGTC ATCATGCTGA GTGCGTCGGC CAACAGACTC TCCAAACTCC AGGAGCAGGC AGAAGAGTAC GCCGCGTTGA TCATGGAAGA GCTCGACCAA  GAGAACAATG GGTACATTGA GGTGTGTTGA TAGAGAAATC AGTGCAAGCA TTATGAGTTA TGAATAATAG TTTCACGGAT CTGGAACTCT ATGCCCAGTA AATTTTGCTT TATGGTTTGT  TAATGCGAAT TGGGATGTGA ATATGCAGCT CTGGCAGCTC GAGGCCTTGA TGCGGGGACC GGTTGGAGGT TTTAGCAGAG ATGCGTACTT GCAGTACAGC CAGTCTTTGG CTCCACAGCG  GAACAAAACA AGATTCCAGG TTCTAGCTGG AGGGACGAAA TACTTTTTCA GTGACAATTG GAAGCGGATC TGGGTCATCC TTGTATGGCT AGCGACTATG GCTGGCCTTT TTGCTTGGAA  ATTTAAGCAA TACGAGAAAA GGGCTGCTTT TGAGATTATG GGCTATTGTT TACCTACTGC CAAGGGGGCC GCTGAGACTC TGAAACTCAA CATGGCGCTC ATCCTTCTTC CTGTGTGTCG  TAATACAATA ACTTGGTTGC GATCTACGGG CTTAGGGATA ATTGTCCCCT TCGACGATAA CCTCAATTTT CATAAGGTGA GCTTCTACCG CTTCAACACC AGTGCTTCAC ATTGCCAAAT  TACACGCATT TTGACGAAAA TTGAGCTGGC GCTCTTCATA TCATCAAACC TGTGTTAATG AGCAATGTAT TCATGCAGGT TATCGCTAGC GCTATTGCCG TCGGTGTCAT AGTTCACGGA  GGGGTCCATT TAGCCTGCGA TTTTCCGCGC ATAATTGCGG CCGATAACGA GCTCTTTGAA CGCAGCGTGG GAAACGACTT CCATCATAAG CAACCAGATT ACCTGTGGTT CTTGACGTCT  ATCGAGGGTA TTACCGGCGT CATTATGGTG ATTCTGATGT CGATATCTTT CACCCTGGCT ACCAGGTGGT TCAGGAGGAG TTTGATTAAG CTCCCCTGGC CGTTCCAGAA CATGACAGGA  TTCAATGCGT TTTGGTACAG CCACCACTTG TTCGCCGTGG TGTACGTACT GCTCATCATC CACGGAATCT TCCTCATCCT CAGCCATGGT TTCTGGAAGA AGACTGTAAG TTGTCATGTA  CTCTGCTGGC AAACCGATGC AACTGTTCCT ATATTCCTTT TTACCGGGAA GTTCTGTGGC TCTCATTCAC TAACAGCATC TCCATGTTTC CTCTTCAGAC ATGGATGTAC TTATGTGTGC  CACTGGTTCT GTACTGCGGT GAGCGAACAT TGCGATCCCT GCGAGCTGGA CAATACAAAG TGACCGTTGT GAAGGTACAT TCCTCAACTC CCGTTACATT CTCACTGAAA TGCAGAGTTT  CTGTTTCAGC TAGTCGATGT ACTTGTTTCA GACTCTTGCC TAATCCGGAA TGTTTCGCTT ATGGTAATGT AGGCTGCCAT ATATCCCGGA AATGTGCTGG CTCTTCATTT CGCGAAGCCC  CCTAACTTCA AGTACAAGAG CGGAATGTAC ATGTTCCTGA AGTGCCCCGA GATCTCTCCC TTCGAGTGGC ATCCTTTCTC GATCACTTCT GCACCAGGAG ATGCTTACTT GAGTGTCCAC  ATTCGAACCT TGGGTGACTG GACGCAGGCA TTGCGTAACC TCTTCCAAGA GGTGGGCGTT TCCTCCATCC AGAAATGCTT TCTCTTGCTT TCCCATCACA TCCGAGTGTC TTGGGCCCTA  GCACTTCAAA TTGGAGGCTT ATCTGAATTT TCGTCTGTAA CTGCAGGCAT CTGGTGGCAA GAAGAGGCTG CAAACCGTGA ATAACTGGGG TCTGAGCGGA GAGTTGGTGC AGAACGTCAG  GTAATGGCTA TTTTCACCTC GTTGGGTCTC GTTTAGAGTT GATTGGAGGT TGGAATTGTC CTCATCCGTT CACAGTCTGT TTCTGTTTCT GATGCTCGGT TGTGGACGAT TCCTTGCCTA  CAGCTTTCCG AAGGTCTGCA TCGATGGACC CTATGGGGCA CCCGCACAAG ACTACCGAAA TTATGACGTG CTACTCCTTG TCGGACTTGG CATAGGAGCA ACACCTTTTA TCAGTATTTT  GAAGGATATG CTTAACCACA TCAAAGACGT AAGTAGCTAC ACCGGTGCCA AATCGTTTCA AAGATTCTGT TCTTAGCTCG GTGGTCATTG GAGGTCAGGA AAAGTCGTCA CGAATGGAAT  TTTGTGGTCG TTTTCTGAAC GAAGTTGACG CTGTACGTGC AGGATTCCGT CCACCATTCG ATGCAGTCTG TTGCCTCTCT AACTTCAATG GGGTCGGACA TCTCGATCGG GGAGAGTGTA  GGAAACAGTT CTATGGGAAG TGCTTCTCCT TTCGTCGAGG CCGGAAGCAA AAACTCGAAC GGTATGCCTC CTGCCAGTCC AGCGAGGAAG CCGAGGAAGC ACGGAACCAC TAACGCATAC  TTTTACTGGG TAACTAGGGA ACAAGGCTCC TTCGACTGGT TCAGAGGAGT CATGAAGGAG GTCGAGGAGA TTGACCACAA GGTTGGTGAT CGTGGCCCAT GTTCCGTCAG AGCATTTAAC  TTGCTGCTTT CTGTCTCGAG CCACCTGTCG CGCCTTAGCT GTTGTCATAC GGGACTTGTT CTTAACGAGT TGAATGTTTG GCCTTGCAGC AAGTGATCGA GATGCACAAT TACTTGACAT  CGGTGTACGA GGAAGGAGAT GCCCGATCCG CCCTTATTAT GATGGTGCAA GCACTCCATC ATGCTAAGAA TGGAGTAGAC TTCGTGTCGG GCACCAGGGT AAGTCACTCC GGAGCCCAGA  CTCTGCCTGT CAGCTTTTCG CGGATGTTAG TTACTGCCTG TAGAAATATC GAATTAGAGT GTGCCGGAGA CTGACGCAAT CGATCGGATG CAGGCGCGTA CTCACTTCGC TCGGCCCAAC  TGGAAGAAGG TATTCTCAAG GCTGGCAGCG ACTCACAAGG ACAAGCGTGT TGGTGTTTTC TACTGCGGAC CGTCTGTGCT GGCGAAGGAG CTGGATCACC TGGCCAAGAG ATATACGCAC 
AAGTCGAGCA CTAGGTTTGA GTTCCACAAG GAAAACTTCT AG 

Retrieve as FASTA  
CDS
Send to BLAST
.........1 .........2 .........3 .........4 .........5 .........6 .........7 .........8 .........9 .........0 .........1 .........2
ATGAATCGAT CTGGGGAGCT GCCGAGGAGT GGCCCCGCAG AAATGCCGAA GGCGATGAAG CCAGCATTGA AAGGAAAACC AGCATTCTCA GGAGAGTTGA ACAGCTCAGG AGAGCCGGCA  GAACCCCAGA AGGCCCCGCG GGCTGCGAAG ACGACGAGAT TTTCTGGAGA GCTCAGTGTG GTGCACAGCG ACGGACAGCA CGTAGTTACA GTGGATCCCA GCACCGGGAA CTCGCCCAAG  TCCTGGACTA TGAACGACAT CGTGAGAACG GCGAGGAACG AGCGGCAAAA TGAGCATCTA TTAGGTGATC AAGGAGATCA AATGGTGGAA GTGATGCTGG ATGTGAACCA GAATGAGGTC  ACTTTACGCA GCGTGAATCC AACTCCGGCT TCTGTGATCA CTCCCATGGA CGCTCAGATA CTTGTAGAGG GTCTGGAGAG GAGGCCGAGC ATGAGGAATC CAATGACTTT GAAGCAGTCT  GCTTCCAGGC GAGTGCAAGC CATCTCGCAG GAGCTCAAGC GCTTGTCAAG GACTGGATCC CGCGTTTTGT CGGTGAGATT TTCTCCGGAC TTCGATCCTC TGGTAAATGA TCCCAACGGC  AACGAGCCGA ATATTGTGAA ACCGGCCAAC CTGAATCCCG CCAATCCTCG GCTAGCGAGG TCTGCGTCCT CTGCAGAGCA TGCCTTGCAA GGGCTGCGCT TCATCAACAG AGCCACCGGA  ACGGCTGACC AGCAGCAGCA GTGGGAGGCC GTAAAGACCC GTTTCCACAA ATTGAAGAAT GCTGACGGGC TGCTGCCCAA ATCGCAGTTC GCAAATTGCA TAGAGATGAA AGAATCGAAA  GAATTTGCTG GTGAGCTTTT CGAAGCTCTC ACACGTCGTA AAGGCAAGAA GGTGGAGGCA ATTACTGAAG ACGACCTTTA CGAGTACTGG GTCCAGATTA GTGATCAGGG ATTCGATTCC  AGGATGCAGA TCTTTTTTGA TCTGTGTGAC AAGAATGCAG ATGGGCGCAT CTCTGGGGCG GAGGTGAAGG AGGTCATCAT GCTGAGTGCG TCGGCCAACA GACTCTCCAA ACTCCAGGAG  CAGGCAGAAG AGTACGCCGC GTTGATCATG GAAGAGCTCG ACCAAGAGAA CAATGGGTAC ATTGAGCTCT GGCAGCTCGA GGCCTTGATG CGGGGACCGG TTGGAGGTTT TAGCAGAGAT  GCGTACTTGC AGTACAGCCA GTCTTTGGCT CCACAGCGGA ACAAAACAAG ATTCCAGGTT CTAGCTGGAG GGACGAAATA CTTTTTCAGT GACAATTGGA AGCGGATCTG GGTCATCCTT  GTATGGCTAG CGACTATGGC TGGCCTTTTT GCTTGGAAAT TTAAGCAATA CGAGAAAAGG GCTGCTTTTG AGATTATGGG CTATTGTTTA CCTACTGCCA AGGGGGCCGC TGAGACTCTG  AAACTCAACA TGGCGCTCAT CCTTCTTCCT GTGTGTCGTA ATACAATAAC TTGGTTGCGA TCTACGGGCT TAGGGATAAT TGTCCCCTTC GACGATAACC TCAATTTTCA TAAGGTTATC  GCTAGCGCTA TTGCCGTCGG TGTCATAGTT CACGGAGGGG TCCATTTAGC CTGCGATTTT CCGCGCATAA TTGCGGCCGA TAACGAGCTC TTTGAACGCA GCGTGGGAAA CGACTTCCAT  CATAAGCAAC CAGATTACCT GTGGTTCTTG ACGTCTATCG AGGGTATTAC CGGCGTCATT ATGGTGATTC TGATGTCGAT ATCTTTCACC CTGGCTACCA GGTGGTTCAG GAGGAGTTTG  ATTAAGCTCC CCTGGCCGTT CCAGAACATG ACAGGATTCA ATGCGTTTTG GTACAGCCAC CACTTGTTCG CCGTGGTGTA CGTACTGCTC ATCATCCACG GAATCTTCCT CATCCTCAGC  CATGGTTTCT GGAAGAAGAC TACATGGATG TACTTATGTG TGCCACTGGT TCTGTACTGC GGTGAGCGAA CATTGCGATC CCTGCGAGCT GGACAATACA AAGTGACCGT TGTGAAGGCT  GCCATATATC CCGGAAATGT GCTGGCTCTT CATTTCGCGA AGCCCCCTAA CTTCAAGTAC AAGAGCGGAA TGTACATGTT CCTGAAGTGC CCCGAGATCT CTCCCTTCGA GTGGCATCCT  TTCTCGATCA CTTCTGCACC AGGAGATGCT TACTTGAGTG TCCACATTCG AACCTTGGGT GACTGGACGC AGGCATTGCG TAACCTCTTC CAAGAGGCAT CTGGTGGCAA GAAGAGGCTG  CAAACCGTGA ATAACTGGGG TCTGAGCGGA GAGTTGGTGC AGAACGTCAG CTTTCCGAAG GTCTGCATCG ATGGACCCTA TGGGGCACCC GCACAAGACT ACCGAAATTA TGACGTGCTA  CTCCTTGTCG GACTTGGCAT AGGAGCAACA CCTTTTATCA GTATTTTGAA GGATATGCTT AACCACATCA AAGACGATTC CGTCCACCAT TCGATGCAGT CTGTTGCCTC TCTAACTTCA  ATGGGGTCGG ACATCTCGAT CGGGGAGAGT GTAGGAAACA GTTCTATGGG AAGTGCTTCT CCTTTCGTCG AGGCCGGAAG CAAAAACTCG AACGGTATGC CTCCTGCCAG TCCAGCGAGG  AAGCCGAGGA AGCACGGAAC CACTAACGCA TACTTTTACT GGGTAACTAG GGAACAAGGC TCCTTCGACT GGTTCAGAGG AGTCATGAAG GAGGTCGAGG AGATTGACCA CAAGCAAGTG  ATCGAGATGC ACAATTACTT GACATCGGTG TACGAGGAAG GAGATGCCCG ATCCGCCCTT ATTATGATGG TGCAAGCACT CCATCATGCT AAGAATGGAG TAGACTTCGT GTCGGGCACC  AGGGCGCGTA CTCACTTCGC TCGGCCCAAC TGGAAGAAGG TATTCTCAAG GCTGGCAGCG ACTCACAAGG ACAAGCGTGT TGGTGTTTTC TACTGCGGAC CGTCTGTGCT GGCGAAGGAG 
CTGGATCACC TGGCCAAGAG ATATACGCAC AAGTCGAGCA CTAGGTTTGA GTTCCACAAG GAAAACTTCT AG 

Retrieve as FASTA  
cDNA
Send to BLAST
.........1 .........2 .........3 .........4 .........5 .........6 .........7 .........8 .........9 .........0 .........1 .........2
CGTCGGCCGC AGGTTCGTAT TTTATCGGCC GATCTGGCCG GAGACCGATT CATCACATTG CATCAGCCAA AACGATTCTT CCTTGTTTCA TTTGGTTCTA GTTGTGGAGG AGGCCGGAGG  GTCGGGGAGC AGGAGGAGGA GGGAATCATC CAGATCAAGG CCCAGGTAGA AGAGGTCGAA GAGCCGCGAG AGTGAGAGAG ATTGAGATTG AGATTGTTGT TTGGCTGCTA CGACGACGAC  GACGACGACT GCCACTAGTT CTGGTGAATG AGCAGCCGCT GGCTGGTGCT TAAGGCGCTC GGCTAATGAA ATCAGGAGTG TAAGTGAGGG AGCTGGGAGA AAAGAAGACG GACAGAGATT  TACGACTGAT TGCGATTGTG AATCTGATTT GGGTTGAGGC TTGAGGCTTG GCGAGGCGAG GTGGAGGGGG GAGGAGGGTT GGGTTGAGAT CAGAGGGTTG GTGAGGCGAA GGCGAAAGCG  AGAGAGACGG AGAGAGCTTG CCGATGCGGG ATCAGCAGAG CGGCAGGAGA GGGTTGGCTG GGTCAGGGAG AGGCTAGAGT GGAGGCGGGG GAAGGGTGGA AAGGGAAGGA CAGCAGGGGG  ATGGACTGGG ATGGTCAAAT GGTGATGCCT TTGAGTTCGA GAAGAAACAT CAGCTGCTTT CTGAGTCCTG CCACCGGTCC GTGCACGATG ACTTTAGTCT GCTGAGACGG GGACGAGTTG  CGCTGTGGCC ACAGCAGCCC CGTGGTGAAA CGAAGTTGTT TGCCGCTGCC CTCACCTCGG GTTCCCTTCA AGTTCTTGCC GAAGGTCGCA GGGAACTTCG TCCCTGAGCG CAGGAACGGC  GAGCAGGAGT ACATTGGCAC ATAAATCCAC GTCCGCGAGT CCGCGATTCA CATGGGCTCG CACTCATCGC CTTCTGATTG AACCTCGGAA CGGAGATTCC CGTCTCTCGT TCTATTTGAC  AAAGCGGGGA GGAAGTACTG TCGATAGATA GACGTCTTCT CAGACAGGGG CACAGCCTCA CTCCGAACGT CCACTCTGCG AGTGGCTGCC ACCCAGTCTC TCTGTCACTT CTCTTTCTTC  ACCTGCTTGC GTTTTTCTCT CCCTTGCCGC CATTAATCTA CTACTATTCC TTTTCATCAG GAGATTAGGA GTCGAGCTTG TTGTAGGAAG TCCTTGTTTC CCTTTCCTTG AGTCTTTCTG  CGCTGCAGTA GTAACCCACA ACATATCTAT CGGCCTGTCT GCGATAAAGG CAGGCGAAGA AGAAGAAGAA GAAGAACAAA AGAGTTTGGT TTGTGGTTTG CCCACAGTTT TATATCTGGC  CAGTGACAGG CTGATCCATG TCCTGCGGGC GGGCGGTGGC ATCGGACGAC CAGATATGAG TGCCCCTCCC GAAGTTGTCA CTAAGGGATG ACGAAGGCCC CTGATAGCCT TCTGAAGACA  GCCGCGGGGG ATGCAGCAGG CCTGACATTT GGCCTTTAAT TCAGTAGGAC AATCAGTGGA CGAGGGAGAA TTCGATTGAT AGCGACGCGA AGCTAAGCAG GGTGTAGATT TTGCTGCATA  ATACATTAGA GACTTGCAGC TATAACGAAC TTGTTTCTAA ATTGAGGAGA TCGGACTGAC GTTGTCTGCT GCTGATCTCT CCGTGGACGC GTAGCTTTAG GAGCTACTGT AAGCTCGTCA  TGAATCGATC TGGGGAGCTG CCGAGGAGTG GCCCCGCAGA AATGCCGAAG GCGATGAAGC CAGCATTGAA AGGAAAACCA GCATTCTCAG GAGAGTTGAA CAGCTCAGGA GAGCCGGCAG  AACCCCAGAA GGCCCCGCGG GCTGCGAAGA CGACGAGATT TTCTGGAGAG CTCAGTGTGG TGCACAGCGA CGGACAGCAC GTAGTTACAG TGGATCCCAG CACCGGGAAC TCGCCCAAGT  CCTGGACTAT GAACGACATC GTGAGAACGG CGAGGAACGA GCGGCAAAAT GAGCATCTAT TAGGTGATCA AGGAGATCAA ATGGTGGAAG TGATGCTGGA TGTGAACCAG AATGAGGTCA  CTTTACGCAG CGTGAATCCA ACTCCGGCTT CTGTGATCAC TCCCATGGAC GCTCAGATAC TTGTAGAGGG TCTGGAGAGG AGGCCGAGCA TGAGGAATCC AATGACTTTG AAGCAGTCTG  CTTCCAGGCG AGTGCAAGCC ATCTCGCAGG AGCTCAAGCG CTTGTCAAGG ACTGGATCCC GCGTTTTGTC GGTGAGATTT TCTCCGGACT TCGATCCTCT GGTAAATGAT CCCAACGGCA  ACGAGCCGAA TATTGTGAAA CCGGCCAACC TGAATCCCGC CAATCCTCGG CTAGCGAGGT CTGCGTCCTC TGCAGAGCAT GCCTTGCAAG GGCTGCGCTT CATCAACAGA GCCACCGGAA  CGGCTGACCA GCAGCAGCAG TGGGAGGCCG TAAAGACCCG TTTCCACAAA TTGAAGAATG CTGACGGGCT GCTGCCCAAA TCGCAGTTCG CAAATTGCAT AGAGATGAAA GAATCGAAAG  AATTTGCTGG TGAGCTTTTC GAAGCTCTCA CACGTCGTAA AGGCAAGAAG GTGGAGGCAA TTACTGAAGA CGACCTTTAC GAGTACTGGG TCCAGATTAG TGATCAGGGA TTCGATTCCA  GGATGCAGAT CTTTTTTGAT CTGTGTGACA AGAATGCAGA TGGGCGCATC TCTGGGGCGG AGGTGAAGGA GGTCATCATG CTGAGTGCGT CGGCCAACAG ACTCTCCAAA CTCCAGGAGC  AGGCAGAAGA GTACGCCGCG TTGATCATGG AAGAGCTCGA CCAAGAGAAC AATGGGTACA TTGAGCTCTG GCAGCTCGAG GCCTTGATGC GGGGACCGGT TGGAGGTTTT AGCAGAGATG  CGTACTTGCA GTACAGCCAG TCTTTGGCTC CACAGCGGAA CAAAACAAGA TTCCAGGTTC TAGCTGGAGG GACGAAATAC TTTTTCAGTG ACAATTGGAA GCGGATCTGG GTCATCCTTG  TATGGCTAGC GACTATGGCT GGCCTTTTTG CTTGGAAATT TAAGCAATAC GAGAAAAGGG CTGCTTTTGA GATTATGGGC TATTGTTTAC CTACTGCCAA GGGGGCCGCT GAGACTCTGA  AACTCAACAT GGCGCTCATC CTTCTTCCTG TGTGTCGTAA TACAATAACT TGGTTGCGAT CTACGGGCTT AGGGATAATT GTCCCCTTCG ACGATAACCT CAATTTTCAT AAGGTTATCG  CTAGCGCTAT TGCCGTCGGT GTCATAGTTC ACGGAGGGGT CCATTTAGCC TGCGATTTTC CGCGCATAAT TGCGGCCGAT AACGAGCTCT TTGAACGCAG CGTGGGAAAC GACTTCCATC  ATAAGCAACC AGATTACCTG TGGTTCTTGA CGTCTATCGA GGGTATTACC GGCGTCATTA TGGTGATTCT GATGTCGATA TCTTTCACCC TGGCTACCAG GTGGTTCAGG AGGAGTTTGA  TTAAGCTCCC CTGGCCGTTC CAGAACATGA CAGGATTCAA TGCGTTTTGG TACAGCCACC ACTTGTTCGC CGTGGTGTAC GTACTGCTCA TCATCCACGG AATCTTCCTC ATCCTCAGCC  ATGGTTTCTG GAAGAAGACT ACATGGATGT ACTTATGTGT GCCACTGGTT CTGTACTGCG GTGAGCGAAC ATTGCGATCC CTGCGAGCTG GACAATACAA AGTGACCGTT GTGAAGGCTG  CCATATATCC CGGAAATGTG CTGGCTCTTC ATTTCGCGAA GCCCCCTAAC TTCAAGTACA AGAGCGGAAT GTACATGTTC CTGAAGTGCC CCGAGATCTC TCCCTTCGAG TGGCATCCTT  TCTCGATCAC TTCTGCACCA GGAGATGCTT ACTTGAGTGT CCACATTCGA ACCTTGGGTG ACTGGACGCA GGCATTGCGT AACCTCTTCC AAGAGGCATC TGGTGGCAAG AAGAGGCTGC  AAACCGTGAA TAACTGGGGT CTGAGCGGAG AGTTGGTGCA GAACGTCAGC TTTCCGAAGG TCTGCATCGA TGGACCCTAT GGGGCACCCG CACAAGACTA CCGAAATTAT GACGTGCTAC  TCCTTGTCGG ACTTGGCATA GGAGCAACAC CTTTTATCAG TATTTTGAAG GATATGCTTA ACCACATCAA AGACGATTCC GTCCACCATT CGATGCAGTC TGTTGCCTCT CTAACTTCAA  TGGGGTCGGA CATCTCGATC GGGGAGAGTG TAGGAAACAG TTCTATGGGA AGTGCTTCTC CTTTCGTCGA GGCCGGAAGC AAAAACTCGA ACGGTATGCC TCCTGCCAGT CCAGCGAGGA  AGCCGAGGAA GCACGGAACC ACTAACGCAT ACTTTTACTG GGTAACTAGG GAACAAGGCT CCTTCGACTG GTTCAGAGGA GTCATGAAGG AGGTCGAGGA GATTGACCAC AAGCAAGTGA  TCGAGATGCA CAATTACTTG ACATCGGTGT ACGAGGAAGG AGATGCCCGA TCCGCCCTTA TTATGATGGT GCAAGCACTC CATCATGCTA AGAATGGAGT AGACTTCGTG TCGGGCACCA  GGGCGCGTAC TCACTTCGCT CGGCCCAACT GGAAGAAGGT ATTCTCAAGG CTGGCAGCGA CTCACAAGGA CAAGCGTGTT GGTGTTTTCT ACTGCGGACC GTCTGTGCTG GCGAAGGAGC  TGGATCACCT GGCCAAGAGA TATACGCACA AGTCGAGCAC TAGGTTTGAG TTCCACAAGG AAAACTTCTA GCCAGGCAGG CACACAGAGG CAGAGCCAAG ATGACTGACG ACGAGGAGAT  TTTTCTGGAT ATAGCTTGAC AAGTGTAGAG GAACGACAAT GTAATCTATA ATCAATCTTT CAACCCCCAT CTCCTCCGCC CCTCCTTCCC CCGCCCCTGT ACAGTAAAGT AAGCTCTACG  GGTCCCTTGC TCGCCATTGT GAAGGGATCG GGACATTTTT TTAGTGTAGC ACAGTCTCTC TATCATCAAC ACACGCTAGT CAGTCGACTG GCTCGAATGC GACAGACATG TTGTAACAGG  TCGAGGTTAG CTTAACACAA GAGTTAGATT CAATTCTTCC GAGAGAGAGG AAATCTCGAG AAGGGAGCGC CAGCAGCAGC CTTGATTTTG AAGCAAGGGT ATATCTAGAA ATTAAGGATG  GGGATGCGCC TGATCTATCC TTGTCTGAGA CACATTCCAG GGAGTTCTTT ACGTGTAGAG TACAATTCTT TATGCTTGGT GGTGCACCAT CAAATATTCG ATTTGTTCGT CATGGAACCG  ATCAATCTCT CACATTTGAA ATAATTAGCC TTGGGCCAAC CAAGCAAGCT CCACCTCCAC GGAGATGACT AGTCCCCTCT CCATAAGACC GCGTGTGTAT GCCTGCTGCC GGCCAGTGGC 
CTGGGCCCTT CCTCATAATG GAATTTAAAC TTGGTA 

Retrieve as FASTA