Entry information : PtPrx[P]14
Entry ID 7953
Creation 2011-01-28 (Christophe Dunand)
Last sequence changes 2011-01-28 (Christophe Dunand)
Sequence status theoretical translation / pseudogene
Reviewer Catherine Mathe
Last annotation changes 2011-03-02 (Catherine Mathe)
Peroxidase information: PtPrx[P]14
Name PtPrx[P]14
Class Class III peroxidase     [Orthogroup: Prx014]*
Taxonomy Eukaryota Viridiplantae Streptophyta Salicaceae Populus
Organism Populus trichocarpa (Western balsam poplar)    [TaxId: 3694 ]
Cellular localisation N/D
Tissue type N/D
Inducer N/D
Repressor N/D
Best BLASTp hits
Perox score E-value PtPrx[P]14
start..stop
S start..stop
PtPrx14 328 1e-114 1..196 1..217
PtPrx46 310 6e-108 1..196 1..217
PtPrx76 282 1e-96 1..196 1..215
PtPrx47 267 8e-91 1..196 1..216
Literature and cross-references PtPrx[P]14
DNA ref. Phytozome 12:   scaffold_8 (1137784..1161269)
Protein sequence: PtPrx[P]14
Sequence Properties
first value : protein
second value (mature protein)
Length (aa):   %s   194 (170)
PWM (Da):   %s   20041.08 (17568.9) Transmb domain:   %s   i7-29o
PI (pH):   %s   8.5 (8.38) Peptide Signal:   %s   cut: 25 range:25-194
Sequence
Send to BLAST
Send to Peroxiscan
.........1 .........2 .........3 .........4 .........5 .........6 .........7 .........8 .........9 .........0 .........1 .........2
MAAKAGAAAS FMFMLFLLNI ACQAQLSTAL *SAIASDRRM AASLIRLHFH DCFVQHCDAS ILLSEKTALG NHNSARGYNE KxxxxTEVEK ICPRVVSCAD IIAVAARNAS AYVGGPSYAV 
MLGxRDSTTA SRTLANAELP AFFESLKSLI SR*xFQKKGL TARDIVALSG SHTLGQAQCF TFCERIYNHS NIDAGF 

Retrieve as FASTA  
Remarks Pseudogene from genomic (chromo 8). Frame shift, stop codon in frame and missing motifs.
DNA
Send to BLAST
.........1 .........2 .........3 .........4 .........5 .........6 .........7 .........8 .........9 .........0 .........1 .........2
ATGGCAGCAA AAGCAGGAGC AGCAGCTTCT TTCATGTTCA TGCTGTTCTT GCTGAACATA GCATGCCAAG CACAACTCTC CCTAAATTTT ACGACAGCTC TCTGAAGTGC AATTGCGAGC  GACAGGAGAA TGGCCGCGTC TCTCATCCGC TTACACTTTC ACGATTGCTT TGTCCAGGTA CTTTTTGCAA CCACTTTTGG CAGCCACATT TCTCCTCTCT GATTATGTAT TATCTTGGAG  CCAGTGTACT ACTTATGAGT TAATCATTGG TTTTGCACCA TTGTGATGCC TCGATCTTAC TAGAGTGAGA AGACTGCCCT CGGCAATCAT AACTCTGCTA GAGGTTATAA TGAAAAACnn  nnnnnnnnnA CTGAAGTTGA GAAGATCTGT CCTAGAGTAG TGTCTTGTGC AGATATCATT GCTGTTGCAG CCAGAAATGC ATCCGCTTAT GTTAGTATTG CAAGCTGCAA AATGAGGACT  TGTGATTTAT GATTCTTATG AAAAAATGCT TGAATATTCT CTTGATAAAT GTTCAAAAGG ATCAATATGT CTTGCATTGT AATTTGCGAG ACGAAATGTA TTCAGTACCA AAGCTTTATT  TTCCTGTTGA AGATGCCCGG TACATACGCG GAAATGAAAA TCTCAACGAG GAGGGAAAAT TGCATCAATA GGAAAAGAGC TCATCTGAAC AAAAAGGTCT TTGTTTTTAT TTTAATATAT  ATAAAAAAAG AAGAAGAAGA AGAAGAAAAG AAAGAAGGCT TGGTGATGCT GCTGGCACTT GCTCCAAATT AAAATACGGA GTTAGCTGCT TTTGCTTTTA TCCTTTTGTA CCAAAAAGAA  AAGGGAAAAG AAGGGAAAAG CGAAATATTT GATTTAATTA GCTGGTGCAA GTTTCTAAGG CCTAAATGGG AGAATAAACA AAGACCAGAC TACAATAATA AAAAAAAGAC CCTTCTATAG  TAATCGAGCA GAATTAATAT TTAAAACATC ACTATTACAA AGATGATGAC AGAATAAAAA GAAGGTTTAC AAGAGGCCAT CTAAAAAAAG GAGCAAGCAA ACAAACAAAA GACTAAACTA  ATTAGTCTAG TACTGTAGGA TATATTCAGG ATTTCTAACT AGATTATATC TTGTATAACT GAAATTTCTA ATTGAGAATT TTAACTACAA AGCCAAACAA TGTAAGATAA GATAAAAAAT  CATATCCCAG TAAGGAATAT TGGACTCGAA AATGAGCTGA TTGCGAGTTA ACCGAATAGA CCAATAAAAG CCTTTGCAAA GAAGATTAAG AACCCTACGC TGAAAGTTGT TTCTGACCAA  CTTGAACCAT TCCTAAAGAT TCTAATTAGG ATCCCTAGAT AGACAATTTA AACATTCGAA CCAATGCATG AATTTACCCC AAAAAAAATT CCAAATACTA GTACAATGAT GAAACAAATA  ATTAATAGTC TCGATCTTCT CATCACAAAA AAAACCAAAA AGGCATCTTT ATAATTTATA ATCCCCCCTC TCAGTTAAAA AAACTCGTAT TGAGATTACT ATTAAACAGG AGCCACATGA  ACATGTCGAT TTTTGAAGGT GCAAAACCTT TCCAAAGCAA AATGGAAAAA AAAAAGAAGC TCCTAACGCA GATAGGCTAT CTAAAAATTT GCAATTTGAA TATATTGAAT AAGTGCAACA  AGATGATCTA AGGTAGGACT TTAAGACAGG AAGCAAGGGA TTTCTATTCT CTTTTCCAGC AATATTTTGT ATTTATTTAG AACACAGAAA GTATGGGCTG TGTCATCTCC CTTACTCCTT  TCTGCTTTGG TGGAACAACT TGTGGACTCT ACTGTTATGT GTGGGTCATG CAGGGATGGA TCCAGACTTA GCAAAGTGGG GAGATAAAAT TGAGATAAAA TTGAGATACT CCAATGTCGA  AGCCCTTCCT ACAAATTAAC TTTGGCTCAA TAGATCTTGG CATCACTAAC TAGTACTCTC TCTGATTCTT ACCCCACATT GTACACAGAT TCTAACATGA CGACAACAAA CATTTCCCCA  TCTTCAATTG TTGTTGAAGT CCTAAGAGGT GATAACTATG ATGACTGGAG TGCCTGCATG AAAAGCTACA TGTTAGCTCA AGACCTTTGG GATTTTATTG AGCCTCCTGG TCTTCAAGAA  GGTGATCAAG AAGTTGACTC TAAGCCTATT GATCATCAAG AAGGTGACTC TAAGGCGTTG AGAAAAAAGA ATGCTGCAGC TTTACATGCA ATTCAAATTT CTTGCGCGCC ATACGTGCTT  TCAAAGATTA GGAGCATCAC TTCAGCCAAA GTTGCCTGGG ATACTCTAGC CAATTTGCAA CAACAACATT CACCTAGCCA CAAAGAGCAA TCTGATGAAG CTGAGCCATC AGAAGATGAT  GAGTCACAAG GTTCAGAGCA ATCTGTTGAA TCCGAGCCAG CAGAAGATGA TGAGTCACAA GGTTCGGTAT ACCATGACCT CATTCTCTTC CTTTGTTAGA TTTCCAATCA CTTCGATCTC  TTGATGTTAA CACGGGAGAG AATAAAAAAC TTGGCAGGAG CGGTGAGCAA TGAAATGAAT GGTCCCTTGC TAACCCTGTA CAAGTATGCC CATAATGGAG ACTGGGATGC CATAAAAACC  TATCTTAGCC GATACCCAAA TGCAAAAAAG GCCAAGATTA AACCCTATGG TAGAACTGCC CTTCATGTAG CAGCTTCTTC TGGAAATCTG AAAGTTGTGG AGGAGTTGGT GACGTTGATG  TCAGTAAATG AATTGGCAAT CAAAGATAAT GAAGGCAACA CAGCTCTTTC TATTGCTGCC ATTGTTGGAA TAAGAAAGAT GGCAGAATGT TTGGTGAGCA AGAACGAAAA CTTGGTTACC  TTCGCAAATA GATATCCAAA GATCCCACTA GTTGAGGCAT GTGTAGGAAG TCAAATGGAT ATGGTTCGTT ATCTATACTC TGTTACTCCA ATTGAATTTC TTTGTCGAGG CAATGTCGAC  CAAGGATCTC GCTTCCTAAA AAATGCTATT GGTGCTCAAA TGCTTGGTAA GAGACTTTAC CCATTAATTA CTCATTTTCC CTTTTTTGTC TATTTTTTTT CATTCTTTTT TCATGAATTT  TCCCTTTCGA GTATATTATT ATTTATTTCC CGTAATTTAA TAAAAATAAT TAATTACTAT GGTTTTAAGA AATATATGAA TAATCCTTTT GTTTTTAACT TAAAATCATT TTGTCAATTT  CATGTGATTT TTTAATTATT TCTTCTTCTT CTTCTTCTTC ATTTAAATAA TAGAAAAGGG AAGGAAAATC AGGTAAGAGG GGAAAAGAAG GCAATAATAA ATTGATACGA AACAAAATGA  CACTACCAGA AAATTGATAA ATACAAACGG AAATACCGAG GGAATATTTT CGTCGGTAAA TTTCCGAGGG ATTTTACCGA CGGAAATATT CCCTCGGTAT ATACCGAGGG AATTACCGTG  GGAAAAAAAA TTAAAACAAA GCAAAAAAAA ATAATGACGT GTCATTTTTA CCAACGGAAG TACCGACAGA ATAAATTCCG TCGGTGATTC CGTCGGTAAA TTTGTTGGTA AATTGTGAAC  ATTGTTCATC ATGTTAATTA CAAAGGGAAT CACCGACGGA ATATTCCGTC GGTATTTTCC AGAGAGTAAA TCACCAACGG ATTGAAAAGT CGTCGGTGTT ATTTGGCGGT TTTCTGAAAA  AATTCAATTA ATTTAAAATT TTCATTTAAA TATTACATAC GGAATCACCG ACGGATTGAA AAATCGTCGG TAATTTTTTG GCGGTTTCTG AATAAATTTT ACGAAATTGA AAATTTAAAT  TAAATATTAC CGATGGAATT ACCGACGAAA TAATTAAAAA ATATTAATAT TTAATTATCC GTCGGTAAAG CGTCCCAATA AAAAGCCTGA ATGCCCTTAT TTCACAAGAG ACAGACCCGT  TTCTTATTAT TATTCTTCTT TTTGTTGTTC TTGTACTTCT TCTTCTTCAC TATATGTAAA AAACATCATT AAGGTATGTC TTCTTCTTCT TCTTCAATTT ATGTAAAAAA CATCATTTCT  TATCTATTTC TTTCTCTTCT TTTCTCTCCT CATCTCCTTC TCTTTTCCTC CATGCTTGGG TATGTCTTCT TCTTCTTTCT TCTTTTATCC TCTTAGTTTT TTTTAATTAA TATGCTTAAT  GAAATTTTTT TTCTCTCTTT AGCTTCACTT GCAACTACAT TAAGGTAAGA TTTTTCTTTT TTCTTCTTTT TTCATGATTT TTTTCACTAT TTTTGTTCTT TATTTTATTT TTAATTGTTT  TTGTTCTTAA TAATTGTATA AATGTTGTTG TGAGATTTTT TTTTCATATG AGATCAATTT TTAGTAGATT TATTTATAAG ATTTTTAAAT TTTTAGCAAT TGCAACTTCA TTTTTTTCAT  ATGAATTTTT TTAGTTGAAT TTATTTTTTT ATTTTATTTA TTTTTTGCAA ATTTGTTTGA ATTGATTTTC TTATTCTTTT TTCCAAGCAT TTTGAGTATA TATTATACAG TGTTAATTTA  TGTTAATTTA ATTATTTTAT AATTTTATAA AATGAATTTT TTTTAAATAT TTTTCAATAA TTACCGACGG AACTTCCGTT GGTAATAAAA AAATTATTAT CGACGCGTCT GTTCCGTCAG  TAAATCCATC GGTAATTCTA TTACCAACGG ATTTACCGAC GAACAAAACA TTACCGACGA ATGATTCACC GACGGATCAT TTCCGTCTTT GATTCCGTCG GTAATATAAT TACCGATGGA  ATATGTGTCT TACACTGACG GAAAAATTTC ATCGGTAAAA CTGTTAAATC TTGTAGTGTG ACTTGTAATT TATTAACATT TCAAAACACT AAAACCTCTT TCTTGTTGCT TCTTATGCTG  TTTCTTTTTG CTATTGCAAT ACCAGATATT GCTCTTGATT TTCTCCATCG CTGCCCACGT TCTGCTACTA CAATGGATGA AGTTCTGAAG TCGAACGCTT TGTTTAATTT GTCTAAGATG  CCTCAAATAT TCCCAAGTGC AAGTCGACTT GCATTTTGGC AGCAATGGAT CTATTCATGT TAGTATCTCT TCCTTCGATT TTTCCTCCTC CCATTTCTCT TCATTTCCTC TGCCAATCTT  TTTTACGTAT ATCGTTCTAT ATGTTTTTGG AGATTACCAC ACCGTCACAA AGAAAGAAAG CAAGGTTCTA CATGATATAA TTTTTGTCAA TTGATATGAG TTATTTTGTA ATTTTTTACC  CATAGAAAAA TTGTAAATAT ATTTAGTTGG AAATAATTTT TGGTTTAAAT CAAAATTTAT TACAAAACTG AGTCAAAATT TTAATGTCAT CTAAAGTTTA GGGAAAAAAT AAAATTTAAT  TTACGAATTT CAACTTATAA TATATCTATT CTTTAAAATA ATTACTTTAA ATTATTTTTA TCAAACATAT TTCTAAAATA AAGTTATTTG AACCTTTTTT ATTTAAATGA TCTATAAAAA  AAAACTTTTT AAATTATGAT TCATGTTAAA AAAAAATCAT TTTTTTCATA TGTTATGATA GGCAAACTTG AAGTTATATT CACTAAGATT GACTTGATTC TAAAATCATG GCAGGTATTC  CCATGCAATC AATTTTTTTA TATATAAATG ATCTACAAAA AAACAACTTT TTAAATCATG ATTCATGTTA AAAAAATCAA TTTTTTCAAT AGTTATGTGA GGTAAACTCA AGTTATATTC  ACTAACATTG ACTTGATTCT AAAACCATGG CAGGTATTCC CATGCAATCA ATTGCTACAA CTGATGACAA TGTTCGTATT AATATGCCTG ATCAAAGCCT AAGTGAGTCG AAGAACATTA  TCCTCCAAGG TATTTGCACA AATCTCTCTC TGTTTTTGTT CCCTCTCCTT TAAAGGGGTA TGGCAAGCAC AGGACATATG TATAGAAGTC CAATTGGGCT GCATGGCCCT TCAAGATTGT  AAAAACTTTG GACAGTTTCT TGATATATTT ATTTCTATTT TCCAAAAATA TTAACTTTTT TGAACCCTAA TCCAAGTATC CGATCCCTTA TTCAATCCCA AATCCGATAA ATCTCATTTT  TAAAAAAAAT CATTACATTG AAAACTTAAT ACATGCAAGC TTGATTAGTA TACATGTATG CTGCTTGTGA TAGTTTCTGT AATTTGTTTT TGTCCAACTT TTCAGTGTCA AGCAAATTGC  GTGGGTTTGC AATAAATCTC CTCGCATTCT TAGGTAAGCA AAATATATCT GACATCGCTT AATTTCTATC ATCATTATCA TGGTTTTATC TGATCACTCT TTAATGGTTG ATCCAGGAAT  CAAGCAAATA TACGATTTGA AGAAGATCCA CATTTATTCA GATAAAATTC TACGGTGTAT GTGTGAGCAC ATATCAACTC TGGATTATGA GGAATACCTC AAGGCAGATG TAGATGGAGC  ATTCCACAGT GCTGTAGAGA ATGGCATGGT TGAGTTTATT ATTGAGGTGG TAAAAGCTTG TCCTCATGCA ATGATTAGTG TAGATGGCAA CGGAAGGAAC CTATTTATGT CCTCGATTGC  AAACAGGCAA GAAAAAGTGT TCAGCCTTTT CTATGGACTG GAAGCAGGCG GAGCAGAATT TGTTTCCATC GTATATGGAT CTGGAAATAC AATGTTACAT TTGGCAGCAA AACTATCACC  TCCTTCTCAA TTAGCTCGGA TCTCTGGTGC AGCTCTCCAG ATGCAGAGAG AACTACAATG GTACAAGGTG AGCTTTCTAC ACTCAACATC TTTTTTAAAA AATGATTGAA CCTGATTAAG  ACCTGATTGA TTTGAATTTA GGGTACCCAT TTACTCATTT TCATTGTTAT CCAAAAAGAA TTAATTCCAC TCGAATTCAA AAATCTTGAT GCAGGAAGTG GAAAGCATTG TGGATCCTAC  AGACAATGAT TATTATAACA AGGACAATCA GACACCCAGG GAATTATTTA CGTCTGACCA TAAGGACTTG GTAGTGAAAG GAGAGAAATG GATGAAACAA GCAGCAACTT CTTGTACAGT  TGTGGGTGCT CTCATCATTA CAATTATGTT TACTGTCGCA TTTACTGTTC CCGGCGGGAA CGTTCAAGAG ACCGGCTATC CGGTTTTTAA AGATGAGAAA TCTTTTACAG TATTTATAGT  AGCGGATGCA ATCTCTCTCT TTTCTTCATC AACATCAGTG TTGATGTTCT TAGGAATTCT TACGTCCCGA TACGCAGAGG AAGATTTCCT TAAATCCTTG CCCACTAAGT TAATCATCGG  CCTTTCCATG CTTTTCTTCT CTATTGCAGC CATGATGGTA ACCTTCTGTG CTGCTCTTAT AATTATGTTG GATGGGAGAT TGCAAGTTAT AATTCCAATT GTACTCCTTG CTACTATCCC  TGTAACTTTG TTCATGTTGC TGCAATTTCC CCTGCTAGTG GAGATTGGTG TATCCACATA TGGACCAGGA ATCTTCAACA GAAAAATGAA ACGCTGGTCA AAATCTTCAA CTGATAGACT  GTTAGAGGTT AACAGTTTAT TGTCCCAAAC TGTTTAGCAA TTCCTATTTC CCCGGGATGA GTTGTTTTCT GTTCCTCTTA GTCTGTTACC ACGTTTAGAG TATGTATAGC ATCTCTTTGT  AAAAGGCTAT ATTTCCAAGC CTGCTGTTTG TGATGAATAA ACAAGAGACT TCTCATTCAA GACTCTGTGT GATGTAGTTT CTTCTGAGTG TTTTTCTACA AATGGAAGGT TAACCAATTC  CTTCGTTCTC TCTGATCATG CATTTAACCA CAATTATCTT CTATTTCCAA GTCTTTGGGT GACATTAATA CTGCAATCTT TTCTACATTT CGGGCGAAAG TCATTACATG AAGAGCTGTT  CCACCAAAAG GAGTAGTTTT CGCATTTGTT GCATCCTGAT GGTTGTCGTA ACCTAAATTT TAACCTTTTT ATTTTAATTA TTATTATCAT TATTATTATT ATTATTATTA TTATTATTAT  TATTTTATTT ACTGAAAAAT GATAATAAAA AAAATGAATG AAAAATAATG ATGAAAAACA AATAAAAAAT GAAATAAATG TAGAATGAAT TAAAGCTTGG CTTAAGGACA ACATGATTGG  AAGCTTAGAG ATTTAATTAA ACTCTTGAGT AGTTTAATTA ATTAAATTAA GGGTTTAGAT TGAGAATTGG TAAGTTTTTA GACTTAATTG AACTTGAAAT TAATTTATTC AAGGACTTAA  TTGAATAAAT ATCAAATTTT TAGGTTTAAT TGGGGTCAAA ATTGAAAAAA TTAAAATCCA AGGACTAGCT TGAAAATGGG ACGGAAACGC AATGGTCCAA TTACAGTTTA ACCAGGGGCT  TAATTATAAA ACTTTCATAA CTTCACGGGT CAAAACGATG GCCATTTTAT ATCTCAAACC GGCACTGTTT GGAAAAACGC TATTTATTTT CTTCTCCTTT AACCAGAGAC CGTTTTCAGC  AGTAAAGGCT GAGAAACGTT GCAGCAGTAA TCATCCATTT GCTTCAGTTA TGGATGTTTT AATGGTTGTC GTCCCTCTGC ATACCGTCCG TTACCACCGT TCAGGCTCTA TGAAAACAGA  GGAACAACGA AGAAAAAGCA GGCAAAAAAC CCAGGGAGAG AGGAACGAGA ACCAGAGAAA AAAACACAAG AGACGAACCA AAAAAAGAAA AACACAGAAA GAGAAGGTAA AATCAAGTAG  CAACACAGAG AGGAGTATTG GTTTTTCCAT TGCATTTATT GCATCCGGAT GATGGTTAAG AAATCTTTTC GTGGCATCCC AATTCCCTTC ATGTGCATGC TTATTAATTT CAGGCCATTG  AGTATATTCG TTCTGAATGA GTCCTGCCAG AGTCATGCTA TCATTTTAAG AGAAGAAACA GCGTGGGCAT GATTTTCATT AAAATCATCT GTAGTCTTAG TTATGTTTCA AAAGAAATTG  AAAGGGCTAA AGGTGTTTGG AGGCTCAACA ACAGGCGCAG CCGCATTGGT GTCTGCTAGA ACAGCTTCTT GATCACCAGA AGCGTTTTGC TTGGCCCAGG ACACTTGCAT GATGTCTTGG  CTTTTTACAG TTTTCTTAAT AAAAACTGCT CTCTTGTTTT TATCAAAAAA ATTTAGATTT CTATCAGAAA GAGGTACAGA GTGCACCTCC TCTAATAATA AACAAAGACC TCCTTGCATG  GAGGGCGACT AGGGCATTCT ATACATTAAC CCAGCCATTG TTAATTTTGT TGGCATCAAG CTGGAACATC GACCAGCATG GGCATTTTCA AGCCCATTCT AGATGATTTC TGGAAAATTC  CCTATAGAAG GGAAAGGAAG AAGCAGCTTG ATCTAGTTTG TTGCTCTTTA CATGAACTGC CACCACACCA TGTAAGTATT TCATGGGGTC TTCTTGTTGC TCTATTTTCT AGCTTTCATC  CAATGATATC TTGGTTCTTG GCTTTCCATT TTTTTTCCCC ACTCTTTAAT AATGCAATGA GTTGCGTGAA GTAAGTTCAA CGTCCTGAAA AAGATTTACG TGGCATAAAG ATCTTACCAC  TAATTGAAAA TAATGGAAAT ATTCGTGCAT CGATTATTTA CTTATTTATT GAAAATGATG GAAAAGAACG CAAAAAACAC CAATTTCATA CTTCCAAAAC CACATTATGA AATACACTCT  AACGTGATCC AGTTAAGTAG CCCATCAATC TTGTATTGAA AAGGTTAGAT CGAGTATTAC TTCTTTTTTA ATGCCAATTA GCCGGCGAGC AGCTGCGTTT ACGTTTGCTT GTGATTTTGC  CATGAATTAA GGTTAGAGCA AGTATTACTT CTTTTTCATG TTTTGTTCAT AAGCCTTCCC TTTCTTTAAT TCCTCATCTC TTGTAAATTG GTGCTCGAAG ACACTAAAAC CTCATCTTTT  TTGTTGCTGA TTGTGCCTTT TTCTTTTGGC TATTGCAATA CCAGATATTG CCTTTGATTT TCTGCATCGC TTCCCAAATT TGGCTACGAC ATTGGATGGA GTTCTGAAGT CGGACGCTTT  GTTTGGTTTG TCTCTCCTGC CTCGAATATT TCCCAGTGAC GGTCTACTTG CATTTTGGAA GCAATGGATT TTATTCATGT TAGTGTCTCT TCCCTCCATT TTTCCTCCTC AAACTTCTCT  TTATTTCCTG TATTCAAAAC GTATAATGTT CTATATGTTG GAGATTAACA CATCATTATT TATATACATT TTAAAGAGAG AAACAAGTCA TTTAATTAAC CCCTTCTCCG TCACAGATTG  GATATTATTT TTTACCAATA AGAAAATAGA ACATGTAGAC CTTCAACATG TATTTTTCCA TAAAAAGATT TTCAAAAAAC TTATGCACGT GTTTAATTAA ATAAATCAAA AATTATTTAT  TTAAATAAAA AAATTATTAA TAATAAATAA AATTAAAATT AAAAAATTAA GAAACATATG TAGATCAAGA TATTTAATAT TGCAATACAT GTCATTTAAC CGTTTGTGTT TAATGAATTT  GTTTTATTAA AATTAATTTT TTTATTAAAT CAAATGATAA TAGAAGCCGA CACACATAAA ATTAATTGAA TAAAAAAATA ATATGAATGG CTGCACATAT TAGAAATATT ATCATAAAAT  AAATATTTTT ATTTTAAAAA ATATATTTAA TCTATATAAA ATGAAAAAAG AAAAAAAAAC CTATAGCCTT TTTTTATGAA GAATTTATAT GTGGTGCGTC AATCTTATAT TGTGTATAAA  TAGATTATAT ATATGCAAAA AGAAGATCAA ATCCGATATC TTTTAAAGGT TGAAGCAATG CTTTAGTGGT TAAGACAAAA TTAAACTGAA TTTATATGAT GAATAGTACC ATTCAATAAA  TAAAAAAAGA AAATGTGTGT TGCATGTGTT AAATTTTATG AGTTGAATAT GTAAGGAAAC AAGAAGTAAT TTAGTATAAG AGGGATACGA TTTTCGACTT TGACTCTCTT AACTCTAAAA  GACATAAATT TTAATTAAAA AAAGGGTGGT TGATTGATGG AAAAAAATGT TTTAACTTTT TTAAAAAAAA ACCGAAACCG AACCGAAACA GGTTCAAACA AACCGGTTTC GGTTCGGTTC  GATTCGTTTT TTTGACAAAA ACCGGTTTAA ACCGGTTTGA CTCGGTTTTT TCCGGTTTGG TTCGGTTTTT TTCTGGTTGG GTTCAGTTCG GTTTTTTTTG TTTCAGACTT ACAAAACCGA  AACCGAACCA AACCGGTTGA TTTTTTTAAA ATTTTAATTA ATTTTTTTCA CGATTCAATT TTTTTAATTA TTTTTTTTAA TTTTTTTAAT TTAATCAATT TTTTGATTTT TTTCTCACCC  TCCTGCAATC TTTTCTACAG CCTCTGCATT TCGGGCGAAA GTCTTTACAT GAAGAGCTGC TCCACCAAAA GGAGTAGTTT TCTTTACTCG AAAAACTAGT TTTGGACCAT ATTCTGCAAA  ATTGATTGGA CCTTTATTGC AAATAATTTT ATTTTTTATA TATAGTATCA AACCAATTCT AATTACATAA ATTCATACTT AATTTAACAA AACTCAACTA AATTCCTCAA TTTTTTTACA  AACCCAAAAA ATTAATGCAA AGTGGAGTCC ATCACATCTG AACCTAATTC GTAGTATTAT TTTCACATGA AACAACCTTA ATAGTTTAAA TTCATAGTTA ATTTAATACA ATTTAACCAA  ACCATAATGT ATTGCAATAT TTCATCAATT TTTAGAGAGA AAGGGGCTGT AACTGCAGGG GGAATAAACA TATCACAACC GTGACATACT ATTTCATCAG TTTTTTAAAT TATAATAATA  AATAATAATA ATAAATAATT TCCAGCAGTC ACCCGTCCGT AGATGTCCTT TGACCTTAAA TGTTGAATTA TTAGTTACGG CATTTATGGA TGACAACAAG GTGAAATGAA AGGCTGAGAG  TGCTGGACAC TTGATAGTCT TTTAGGTGAA GTGAAAGGCT GAGAGTGCTG GACACTTGAT AGTCTTTGTG CATTTATGGA TGACAACGAG GTGAAGTGAA AGGCTGAGAG TGCTGGACAC  TTGATAGTCT TTTATGTGAA GAACAAACCA GATCTGAGGC TAACCTTGAT GATACTCATA GATTAGTCAA TGAACATATA ACTTCATTTC TTTACTCACC AATGTCGAAG CCCTTCCCAC  AAACTTTGGC TCAATAGATC TTGGCATATG TTGACAGCGC TGCAAACCCT CCTTATCTGC CCGGCAGATC CAGTGAGAAG TCCTATATCT CCCATTTTGA TCATGGCAGA TCCAAAATCT  GATTTGAATC TTGCAGGGTT CCTGCTGTAT TCAGAGACAA TGCTGTCAGA GAAAAAATGT CGAGATCTAA TTAATAATTG ATTAAATAAA TGAAGCTGAT CAACTGGGGA TTTACTAGCT  GGTAAGGGAA TAAACAAAGA CCCGACGATA ATAATAAAAG AAGAAGCAAT CACTTGCCAT ATGTTAAAAG AGAATGGAAG TTAGTTAGCT TTGAGGCTAA CTATATAATT AGCACCAAGC  AACATACCAA GAACAACAAC ATACCTTTAC TCAAGTTCTT GCCATCGCTC AGACATTCTC AGCAGTCTTA TCAAGCTCGG GAGAGAGAAG TAAGTGAATT ATAAGTAGCA CTGTGAGCTG  CTACCACACA CCATGTAAGT ACTTCGTTGG ATCTTATTGT TTCTCTCTTT TCTTGCTTTC ATCCAATGAT ATCTTGGTTC TTGGCTTTCC ATTTTTTTGC CCCACTCTTT AATAATGCAG  TGAGTTGCAT GAAGCAAATT GATTTCTATT CTCTGTTCCA GCAATATTTT GTATTTATGT AGAAGACAGA AAGTATGGAA TGTGTCATCT CCCTTATCCC TTTCTTCTTT GGTGGAACAA  CTTGTGGACT CTACTGTTAT GTGCGGGTCA TGCAGGGATG GATCCAGACT TAGCAAAGTG GGTTTTAAGT TACCTGGTTC ATGTAGTCTA AACCTGATTG GATCAACAAG AAGGAAATTT  TTCTTAAACT TATAGTGATC TAATAACTCA TTCATGACTG TTTTTATGGC AGTTATCGGG TTGAGTCTCA CAACTGTTAC CCTGGCCACC CACTAAATTC AACCATAGGT TAGGATCATG  TACGGTTTAA AAGGAAGTCA ACTCTTCTTG CATCTTAACT TGGGTTCTCC TTTAAAGACA GGTTTTTTTT TTTTTTAATC TTACGAATCA AGAAAATTGC TCTGGTGAAT AAAACCCTGA  CACACTAATA GAAGGATAAA ACAAATGACC CCCTAAAAAA AAGAACCAGA TCTGAGGCTA ACCCTGATGC TACTCATAGA TTAGTCAATG AACATATAAC TTCCTTTCTT TACTCACCAA  TGTCGAAGCC CTTCCCACAA ATTTTGGCTC AATAGATCTT GGCATCACCA GTAGTTTCTC TGATTCTTAC CCCACATTGT ACACAGATTC TTACATGACG ACAACAAACA TTTCCCCATC  TTCAATTGTT GTTGAAGTCC TAAGAGATGA TAACTATGAT GATTGGAGTG CCTGCATGAA AAGCTACATG TTAGCTCAAG ACCTTTGGGA TTTTATTGAG CCTGCTGGTC ATCATGAAGG  TGATCAAGAA GTTGACTCTA AGCCTATTGA TCATCAAGAA GGTGACTCTA AGGCGTTGAG AAAAAAGAAT GCTGCAGCTT TACATGCAAT TCAAATTTCT TGTGCACCAC ATATACTTTC  CAAGATTAGG AGCATCACTT CAGCAAAAAA TGCCTGGGAT ACTTTGGCAA ATATGCAAAA ATTGCAAGTA AGAACAGCTG ATACACCACA ATTATCAAGA ATGAACGCGG GTAATACATC  CATCATCTCT TACCCTCTCT AAGACGCAAG CACAGCTTGC AAAATAATGC TGTTTTTTTC CTAACAGAGA AGGCATGACT TTCGCAGGAC TCGATAGATG GCGTGAACTA TATAAGCATG  CCCATGAAGG TAATTGGGAA GGCACAAAAA GATTTCTTGA CCTTCATCCG GAAGCAAAAA ATGTGAAGAT TACACCCTTT GGTGAAACAG CTCTTCATGT AGCGATTGTG GCTGGGAATG  TGAAACTTGT GGAAAAGCTG GTAGAGCTAA TGTCACCTGA AGACTTGGAA ATAGTAGAAC AAGCTGGTTG CTCAGCACTT TCTTATGCTG CTATGCAAGG AATCACAAAG ATGGCCAAAT  GCATGATCAT AAAGAACAAA AAATTGGTTA ACCTTCCGAT CGAATGGAGG AGGACGTATC CCAGTTGTGG TGTCTTGTTT GGGAAATCAT AAGGAAATGA CCCATTATCT TTACTCTGTC  ACTCCAGCTG AACTGCTATA TGAGGACAAC GGTAACCATG GATCATTGCT CCTCCAATTG TCTATAGCAT CCGAAATGTT TGGTAAGAGA CATACTCATG CAAGCACAAT GAATTAGCCC  CAACATTCTT GTTGATACTT GTTTGTTGCT TTTGAAATGC TAAAATACCA GATATTGCTT TGGATCTGCT TCAACTTTTT CCTAGTTTGG CTACCGCGTT GGATAAAATT TGGAAGCTTA  ATGCTGTGAC GCAATTGTCT CTCTTGCCCG ATAGATTCCA TAGTGGAAGT CGCCTTGCAT TTTGGCAACG TTGGATCTAT TCCTGTTAGT ATTACTTTCT CTGATTTTCA TCCTCAGAGC  CTCTTCCTCC ACACACGTCG CACGTTTGAA AATTCAGGAG GAATTTGTTG TTTGTGGAAT ACTTATGGAG ATGGAATTTG CATCATTTTT GGATAATTAT ATAATAAGTT ATATATATAA  AATAAGTTCA CAACTCATGA AAGCTTTTTC ATTGAAAGGT ATAAACATTG GTCCACCCAT TCCCTTCAGT GATCAAATGC TACAAGGTAC AATCTCTTCA TCATTATTTG ATACAAGACT  AATTTTTGTT TTGATTACTA TACGGGCTAT CTAATGCAAG ATTAATTTTT CTTTTGCAGC TTCGAGTAGA CCGCGGAAAG AAGTTATAAA GCTCCTCAAA TTCCTAGGTA TTTTATATGT  GGCTATATAC ATAACCGGAT GATTTTGTTG TTATCATCAC TAGTATCATG TTATTAATCT GATAATTCTT TCCTCACCCA GGCATAAAGC AAATATATGA TGTGAAGCTG AATCATATCT  ACTCTGATGA ACTTCTACGT CGAATGGTTA AACATATATC AACATTGGAT TTCGAAAAAT ACGATGAATG CGGGTTATTC AGAGCATTTA ACAACGCTGT TAAGAATGGT ATAGTTGAGA  TGATTGTCGA GATGGTTAAA GTTTGTCCTA ATCTAATGCA CACTTTCGAC AAGAATGGCA GAGTTTTCTT GATGTCTTCA GTTGCACACA GACAAGAGAA GATTTTTAGC CTTTTTTATG  GGCTTGAAGG AAGGAACGGA AATTTCCTTT CTGTGACAGA TGTTTTTGAT AATACTATGT TACACTGCGC AGGAGAGTTA TCACCTTCTA CTCAGTTGGC TCGAATCTCA GGTGCAGCTC  TTCAAATGCA GAGAGAACTT CAATGGTACA GAGTAAGTTT CTCAAGCATC AACTTTTTGT TACGCTAATC TGACTGATAT GGGGTTTATA GTCGCTCTGC CTGAAAAAAA TTGTAGTCTT  TCTTATGAAC TGGTCAACAC TAGAACATTA TTTCATAGCT CAATGGTTTG GATTCAATAT TGTAGGAGGT GGAAAGCATT GTGAATCCTA GGGCTAAAAC GTATTGCAAT CAAAATGGTG  AAACACCTGG CCAATTGTTT ACCAAGAGCC ATGAAAAATT GATGGCAGCT GGGGAGAAAT GGATGAAGCA GGTGGCAACT TCATCAACAG TTGTAGGTGC TCTTATCATT ACAGTTATGT  TCACTGCAGC CTTTACTGTT CCTGGCGGTA ACAAAGATAC TGGATTTCCA GTGTTTTTAC ATGAAAAATC ATTTCTGATT TTTATAATAT CCGACGCAAT TTCTCTCTTC GCGTCATCTA  CATCAGTGTT GATGTTTCTA GGAATCCTCA CGTCACGTTA TTCCGAGAAT GATTTCCTTA TATCATTTCC TAGAAAGTTG GTTATAGGCC TCTCCACGCT TTTCATCTCT GTTGCAGCCA  TGATGGTTGC CTTTTGCGCT GCTCTGAGAA TTGTGATGGA TGGAAGATTG GAAGTTGTCA TTCCTGTTTC GTTACTTGCT GGAATTCCTG TAACCCTTTT TATATTGCTG CAATTTCCTC  TCCTTGTTGA GATTTTCATG TCCACATATG GACCAGGTAT CTTCAACAGG AAAATGAAGC GTTGGTACTG AACATATTTG TTTTTCAATG CAAGGGACGT TCTCTCCGTT TCGTGTACAT  CAGCCAAAAT TCTTGAACGA TCAGCTAGAA TTTAACTTTA TGGACCTCAT GTGATTACTC TTCATATGGT TTTGCTCACG AAAAGTATTA TTACATTTGC CTTGAAGCTA TGTAGAGATT  ATGCACGTAA GGTTGAATCT TGTGTTCATT AGTGATTTAA AGCTAAGTAT TATTACATTT GCCTTAAGCT AGATTTTTTC TTGTGTTTGT TTATTTTTAT TATTATTTAA TAAATAAAAA  AATAATTTTG ATAAATAAAA TTATTAAAAA CAACTATATA AATGACATGT ATTATAAAAT TAAATATTTT AATTTATATT TATTTTTTAT TCAATTTTTA GTTTTATATT TAATTATCAT  TAATAATTTT TTATTTTATT TATTAATACT ATAATTATTA ATTTATATAA TTTTATTTGA TGCATCATAA TAATTTTTTA TATATAAAAA AACTTGTCAA GAAAAGTTTA CACATTCAAT  TTTTTTTCTA TCGAAAAAAA CCATGGACAG CGTGTCAAAT TGGTAATAAT CACTATAAAG TATAAGCCCC ACAAATAAAA AAAAACAAAT TTTCTCCACC TCCAATCAAT CACATTCACG  CTTTAATTAT CGTTTCAAAC GTGACATCCC AATCATTAAC GTTTTATTTT AAGTATTAAA GAACTCTAAA AGGCGTGGGG AAAGCACTGT AGCTTCCCCA CGCCTTTTAA TAACACTGAT  ATATAATAAT AATAATTATT ATTATATAAT AATGATAATT ATATTATAAT ATATATTTTT TTTCATTTTT TTGTTTTTTT TTTGTTTTTT ATGCCTTTAT GAGTTTTTTT TTTTACTTTT  TTTCTTTATA TTTTTTCTTT TTAATAAATT TTTTTTATTT AATTTAGTTT GTTAATGAAT CCTGAGTTTG ACAGGTTAAC CTGATTTGAC GAGTTAACCT AAAATTTTAT TTTTTTTATC  TTTTTTCTTT TTAATTAATT TTTTTCATTT AGTTTAGTTT GTTAATGTTA AATTTCTTTC TATTTAATTA TCAGACTTTC ATGACACGTA TCACAATCTT GACAAGTTAA CCCAGTTAAT  TATGGGTTAA CCCGTAAATT TTTTTTTCTA TTTAGTTATC AAACTTTCAT GACGCGAATC TAAGGTTTGA CGGGTTAACC TAGTTTGAAG GGTTAACCCA GTTAATTCAG ATTTTTCTTT  TCTTTTTATT CATTAGTTTT TTTGTTCCTG TAGATTTTTT TTTTTTTTAA TTAATCTATT TAATTATCAC ACTTTTATGA CACAACCTTG CAGCCAGACT CACATCCAAG GCTCTTGAGT  CCAGTGTTGC AACTAGACTC ACTTAAACTT AAGTCATGTA AGTGTAATAT TATTATAAAT ATTACTCTTG GGTCAAGCGT TGCAGCTAAA CCAAAGGCTT TTTGGTGTAT CTTTGCAAAA  ATACATAATC CTCCTAGATC TTAGCATTTT TTAATATTTT TTATGCAAGA AAAAAAAATA ACCCGTGGCG TAAGCCTTTG TTTTGTTTTT TTTTTTCTTC TCCTTTTTAA GTCTTTCACT  ATGGACTGCA CAGTGCAATT CACAGTTAAA AAGCTGATGC CTTTAGTTTT TTTTTTGTCT TTTTTTCCTC TTTTTTTTTG TTTTGTAATT ATTCTTTTAA TTTAATTTCT TAATATTAAA  TTTTTTCTGT TTAATTATTA GACTTTCATG ACACGGATAT CGGGTTTGAC TGGTTAACCC GGTTGATTCA AATTGTTTTT CTTTTTCCTC ATTACTTTTG TTCTTCCGAT TTTATCTTTT  AATATTGTAT GCAGTCCACG GTGAAAAGGA TGATGCCTTT AGTTTTTTTC TTTTTTTTTC TTTTTATGTC TTTCATTGTG GACTGCACAG TACAGTCCAT GGTAAAAAGA TTGATGCTTT  TTTTTAAAAA AATTAATTTT TTTAATTTAG TTTGTTGATA TTAAATTTTT TTTCTATTTA GTTATCAGAC TTTCATAACA CGGATCTCAG GTTTGACAGG TTAGTCCAAT TAATTCAGAT  TTTTTTTCCT TTTCTTCATT AGTTTTTTTC TTCATGTTGG TTTTTTTTCT TTGTTTTGTT CTTTTTAATT AATCTATTTA AGTATCACAT TTTTATGACA CAACCTTACA GCCAGACCTA  TATCCAAGAC TATTGGGTTT GGTATTGCAG CCAGACCACT TAAACTTAGG TTTTTCAACT TTAACGTTAT TGTAAATATT ATTCTTGGAT CCGGCGTTGC AGTCAAATCT AAGACTCTTG  GATATAACTT TGCAAAAAAA CCTAATACTT TTAGATCTTA GCTTTTTAAA ATATTTTTTA TGTAAAAAAA TTAACCCGCA GCATCACGCG AGTCATTTAC CTAGTAATTT CTAGGATGGG  TATGAAAAAT TTCTAGAATG GGTATGAAAA ATGGGTTACC GAAGCTTAAT GAATTTTTGT AGTCAAAATA TGACACAAAC TCATTTCTCA CCTAGCTACT AGCTGGGCAC ATCGAAGATA  TCTTTGTGAG AATTGTAGGC TTTGAAATTA TAACAACCAA TTAAAAAATT AAAAAAATAA TAATTAAAAT ACTTACGGAT TCATGAATAG AAAAATAATA TCATAAGCAT TTAAATCGGT  AATTTCATGG AATCTTTGCA TCAAATTTCT AAGAACAAAA TGCTTAGGAT TTAGTTATTG GTGGGATAGA AAACAAATAA TTTTATAGGC AAACTAGTTG GCTATGGAAA ATGAGAGATA  AAATTTGAAT TTTTAAGGAG GATAATCTTT CGTTTTCGAT AATAAAATAC CATGTAATAT TAGCCTAAAC ATTGATATAA TACTCTATCA TCGTTTTCCA ATTTTCTGGT TGTTAATTGA  CTCTCTGTCT CGCAATTAGA ATCTACAATT GTACATAGCA AAGCTCTTAA TTTTAAGATG TTCATTATAT ATTCTAGTCA TTAATTAGTT GATTAAACTA ACTAGCTCCT TATTGAATAG  GGAAAACAAA AATCAAAATC AATTTCAAGT TGATTGGACG GTACGAAATT GGAGAGAAAA TAAATGGGGT CCGGAGCCTC CTCTTCATGA TGATTGGTGG ATTTTTTTAG AATTTCAAAA  AGTTGTTCTT ACAGCTGGCG ATGCTCAAGG AAAGGAGATG GTGATTGAAG ATAAAAGTGA TGATTCTCCA ACAGCTGTTT TTATTATGGG AAAATAGAAA TTAGAGAGGT AAAGGTGTAA  GTAATACTAT AAGAAATACT ATATATATAT ATATATATAT ATATATATAT ATATATATAA AACAATAAGA AATTTATTGT ATTGTAATTT ATTTTAATTA ATTAAATTTT TTTTAAGTAC  CATAGACATC GACATGCTAG AATTCCTCTA AATCTCCCAA TATTCAATCT CATGTAAGTA AAGAATTGAC ACCCGCAGGT TGGTTATATA ATAATTCTTT TTAATGTTTC TTTTTATTTT  ATTCTCATAG ATAAAATCAT ATTTGAAAAC AAAAAAACCT TCTTATCATA TTACTGCGAA CTTCTTATCA GTTTCCCAAT AATGTTTTAT AGTTTATTTA CATTAAATTC ATCAATCTCT  CTCTTGATTT GAAAAGTTGT CCCCCCTTGA GGACAGTGGA GACGACCTCA CGTTTCACCT AACAAACGAA GTCTTTGGCA CGAAATTGGA AGGTCACATC AGTGCATGCA CCGCATGGGC  AAGCCCTCTG TGACTGAAAA AGAGTAAAAA ATAATAATCA TGGTACGTTT AACAGAAGTT CAAGTAAAAT CTACATCACG GTATGTTTTT GTTTTTGTTT TTTTTTTTAA TATGAATTAA  GAATATGAGT GAGAAAAAAA TTAAAAATTA ATTAAATTGA AAAAATCAGA AAAAAATAAT AAAAAAAATT AAATCGTGAA AAAAACCGAT TAAAATTTTG AAAAAACCTA CCGGTTTGGT  TCGGTTTTGG TTTTATAAGC CTAAAATAAA AAAATCAAAC CGAACCGGAA AAAAAACCAG AAAAAACCGA GCCAAACCGG AAAAAACCGT GTCAAACCGA AAATCAATCC AAACCAGTTT  GAACTGGTTT TTGTCCTAAA AAACTAAAGC AAACCGAAAC CGGTCAGTTT GAACCGGTTT TGGTTCGGTT CAAATTTTTT TTTTAATTCA GTATGATTAT TTTTTTAATA AAAATCAAAC  CAAATAAAAA ATAATTACTT TTAATACAGA GTCAGTAATT AGGATTAGAA TGCTCTCGGA ACATGATTCA GGCTACTAAA TTTAATTAAA ATCTCAAGAC ACGGTTTCTT ATATTTAAAT  TTATTGTTAA TTAGGAAATT GAGGTGTCGA TTAAGAGGGT GCATTACTGT TTAATAAATC TCAAATCAAT GAAAAGCAAA AACTTTAGGA ACTCTGCATG AATAATTTGA CTTTGACTGA  AACCAAGAAA TAAATACCTT GAAGCTCAGA GTTTATTACA ACAAGACAAT GAGGATATGG ACATTTGGCG CAACCACCGC AATAACATGA ACACGTCATC ATGGGACTCC TTTGAGGTCT  CTGTAAGGGT CCATGGGAAT ATGCTTGGTA CAGGCAGAAT TATTTTGCAG CATATATATT CATTTTCTGA AAAAACATTA TTGAACCGGC AAAACGTGGG TGAGATATCT AATCTGCCCT  GGACAACCTT TCATTATCAA AAATTATTGA AGCTCTGCCT TTCATTATCA AAACCGGAAA AAAATCAAGT CAAATCGAAA ATCAAACCAA ACCGGTTTGA ACCGGTTTTT GTCCTAAAAA  ACCAAAGCAA ACTGAAACCG GTCAGTTTGA ACCGGTTTTG GTTCGGTTCC GAATTTTTTC TTAATTCGGT ATGATTATTT TTTTTGATAA AAATCAAACC AAATAAAAAA TAATCACTTC  TAACACAAAG TCAGTAATTA GGATTAGAAT GCTCTTGGAA CATGATTCGG GCTACTAAAT TTAATTAAAA TCTCAAGACA CGGTTTCTCA TATTTAAATT TATTGTTAAT TAGGAAATTG  AGGTGTCGAT TAAGTGGTGT TAATTTATCT CAAGACATGG TTTTTTAGTA ATTTAAGATA AAATCAGCAA TGCAGCTTAC CTCAGGTAGG GTGCGCTAGG GGTGCTAATA CCTTCCATAG  CCACAATCAG TCCTGTACCA TAGAATCTCT GTTGACCAGT TAGGGTTCCT AGTGACCATA ATACTAGGCG GCGACTCCTT GAACAACACC TTTTCCCCCT CAAAAAACAA GATATCAGAT  ATCTGTTTTT TTTCCATAAT CATGATTTAT TTTTAAGACC GTCGCGATGT CAGGTGCGAT AATCATGATC GTAGTTTTGA TTGGCCACTC TTTAATTATT GATCTAGGCA TCAAGCAAAT  ATATGATTTA AAGAAGATCC ACATTTATTC GGATAAAATC ATACGGTGTA TGTTTGAGGA ACACAAAAAG GCAGATGCAC ATGTAGCATT TTAAAAGGGA TATTTGAGAG TACAGTAGTG  GTCATAGTTT TGAAACCCGG CCCGACGGGT CGACCCGGGG GCTGGAACCG GGCCGGGTTA AAGAAAAAAT GGGGAAAGAA AAAACTCGGT GTGACCCGGC TGACCCGGCA ATACTTGGTT  GCAACCCATT GACTTTTATT TTTTTTTACT AAAACGACGT CGTTTTGATT AAAAAAATTG ACCCGGGCGA TCCGGTGACC CAGTCAAAAC CCGGAACCCG GGCCTTAGAT CGGGCCAGGT  CTAAAAACTA TGGTAGTGGT TATTTTTAAA AGTATTTTTT TTTTCAGAAA TACATCAAAA ATAATATTTT TTTTATTTTA AAAAACTTAT TTTTAATATC CGCACACCAA AATAATAAAA  TAAAAAAAAC TTTTAAAACA CAAATTTTTT CTATATAGTA TGAAATCAAT TCTAATTACA TAAATTCATA GTTAATTTAA TAAAAGTCAA CTAAAATCCT CAATTTTTAC AAACCCAAAG  AATTAATGAG ATGGAGGACA CAACACCGAG CCGTCAACGA AGTGAAAAAC ACCTTGACTA AGAAGATAGG GCTTCATCTG CATTCGCCAA TAGAGATAAT TTGTGTTCGT AAGTTTCAAC  GAAACAACTT GGTGGGTGTT TGACAAAGAA ACGATAACCG GAGTATGTGT TCCCATAAGA TGTGGAGGAA AGATAGAAAT TTATGAGGAG GAATCAAAGA CATGCTTTGC AAGTGGAGGT  TGCTGTTGTG GAGGAAAGAG ACCACCGGCA ACAACTTGTA GATGGCTGGC CGACCGTGTT GCACCACCGG TGGTGAGAGA GAAGTCGGCG GCAGCAGTAG AATTCATGTA GAAAAAGCAA  AGAGCAGGTC GGTTGCAAAG CGGGAGAAGG AGAAAAGAGT TTCGACGATA GAAGGCTCTG ATACCAAGTT AAGAATAACT AGGAGGCTTA AACTATTTGT TAACCAACTC TTTCTATATA  TATGTATAGG ATAATATATA ATAGAAATGA TAAAAATTAT CACACAAGAG TATAACTATA TATTTGTTTT ATATACGATA TTTTTTATAT AGTTACATTC TATAATTATA ATTATAATTA  TAATTATAAT TATAGTAATA ATAATAAATA ATTTCCAGCA GTCACCCGTC CGTAGATGTC CTTTGACCTT AAATGTTGAA TTATTAGTTA CGGCATTTAT GGATGACAAC TAGGTGAAGT  GAAAGGCTGA GAGTGCTGGA CACTTGATAG TCTTTGTGCA TTTATGGATC ACAACGAGGT GAAATGACTC TTATGGAAAA AATGTCACAG GTGGGTGGCC CATCCTACGC GGTGATGCTT  GGAnnnAGAG ATTCAACTAC AGCAAGTCGA ACCTTAGCCA ACGCAGAGTT ACCTGCCTTC TTTGAAAGCC TGAAGAGCCT TATTTCTCGA TAGCnnTTCC AAAAGAAAGG CCTTACTGCA 
AGGGACATAG TTGCCTTGTC AGGTTCACAT ACTCTCGGAC AAGCTCAATG CTTCACTTTC TGTGAAAGGA TATACAATCA CAGCAATATC GATGCCGGAT TC 

Retrieve as FASTA  
CDS
Send to BLAST
.........1 .........2 .........3 .........4 .........5 .........6 .........7 .........8 .........9 .........0 .........1 .........2
ATGGCAGCAA AAGCAGGAGC AGCAGCTTCT TTCATGTTCA TGCTGTTCTT GCTGAACATA GCATGCCAAG CACAACTCTC CACAGCTCTC TGAAGTGCAA TTGCGAGCGA CAGGAGAATG  GCCGCGTCTC TCATCCGCTT ACACTTTCAC GATTGCTTTG TCCAGCATTG TGATGCCTCG ATCTTACTAA GTGAGAAGAC TGCCCTCGGC AATCATAACT CTGCTAGAGG TTATAATGAA  AAACnnnnnn nnnnnACTGA AGTTGAGAAG ATCTGTCCTA GAGTAGTGTC TTGTGCAGAT ATCATTGCTG TTGCAGCCAG AAATGCATCC GCTTATGTGG GTGGCCCATC CTACGCGGTG  ATGCTTGGAn nnAGAGATTC AACTACAGCA AGTCGAACCT TAGCCAACGC AGAGTTACCT GCCTTCTTTG AAAGCCTGAA GAGCCTTATT TCTCGATAGC nnTTCCAAAA GAAAGGCCTT 
ACTGCAAGGG ACATAGTTGC CTTGTCAGGT TCACATACTC TCGGACAAGC TCAATGCTTC ACTTTCTGTG AAAGGATATA CAATCACAGC AATATCGATG CCGGATTC 

Retrieve as FASTA