Entry information : DgrPxd01
Entry ID 7651
Creation 2010-10-22 (Marcel Zamocky)
Last sequence changes 2016-02-17 (Christophe Dunand)
Sequence status complete
Reviewer Achraf Jemmat
Last annotation changes 2016-02-17 (Achraf Jemmat)
Peroxidase information: DgrPxd01
Name DgrPxd01
Class Peroxidasin    [Orthogroup: Pxd001]
Taxonomy Eukaryota Metazoa Arthropoda Insecta Drosophilidae Drosophila
Organism Drosophila grimshawi (Idiomyia grimshawi)    [TaxId: 7222 ]
Cellular localisation N/D
Tissue type N/D
Inducer N/D
Repressor N/D
Best BLASTp hits
Perox score E-value DgrPxd01
start..stop
S start..stop
DmoPxd01 2649 0 6..1532 5..1570
DerPxd01 2538 0 26..1526 21..1525
DmPxd-A 2537 0 26..1526 22..1526
DanPxd01 2528 0 22..1526 21..1530
Gene structure Fichier Exons
ExonStart..EndSize ExonStart..EndSize ExonStart..EndSize ExonStart..EndSize
N° 1 9825306..9827976 2671 N° 2 9831268..9831449 182 N° 3 9831538..9831716 179 N° 4 9831854..9832063 210
N° 5 9833573..9834217 645 N° 6 9834841..9835085 245 N° 7 9835190..9835261 72 N° 8 9835344..9835559 216
N° 9 9851733..9851917 185  
join(9825306..9827976,9831268..9831449,9831538..9831716,9831854..9832063,9833573 ..9834217,9834841..9835085,9835190..9835261,9835344..9835559,9851733..9851917)


exon

Literature and cross-references DgrPxd01
Literature Drosophila 12 genomes consortium (2007) Evolution of genes and genomes on the Drosophila phylogeny. Nature 450:203-218.
Protein ref. UniProtKB:   B4IZC8
DNA ref. GenBank:   CH916366.1 (9851917..9825306)
mRNA ref. GenBank:   XM_001984299.1
EST ref. GenBank:   EB602849.1 [3' end]   EB625413.1 [3' end]
Protein sequence: DgrPxd01
Sequence Properties
first value : protein
second value (mature protein)
Length (aa):   %s   1534 (1509)
PWM (Da):   %s   171798.42 (169078.0)  
PI (pH):   %s   6.54 (6.49) Peptide Signal:   %s   cut: 26 range:26-1534
Sequence
Send to BLAST
Send to Peroxiscan
.........1.........2.........3.........4.........5.........6.........7.........8.........9.........0.........1.........2
MRWHCWQLLAAVAVCLASVVQLANGQWVNCPSGCTCLPGTVRCIRARLTALPKQLPKDIKVL*VQRVERCFFFWGGGFGSLVWYSLVCVHKS*QVWLLANP*ISF*CASLTITVSLTLILMLKLLPALI*RLPPANICFPLSLSTIPPSAAC*LN*TLFNCGSSERICIFIISRGIRVAICMHAKYFTDAAFIFQMSAVFPMNFGQSFMQNRRGLSGCLGVARLSKMFVEHMHIYAWDRLPPIPCRMSNSVSTAKNSARIKMSVLMCNEFNL*QICSCKLSLHLASGRDKKMIIVIWE*AQRE*VNRGLLICCSFRIKSVCLNLYNLNEFSLFF*LLTIMLLILKI*LSFGSSYGSLKCW*GMSRNITIIVEKFIISFLSECLL*STHII*LNLN*YFLQFFHTLDSKNIYFSTHLPFSTCNFYFFSINLNL*KRCCMHY*SWVASNNCTFHSCVLICFVTD*INLLPFVFRQFSV*LNVPYKYNC*LPAATISYVW*FFTSIAMSLSLSLSLSLSLSLSLSRCLSLYMYLKFSI*HMSHMKLPAGPKCINTSVILEICMRFVIQFVERTCYDLELCGXXXXXXXXXGWH*GVY*TSAKKYRKII*KII*QTSRNDTF*NFSCLNCYKSI*DKISLPF*RRYIF*KLNFRTT*INILSPIWKR*CKANI*NIENIFEYIIQFCLDFVANVDIQALSEIPFQYKLIYLNAVALRAFAVNSMFTFCKYVQVE*D*QFFHLFALILLMASNLFTLFARVNL*LCASCDEKTNMHECEIKEREKERERQTERERETQIKTQATNAKKKARLYLKMVHT*ELKRHKSKNKCRRLK*DDKIGLYFLCSAIYNMYIF*YMLFPNSPVCLQFNLK*IFHI*LWKCAKAYATQVSFTGCSHKYAIVTNIEREREREREGGRGSGRRK*GRQ*ERVTVKKNACSQSKCAPIVELKKWLLPEECAWEKYAVRPGGKLSN*AKVARHVSCIPFLKCDRQTHNNVKVTASADVDGVE*WGR*LISFYKSAKW*CG*QRD*D*VSR*SYVQVAK*VSSWCGGKRRGH*YSGSKRKAALARQTYQKEAK*VH*KISTLHCSYRWRLNATFLYS*LLMFLCHVFHIFHVCHAAAGHCDCHPTLLQV*MCTHVCRYVSVRVCVGVLAKLLSAEPSNCLATVL*FKWRPSRKVGSIFSYNFHVYSRVCVRVCVGVCGVVWMCVCMCLYFC*NKFYLNFRLLFLAIFAMFLVIFSLFFLFYFYYFFFVQCNV*NSIILQDLYVEHGVVLALRVEAS*NFI*SVENTYIYIYIYIKNFMHAATPR*LFKVL*VLR**QRPTGHNYIYSLAHTHTHSP*RVG*CMWA*SKQTNQIESQLQLKTVAQHLGQLQLRRGARLATI*AGRGC*EQYSSSGFCLIIASVCRR*LKLHYQVSGCSCGL*QSYTHM*LYS*QLS*VFVCVCIACQSKITWATLATEGGTGALWILA*CKMNNEVWTPDVCTKCNCFHGQVNCLRQQCGEVSCPAGIEPLTPPEACCPHCPVMPTKSKVVK

Retrieve as FASTA  
Remarks Complete sequence from genomic (8 introns) and 2 ESTs. Strain="TSC#15287-2541.00"
DNA
Send to BLAST
.........1.........2.........3.........4.........5.........6.........7.........8.........9.........0.........1.........2
ATGCGCTGGCACTGCTGGCAACTGCTGGCTGCTGTTGCCGTGTGCCTGGCCAGCGTTGTCCAACTCGCCAACGGACAGTGGGTGAACTGCCCCAGCGGTTGCACTTGCCTCCCGGGCACA
GTTCGCTGCATTCGCGCCCGACTCACCGCGCTGCCCAAACAACTGCCAAAGGATATCAAAGTGCTGTAAGTTCAACGCGTCGAGAGGTGTTTTTTTTTTTGGGGGGGGGGGTTTGGGAGT
CTGGTTTGGTACTCGCTGGTTTGCGTGCATAAATCATAGCAAGTTTGGCTTCTGGCAAATCCATAAATTAGTTTTTAATGTGCTTCTCTCACTATCACTGTCTCTCTGACGCTGATTCTG
ATGCTGAAGCTGTTGCCGGCGTTAATTTGAAGACTTCCTCCAGCAAACATCTGCTTCCCCCTTTCCTTATCCACCATCCCCCCATCTGCTGCGTGTTGACTCAATTAAACGTTGTTTAAC
TGTGGCAGCAGCGAGAGAATTTGTATATTTATCATATCGCGCGGCATCCGCGTCGCGATTTGTATGCATGCGAAATATTTCACTGACGCTGCATTTATTTTCCAAATGTCAGCAGTTTTC
CCCATGAATTTCGGCCAAAGTTTCATGCAGAACAGAAGGGGTCTGAGCGGGTGTCTGGGGGTGGCTCGACTTAGTAAAATGTTTGTGGAGCATATGCATATTTATGCATGGGATAGGCTG
CCACCAATTCCATGCCGCATGTCGAACTCAGTGTCGACTGCAAAAAACAGTGCAAGAATAAAGATGTCTGTACTAATGTGCAACGAATTCAATTTGTGACAGATTTGCAGTTGCAAGTTG
TCTCTGCATCTGGCAAGTGGGCGTGATAAGAAAATGATAATTGTCATTTGGGAATGAGCTCAACGGGAATGAGTAAATAGAGGTTTATTAATTTGCTGTTCATTCCGAATTAAATCTGTT
TGCCTGAATTTATATAATTTAAATGAGTTCTCTTTGTTCTTTTAATTGTTAACTATTATGCTTTTGATATTAAAAATTTGATTGAGTTTCGGTTCAAGCTATGGCAGTTTAAAATGTTGG
TAGGGAATGTCTAGAAATATTACTATAATAGTAGAAAAATTTATAATATCCTTTCTCTCAGAGTGTTTACTGTAATCTACCCACATCATCTGATTAAATCTCAATTAGTATTTTCTACAA
TTTTTCCACACATTAGATTCTAAAAATATATATTTTTCCACTCACTTGCCCTTTAGCACGTGCAACTTTTATTTCTTTTCAATCAACCTAAATTTATAGAAAAGATGTTGTATGCATTAT
TAATCATGGGTTGCCAGCAATAATTGCACATTTCATTCTTGCGTTTTAATTTGTTTTGTGACAGATTAAATTAATTTGTTGCCTTTTGTTTTCCGACAGTTTTCTGTTTAGCTAAATGTG
CCATATAAATATAATTGTTGACTGCCTGCAGCAACAATTTCGTATGTTTGGTAGTTTTTCACTTCCATTGCTATGTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCT
CTCTCTCGCTGTCTCTCTTTATATATGTATTTGAAATTCAGCATTTAACACATGTCGCACATGAAGCTTCCAGCAGGCCCCAAATGCATTAATACTAGTGTCATACTAGAGATATGCATG
AGATTCGTGATTCAGTTTGTGGAACGCACATGCTATGATCTTGAATTGTGTGGANNNNNNNNNNNNNNNNNNNNNNNNNGTGGATGGCACTAAGGGGTATATTAGACTTCAGCTAAAAAA
TATAGAAAAATAATATAAAAAATTATATAGCAAACTAGTAGAAACGACACTTTTTAAAATTTCTCATGCTTAAATTGTTATAAGAGTATTTGAGATAAGATTTCCTTACCATTTTAGCGA
AGGTACATTTTTTAAAAATTAAATTTCAGGACAACTTAAATTAACATTTTGTCACCCATTTGGAAAAGGTAGTGTAAAGCTAATATTTAAAATATTGAAAATATTTTTGAATATATTATC
CAATTTTGCTTAGATTTCGTGGCAAACGTCGATATTCAAGCACTCTCTGAAATACCATTTCAATATAAGCTGATTTATTTGAATGCAGTTGCATTAAGAGCTTTTGCAGTTAATTCTATG
TTTACTTTTTGCAAATATGTCCAAGTCGAGTAAGATTAGCAGTTCTTTCATTTGTTTGCTTTAATTTTGTTAATGGCTTCAAATTTGTTTACACTTTTTGCTCGTGTGAATCTGTAGTTG
TGTGCCTCATGTGATGAAAAGACTAATATGCATGAGTGTGAGATAAAAGAGAGAGAGAAAGAGAGAGAGAGACAGACAGAAAGAGAGAGAGAGACACAGATAAAGACACAAGCAACAAAT
GCAAAAAAAAAAGCCAGATTATATTTAAAGATGGTGCACACATAAGAATTGAAAAGGCACAAGTCAAAAAACAAATGTAGAAGATTGAAATAGGATGATAAAATCGGACTTTATTTTTTG
TGTTCTGCCATATATAATATGTATATATTTTAATATATGCTGTTCCCTAACTCACCTGTATGTTTGCAATTCAATTTAAAGTGAATTTTCCATATTTAACTGTGGAAATGTGCCAAGGCC
TATGCCACACAAGTTTCCTTTACTGGCTGTT
CATCATTCAGTGTTCGATGGTTTTTCTTTGTCCAACTCGCCAAAATACTTGCTCTCTTTCTATTCGCATACACAAACTCAAATGTTGAA
CGCGAATACAAAAACGCCACCTTTTTGACTTTTTGCCCCCCGGTGCGCGTATTTAAACTTTCAACTAAATGGAGGCAAGTTGTATGTATATGTTTAACATATGCCGCTGCCTCTGCCATC
ATTCATCTTCTACACCCACACACATCACACACACACTACTCATACACACAAGCTGAGGCGTTGAGCAAATTCTATTTGTACACTTTTTCTTCTCTCTGCTAAATAAATGCACTTGATTTC
ATTTCATGATGATGCATTTCAGCTTGGTCCGCTTTTATATACAACGACTGTATATATATATATGTATATATATGTACACGTAAATATATATAATTTGAAAGAATATATGTATAAGATATC
TTGGGCCAAGCAGCCGCTTAGAACGCTGCCCATTTCCGGCTGGAGTCAGTTAGTTTGTCATTATGTGTGCACTCAGAGAAAACCACTTTTAAGAAGCTAAACACCTTTTTGTTCTTAAAA
TTTTAATTATACAACGTTTGTGGATGTTCTCAAATATATAAATACGATAACCTTATAAAATGTATTTTTGTACGAAAAAGAATTGTAAAGTATTTTCGTTCTTAATTCAATGGCTAAAGT
TTTTTATTAAAGCATTATCAATTAAGTCACGATTAAATTGAAAGCTTAAAAAGTCAATTTCTTTATTTAAGAAACATCAGTACCAGTTTAAAGCCAAATTTATCCCTATTATTAAAAGGA
ATTATACAAATTAGAAATGTATTGAATTATGAAATTATTCCCTTGATTATTTTTTCGCTGAGTTTAGATCCTGCTCCTGTGCATCCTGATGCTGCAGCTACTGATACAGCTTGGGAACTC
TGCATATCTGCCACATAAAACGCAGTTGGAGCCAGGCAGATGTGCTATATACGATATGCATATATCTCGCATATGTATGTAAATGTGGCCTGCACACTCATAACGGTTATTATGTATCTT
TACATACACAGATGTGTGTGTGTGTGTAGTTATCTCATGCTGTGCGGTGCATTATCAAAACAAAAGTCGCCACACGTTGCATGCTCGGCATATTAAAAAGTTTGATTAGTGCCCAGCCCA
GTGCTCAGCTTTGCATGACCCCCATACTAAAACTATTTTTTGCCAGCTGAAAATATTGTGCGGCTGCTTGCATGCCTGCCTCCCACTGCCAGGCTCCATGACTCCCCTTTATCATTTCCT
CATTTCGTCATGTTATATTACGAAGCACTTATGCGTGAGAAATGGCTTGTTCATCCTTGTTGCTGCTGTTGCTGTTGCTCCACTTTGCACACATCCCACAACCGTCTGCCTGCCCGGCTG
CCTGGCAGGACAAAATATTGTATGTTATTATTAAATATGCATAAATTTACTTTTTGCATGCCACAGAGTACGGATTTTTTGTGTTTTTTTTTTTTTTTGGTGATGTCACCCATTTCGGTT
GCAGTTTTGTATTCACATTTGCAGTTTATTTTCCCGTGCTGCAAATATTGAAAAGTTATTGTAAACACATTCTGATAGTGGTACCGTTGTTAGAACAAAATAACCACAATCTTCACCATC
CCATTGGCATTGAGAGAATGTGCTGAAAGTAAACTCAGCATGGAGGATCATATTAAATGCCGCTGGGCAATACACTCGAACAGGTGAAGGCTCGGATAACATCATCAATTGTACGCTGTT
GTCGCTTGTTATTTTACAGAAAAAATACAAAGAGCAACTGTGTATTCGCTTACTTTACAGATATCACTTGCTTGAACTTTATACAGTCAACGATGTATATATTTGTATTGATATTCCGAT
TCGACAATGTTCTGGCTCTTTAAAGAATGGACTCCACTCTTCAGTTACTTTTTCAGGGTATAATTTTAACATGAAAATAAATGATATAATGATAGATAAAATCATATAAGGTCCTGGTTT
TTGAAAATCAGTTCAGTTTTCACAAAACAATGGATGTGGAAAGATTTGACATTTCTCCATTGATACGTTTTGAGGATATAATTTTAACATGAATTTGAGCCTTATTTTATGTCATTTTTT
GTCAGTTCACTGAATTGGATTTATTAATGTGTATGGAAGTGGGATATTAAGGATTAAGTAAAAAGAGGGCATTACAGCTTCTACCAATGGATATGTGATTTTTGAAATGATTAATGTTTT
TTGGTTGCCTTCCTCTCCGTGGCCACACACAGTTTTTGTTGCCTGTGTCTGGGTTGACTTTTCAATTGTTGAACCTTTCTGCATTTGCATAAAAATGAAATAAAATTGATGTGCATACGT
GTGTGAGTGTTTGCGTGTGGATTTACTGACCACTTCGAAGTTCGAACAATGCACAAATTGCAATTTGATTTGCAATTATGCAAATGAAACGTCCGACCTGAAATAAAATACCCATGTGCA
GCAAATTAGTTAAAGTGAAGCATGAAAAGGCAGCAAAGCCTCAATCGTAATTCCCAGATCCCATATCCTAGATCTCAGTTGTTTACCACATAAAACTTTGCATGCCAATCACATCGTATG
CATTTTTAATGCACTTCAAAGTGTTTCCGAAAGGTGGAGCAGGGATTTGAAAGGGAGAAGAGGAAAGGGTGGGGGGTGGGGGAGTGGGAGGGTTTAGACTTTTCAAGCTTGTCACTTTGA
CATAAATCTTTGAGAAAAATCTGCTATTGATTTCGCCTGCAGTACTTTGAGAAGAACAAGGGCAAGCATCTTTGTCTCTTTCCCTCCCTCTCTCTCTCTCTCTTTGTCTCCGTCTCTCTT
TGTCTCGCGTCTCTTTGTCTCGTCACACTGAGCAATTTGCATTTAAAGTTTTCGTTAGATCCGATTTCTTTTGCTTTAATGCTGCAGCAAAGTGGCACTTGCTTCGTTTCACAGACGCTT
CCGCCCCTGCCTCTGCCACGCCCACTAGCTTTGTCATTTCGCATGCTCGTTAGTGCAGAGAGCACAGAATGCAAAAGTAGTCGCTGTGATAGCTTTACGGCAACAACTCACAAACACATG
CCACAATCTATAAGCAAAGTTATTTTTGTAGTTGCCAGCGGGAGCGGGAGAGGTTGGGGGAGGGGTTCAAAGAGGCTACAGTGACTGCCAGATAGGAACAGCAGCTCAAACATGTCAAAG
TGGAGCAATCGGCATGTGCCCGGCAGCGAGGCTGGGGAATGGAAACTGCAGCAGCGACTGGTCAAGCATAAGGAACCAGCAGCCCATAAGTATGCTATAGTAACGAATATTGAAAGAGAG
AGAGAGCGAGAGAGAGAAGGAGGGAGAGGGAGTGGTAGAAGGAAATGAGGGAGACAGTAAGAGAGGGTAACAGTAAAAAAAAACGCTTGTAGCCAAAGTAAATGTGCGCCAATTGTAGAG
CTAAAGAAGTGGCTACTGCCGCTC
CTGCTGAAGATGCCATCACGGCATAGGTAAGTCGACAGCAGAAGCAAAGAGAGAGAGAGCGAAAAAGAGAGGGGATTGGTGGGCGGAGGAGGAGTG
CGCCTGGGAAAAATATGCTGTTCGACCAGGCGGCAAACTAAGTAACTAAGCCAAAGTGGCGCGCCACGTTTCCTGCATTCCATTTTTGAAATGTGATAGACAGACGCATAATAATGTTAA
GGTAACAGCTTCGGCAGATGTCGATGGCGTAGAGTGATGGGGGAGGTGATT
GTCGGCGGGTAACAGCTGTTTGGCATGTCAATTGGCTGCGGGTCAGCTTTGTACTTCAGCAACTTGCTG
CTGCAGTCAACCAAGCACGTTGCGTATACGTCATATTATTAATGAGACTTTTATTTTGATGTCAGGCAGATATCGTTTTATAAAAGCGCCAAATGGTAATGTGGTTAGCAACGTGACTAA
GATTAAGTATCCCGTTAGTCTTATGTACAGGTAGCTAAGTAGGTAAGTAGTTGGTGTGGGGGCAAACGACGCGGCCATTAATACAGCGGAAGTAAACGGAAGGCTGCTCTTGCAAGGCAA
ACGTATCAAAAGGAAGCTAAATAAGTGCATTGAAAAAT
TGTTAAATTGCTTAAGAAATTAATGAAACTTTTTGCTTGAAACGTTAGAAAACATTTTTTTTAAAGCTTTTTGAAGCATTTA
ATTGATGAGCAATGCAAAAATATATAGAGTTTATTAATATTGAGTTTTACAAGTTGGAAAGTCATTAAATTGACAGAACTACTTAAAACTACTTAGAAAAAATACAATAAGAAAATAATA
ATAATAAGTGCATAGTTCATGTTTCACTCTAGGTTATTCAACTACATAAATTGCGACTTGGTTTGGTTGCCAAAATATCCGTTTTTCATATCAGGATGCAATTTTGTGTCTTGCGTTTCC
ATTATAAGCAAATATTATATGTAATTTATACTAATCGGCAAGCTGAAGTTAAGCAGTTTTTGGCCATTCAGATAATTTCCACAAATTGTATTAATTTAAGCTCTTTAAGGCTCGAATTAA
AACGGTTCACTTAAAGTGAAACAACTGCTTTATACACACACAGTTAGAAAAAAGCCCAACGGCTTCGTCGAAGTGTAAACGATAAACAAGGCGCTTTCTGCACTGACCATGAATACCGCC
AATAACAATAACAATAGAAGCAACGGCAAAAACAGAAACAACACCAACAACCAGGAAGGACTACAACTCCCACATCAACAAGAAATTCCTGCTCGCTCACACGGAATTGATATGTTGTCG
TGCTTGGCTTCGTCCACGGTTCTCGTCCTCCTCCTCCTCATCGCCCTGTTGCTGCAGCTGCATTGTTGCACTTATCTGTGTTGTCGCTGTGGCTACGCACAAGTGACCTCAGCCAGCCAC
CTCACAAGTGACCTCACTCTCTCCTCGCCTCTTTCTTCGCCACTCCTTCCATTTACAGGCGTAAATTGTTATTTTCAGTAATTATGTCCAATAAGCGACGAAGCGTAATGGCCTGGGAGG
ATATGCGCAAGGAAGCTGGCAGGTCTCCTGCTGCACAACGGAAGGAAAACGTTGTCGTCAATGTTGCCATTATGTAAGCTAACCCGGTTTTAGCGGCGACATGGCATTTCCTTCTTGTAA
ATGCAGGCTGGATGCTTGTGCGTTAAATGCAGCGCCACTACAAAATTATAGGGAAAAATCGCAAACTACACAAAATAAACCAGCGCGCCTTCAATTGACTTGACGGGAAGGGGGAAGGTG
AGGGGAGGAAGGCAATGTTGAGGTTTGTGGTTTGGGCCATAACACGCTTCAACTGAAGAAGCAACCACAGCAGCAGCAGCAGCATTTATTTTTTTTTGAGGCAACGGTAAACTTTCGGAG
CCACGTGCATTGCCAGCAAAAATTCACTTGGCGTGGCTAGAAACAAAAAATAAGCAAGTAGCATCAAAACTTGCGTTACATAGTCTTTTTATTTCAGAAGAAAAACCTGCAAAAAAAAAG
GGAGACTGCAAGCCGTTAGTCAACAAATTCCCAAGCTCTCGAACTGTCTATTCAACTGGGCCGCCTCTGCCGCTGCCATCCCCTTGCCACTCCTTCAGTAAATAATGCTCGACATTGCAT
TGCTCTTATCGCTGGCGGCTGAATGCCACTTTTCTGTATTCTTAGCTGCTAATGTTTTTGTGCCACGTTTTCCACATTTTCCACGTTTGCCACGCTGCCGCTGGCCACTGCGATTGCCAT
CCGACATTGCTACAGGTGTAAATGTGCACACACGTGTGTAGGTATGTATCTGTGCGTGTGTGTGTAGGTGTGCTGGCTAAGCTGCTTTCAGCGGAGCCCAGCAACTGTTTGGCAACAGTT
CTATAGTTTAAGTGGCGCCCCAGCAGGAAAGTGGGCTCCATTTTCAGTTATAATTTTCACGTTTACAGTCGTGTGTGTGTGCGTGTGTGTGTGGGGGTGTGTGGGGTTGTGTGGATGTGT
GTCTGCATGTGCTTGTATTTCTGTTGAAATAAATTTTATTTAAACTTTCGTCTCTTATTTTTGGCAATTTTTGCTATGTTTTTAGTGATTTTTTCGTTGTTTTTTTTATTTTATTTTTAT
TATTTTTTTTTTGTGCAGTGTAATGTGTGAAATTCAATTATACTGCAGGATTTATATGTTGAGCATGGCGTAGTTTTGGCGCTTCGAGTTGAAGCCAGCTGAAATTTTATTTGAAGCGTC
GAAAATACATATATATATATATATATATATAT
ATAACTGTATATAAAAATAATATGAAAATGCATTGAAATCAGCGCACTATTCAATTGGAAACGGTTTAATATGCGTATAAAAAGCGCA
TATTATGCCAAGACTCATATTGCGAAAATTTATTTCACTGCTTTATTAAATTGTTTGTGTTGAAATAAACGTCTGATTGAAAAATTACTACTTTGAATGCAGAGCAACTTTAATAGCTAT
TCAAAGCATCAATTGAGCTTGAGATCAATAATATTCTTTTGACCATTGGCAATTGGATAAATTGATGTCAATTAGTTGTCTTAACTTAATTTTTGTCATCCTTTTTTTTCTTAGAATAAA
TTCTTAGCTTAGCTAGAGAAATGCACAAGTTTCCAAGTAAAAAGTAAAGGTGTCAAAGCCGATTATAATGCTATTTATATTTATGGTTTCCTTTTTTTCTTGCAAATGGTTTCTGCCTAA
AACAAGAAATTCAATATTTTTCCTCTGGTTACCACAAAAACCTACATCACACATATTTTATGTGCGGTGGACAAAGCTCTCAGAAACGGAGCTCAACAAACAGCTTTGAGCTGTCCAAAT
TAGGCGAAACAGCAACGAGGCAAGTTGATCGAGGTACATTGAAATGCAACTGAACAAAGAACTTTATGCATGCAGCAACTCCAAGGTAATTATTTAAAGTGCTCTAAGTACTAAGATAAT
AGCAAAGGCCAACTGGACACAATTACATTTACAGTTTAGCACACACACACACACATTCTCCTTAGAGAGTTGGCTAATGTATGTGGGCATGAAGTAAACAAACAAATCAAATTGAATCCC
AGCTACAGCTCAAAACAGTGGCACAGCATTTGGGGCAACTGCAGCTGCGCAGAGGCAGAG
ATTCTTTGGTCGGGAACTGACCGAGTGACAAAGAGACTGACATGACTGACAAGCTCAACT
TTTACGTAAGCCAACAAAACAAGGTAAACAATGTCAAGCAGACTCAAGACTGGCAACAATATAAGCCGGGCGGGGCTGCTGAGAGCAATACAGCAGCAGTGGCTTTTGTTTAATAATAAT
AAAACGCCAGCATACAAAAATAAATGACATTGTTGTGGCTAGTGGCTGGGGTGGCTTGGGTGGCTTGGGTGGGTATGATTGCATCGGTTTGTAGGCGCTGACTCAAATTGCATTACCAAG
TGTCTGGCTGCAGCTGCGGCTTATAGCAATCATATACACATATGTAACTGTACAGTTGACAATTGTCATGAGTCTTCGTCTGTGTGTGTATCGCCTGTCAGTCAAAAATCACCTGGGCAA
CCCTTGCAACAGAAGGCGGCACAGGAGCTCTGTGGATCCTGGCATGATGCAAAA
TACCTTTGCAAACGTGTTTTATTATTGTTATGGCTGTCATAGTTGGAATTGCTAAAAGGGGTATGC
TGTGCCATCGGCTGTTATGCATTTGAAACAAGCACATTGCGTGTGTTGAGCAATGAGAAGCTCTCCATTTCTGACATAGCGTAGGTGTCAAAGCACATCTGATTTTTTATGTACATATGA
AAAAGCTGCAGCAAAAGCTTAGTGGCAATCATAGCTTTAATTTTTAATGCTCTAGGGTATCTGAAAGTCTGTCAATCTTCGTTGTAGCAATGCATCTTATTGTATTTTTCTTTGTTGTTA
TTGTAGTTGTTGCTGCTTGTTATTTGCGTGTTCGTAAGCCATGTTATGACAATAATGTGCGATGCATGAGTATGCGTGTGTGTGTGTGTGTGTATGTATGCTTATGTCTCTGTTGTCCGG
GCTGTTTGTCGTGTACCAAAGCTAAAGTTACATCTTGTTTTTATTGTCACATTTGCCATAAAGGCAGCCCAGAGAGCAGCATAACAGAGAAAAGGGCGTAAAGAAGGGCGTCATAAGATG
ATGCCTAAGCTGATGCCACTGTATGTAGTACACATGTGTGTGTGTGAGGGAGACTATGTGTGTGTGCTTAAGCCAGACAAATCATAATCAGAGACAACAGCAGCATCGTCTGCAACGGAG
ACAAGCGACAACGACAAATATACCTTAATAACGAAACATGAGCTTGGCCTCGCACGGACTTTAGGAGGACTGTGAGCGGCGGGCGACTACGTGCCACGCCCACAAGCACCGTTCACGCAG
TAAAGAGGGGGAACAAAGGGTCGGGTCGTGGCTAAGGGGACAAAATTGCGATGCAAGAGGCGCTGCGTGCTCAGTCTGCACAAATAAAAAGCGCATATTTATCGGGTTTTTATTTTTATG
TTGCATACCACACGGCGCTGAAGAGCAGATGATAAATCCATGCACCATCCACCCACACATGCAGAGTAGTGTGGCATTATGGCAAAGTATAAAATAAGAAAGTTTAACAATAATGAAAGC
CGTTTATATTATGTACGTACTAAATGATAAAACTAACGGCCGCTGCACGTTAGACAAATGCATTTTGTAAGGCAGAATTTTATATCTAAATGATGATGATGCTGGGCGGAGGAAATGAGT
GTAATGTAATGGGCGTATAAGTGCACTAAGCAACTTGAATTAAGTAATTTGAAGTTTGAAGAGAGTGTTTTATGGCATTTACGAGGCAGACAATTGAAATTCATGGATGGTATATTTTAT
GTTTACAGACAGAAGCAGATGAATTTAATGAAGAATTTATACGACTGTGATTAAAGCCCTTGTTGATCAATTTATTTTAAATATATTATTTTAAATATTTGTTGATTTTTATAAAAAATG
TTATCCTTTTGAGTACCGCACGGAAATCACTCGCCAGTCGCATTGCTCGTCAGTCTCTCTCACTAATGCACTAATTCAGTTGTTGTGGCTTTTGCGTCACTAATTTGTACAACTAATTGA
ATTCAAAAATTTGTAAACCCACTAAATAGTTCAACACCAGTTGTATGAACGCATCATGTTTTCGAGTCGTTGCCGGCACACCTTAGCCGCACGCCAGGCGTGGCTTGGCAGTGTGAGGAC
CGTGTTGCGGTACACTGGCACGCTAGCATACACACTGCCACACACACACACTCGAACAATTGGTTGGCTAACCGTTAGTTGGCGCAACAATAATTGTTTTCATACAATTTGCTGTCTGGC
TCAACGCTTGGCTTTAGTTTTGGGGCAAACCATAAATTCTCGGCACGGACATCAAAGCGTATACGTAACAATTGCATATATGCATCGTCTGTGTGTGCGTGTGTGTGTCTGCTTGTTTGA
GTCCAGGCATGCATGAATAGACAAACATATTCGAACAAGCAATGCTTTTGTCAATAATATGCATTAATTAAGTGCAGACATAGATGGATGCCATAGATGGACGCAGAACGAGCGAAAGAG
CGGCCGAGCTCTCCAGGAACGGAAGTGCCTGGCCCATGCCTGTGGCATATGTGTGGCGTATGTGTGTGTGTGTAAGTGTCCGGGCTTATATGCGCATCAATTTAATTGGAATTTTGAACA
ACAACAACAAAAATGTAAAACTCAGCTCGAATGCAATTGTTATTATCAAAACCAGTTCGGAGCTCTCGCAACTGTCTCGAAACATAAAAATGCAATTTCCTTGCGTGCACAGAAGCGGTG
GGTTTATAGCGCAGGGTAGACGCTTGTGGAGTGGCTTGCCTTCTGATTGAAATGATGCATCCCAGCAGGTAGCCGTGTCAGGTTAGTGTTATTTGTGGTTGGGCTTTGAACAGGAGCAGA
AGAGGCACTGGAGCCATTTTTTGTTGCTGCTGCTGCTGTTGGCTCTGCAGCCGCTCCAGCTGATGTTCGACAAATAGTTGCGCAACTGACAAGCAAACTATGCCGGCCTGGAACTGGCAC
AAATACATACGCATACACACACACACACCCGTACAAACACACACGCACCCGCACACACTGTAAGAGGGTCGAAAGTAAAAGCAAAAGGAGCAGAAGAACCATGGCAGCTGCTGACTAAGG
CCCAGGACTCTCGCTCTTTTGTAATATGTGCATTGAGTGGACCCATCGTTTGTCACACGTCTCCAGAAGGGCGTGTTGGGCACTGCTCAGCTCAACGCAGCCCAAGTGCGACAGCGTGTA
GAGAGACAGAATCTGTAAATGTTGAAGCAGTGGCAGCGGCAGCAGTAGAAGCAGCAGGCCTGAAAAGCAATGCACAGTGGGGCAGAAACTCACTTAATTGGAAGAGAATTTTTAATATGA
CTCGCTGGTTTACTATTTACAAAAGTAAATAAACTAGTTGACGTCCTGGCATGGGAAGAATGTTGTACAACAAACAAGTCAACTGTAAATGAAAGCTGAAAGCTTTTGCCAAACCAGAAA
AAATAGATGTATTCTCAGACTGTTTATCCCAAAAATCAAGTTAAGGTTCTTAACATTTCTACTTAGTTAAGTAGAGTGTTTTAATACCATATTAATCAGAGTTCGTAGATTAGAAATGAT
TAAAGTTAACAACATTTTACAGCTTAAAAAACAATAATAAGAGAAGTCAGATATTGGACGATTGTACGAATCCCAGTCTTCTCGGGTCTTTCCACCCGAGTGGTCTTTACCAAATAATTC
CCTAACAACTATGTAAATATAATTTCCTTTTTTGATATTTTCTGTTTTAGGCTTATCTACGATACTTGTCCATTCCTTTAGTAAACCCTTAACTTCTCAGTTTGTCACTCATGGTCTGTC
TGTTGCAAGATATTTGCTCGGACTTCTCAAACACTCTGTCACTCGGGCTGTATGTCAGTCACTGGCGTTTGTCACAGTGCACCACAGTGAGTTGTTGGCTGAGTGCCTGTTGGTGGGGCT
AATGGAGTTTGTAAGAGTTGGCGCAAAAAGTGGATCAAGCTCCCGGTATGCTCGGCACAAAGGCATCTCGTTGCAAACCAACCAGCCAACAATTGCCAGCATGCAGTACATGCTCAGGCA
ACTTACAAATCGTTGTCGTTTTTGCAATGCAAACTACCTTACAGCCTTACACCTCCCAACAACCCAGCCTCCGCCCTTCCTTCGGCCCATTCTTTTTTTTTGCATTCAATGAGAGTCCTG
TGCTTGCCCGCAATGTGCATGTGGTTGCCAAGTTGGGCGACTGGCCCCGGGGCATGGGTCCTTTTCAGAAGAACCGACCGTGACGGGCCACAGCTACAGCGACGTTGACGCTGACGTCGA
CAGAGGCAGCGCTAGCAGCGTCTTTGTTTATATGCCAGCATTTGGGCGCTGTCTACATCCTCAGTGTGTGTGTGAATATTTCACTCACTCACGGTGAATGCTGGCTGATGTTGTTGTCGT
TGTTGTCGTTGTTGCTGAAGCCCTAAAGCTGTACGTGTGAGTGGTTTTAGTGTTGCTCTGGATTTTTAAGTTGTTTTCGTTGTCGTGAGTTGTTGTTTGTGTTGCCTTTTTTTCTATGTG
TGTTCGTCTTCAGCTGCAACATATGCACTTAAGCAACAACACACACACACACACACACAGGTACACATACATATGAGTTGGGGCAGAACCACGCACAGAACGCTGACACCAATTAGGGTT
AGCTGTCTATTGTGTTTGTTGTTGTTGCACTCCGTGCCTTGGTTGCATGTATACAGTAGCCACAAAACATAATTTTTGTTTAGACAACTCCGCAAAACTAGGACTAAATTGCTGCCCCAG
CTCCAGTTGCAAATCGTCGCCATCGTCGCCCTTCTTCTCCTGCTCCTGCTCTAACCTATGCCATAATTATCGCTTGCACAGCAGCAGCAACAACTAGAACAACAACTGCAATAACTGCAT
CAACTACAACCATCAGAGCTGCTGCTGTGGCAAGAGCGACAGCAGAGGCCTTTCCTAACGGTTACTAAAGCTGGCCAGCATTACCAGTTTGGTATAATTTTCAATTTTAATTTGGTGCAG
AGCGAAAACTTTTCAGCTAGTATTTTGTTGCTCTACCCTGTTCTGAATCAAGTTTGTTGGATAAATACATATATATATAAAATAATGAAGTATGGTATTAGAGTGTCGGATTTTAGACAA
TGTTTATGAAAACATTCCCGCAACTAATTCTTTTGTTGTGGCAGCTTAGCATATTGAATATGAAACCTTTTCGAGCTCAAATAATACTCTTAAAATTATTTGTATTCTTTTCCATGACTG
TTTGTATAAATTGGTTTAATTCCAAAACGTGTTTTATAATTTATTTAAATATAATATATATATTTATAGTAAATATACTGCATTAACTAAATTTAATATGCAAAAAACAATCATTAAGCT
TAGGGTATGCATTAGTCCATCACACAGAAAATGTTGTTGTCGTTCTTGTTGGTTGTTGCTGCCTCCGCATTGAATTTACACCCTAACGAGTTGTTGTTGTTTAAACTTGCACTGGTTGTT
GTTGTTGCTGTTTTTGTTGTTATTTTCACTGCCAACTCCAAAGAGTTTATTAGAAAGTTTTTTCAGCTGCTGCTGCTGCCTCTGCTGCTGCTGCTGTTACCGTTGCTTTTCATGTTGCTG
GTGGTGTTGGTGGTGCTGTTGTCGTTAGCCTTGCCTCGTTGCATACTGGTTGCCATTAGGCGGAAAGTTTTGGAAGTCGCGCACCGCGAACATATGTGGGAGATCCGTTAGCGCAGTTGT
GGACCAACATCCGAGAATGTGTGTGTAATTGTTGGGGTATATTTCTGTTTGAGGCTTATCGCTGGGCTGTGCTCTTCTCATGCGCCAAGCAAAAAAAAAAACAAACTATGCCACACAACT
TTTCCTAATTAATTTTTAATGTGTGTAAAATGTTTTGTAAATGAGTATTTACTTTGCTTTTAAACATCACTCACAGCAAGTTCTAAGCAGGCTAAAAAGCTGCTGTGGGTAGACTTTAAG
TGACATTTGTGACAGTCATGGAATGAAAATGATTCGAGTTATTGCAACTGCCGTTAATGAATGTATTAATCTATTGAAATATTAATTATACAAAAGGATTCGGATTCTGCTGGAAAATGT
GCCATTTATAGCAGGATTAAATATTCATTTGTACGTTAGCCGAGTATTAGCTGGACTATTTGATAATCTGATATGTTTTCTTGCTGCAAACTTTTTGCTTTCGGCTGACAGTAGATTTTT
TGTTGGTAAATTTAAACTTGAGTCTTCAGCAGATGGTCAGCATTTTAGTGTTGATTTTGTGCTCAAGTAACATACTAATTGCATATGGCGCTTGTTAGACCCAGTTACACAGATTCACAC
CCAGAAACATACATACACAAACTCACATTCATAGTGGACATGACACATGTACGTAGAACGAACAACTTGCAGCAAATTGGTGCAAGCAAAATGGAATTTGCAAAAAGGGAAGCAATCCAC
TCGAAACTCACCACTCAGCACCATTATGTCCATTATAAATGGAGCTGCTGCCACCAAACGAACTACCACCCAATCAACGACCACCCATCACCCACAATAGTGTGTCCTTAACTAAACGCT
TTTGCTTCTATCTCTCCCTCAACGCTGTCATTTCGCAGAGATTTGCGCTTCAATCGCATTGAGGAGCTGCCGGCCAATGCATTCAATGAACTTGGTCAACTGACGACACTATTTCTGGAT
GAGAACGAGCTGGCTTATGTGCACGAGAATGCATTCAAGGGTCTATCGTCGTTGCGGTTTCTCTATTTACATAAAAATCGCCTAAGCCGATTACCCGCCAGCGTCTTTCAGCAGTTGCCG
CGTTTGGAGACACTGTAAGCAAACACAGTTTCAATTTTAAATCGAGTTCGAGCTTAATTAAAAAACTCACCATTTTCTTTTCATATCTCTATGTAGCTTTCTGGAAGACAATGATATTTG
GCAACTTCCACCCGGACTCTTTGACAATTTACCCCATTTGTATAGCCTGTAAGTTCGTTTGCTTTGCCACCCCTCTTTCGGTTTCCCTTCGGCTTTCTCTTTCCAGCAGGTTATCTCAAC
GATTTTTCGGTTTATTTTTCATTTGGCTGCAGTTCATTGCGCAACAACAAGCTGACAAGTCTTCCATTGGATATGTTCAACAAATTGCACAGCCTGAAGCGTTTGCGTTTGGATGCCAAC
CCGATTAATTGCAATTGCGGGGTGTACTCCTTGTGGCGTCGGTGGCATCAGGATGCACAACGTCAACGGCTGGCCATCAGTTTGAACTGTGCTCAACCGTCTGCACTGCAACGTCAGTTC
AGTTTTAGTGACCTCTCGGAGCAGCATTTCCAATGCGGTAAGTGGCAGCAACAGGAACAGCAGCAGCAACAGCACCAACACCAGCACCAGCAACAGACACTGTGGGTGTCTATTGGCCAA
ATGACGCCAGCTCGTTTTTCAGACAGCCAACGAATGAGCTGTTTAAAAATTAATCAGCTCTTGCAACACAGCCGCAAAAGCATTTCAAAGATTTTCTATAGGGAATTGAGTGCTTGCGAA
ACACGATGCTTACTAACTTATAGCAATACAAACAGTAAAAGAAAATCATTTAATTAACTGCTTAAAATGTGCAAGCAAAACCACTTTGACAGTACATGAAAGCTATTCAAGTAAGAATGC
TCTATCAGGAATAATCGACCAGGGTATACCCTAGCCAGGCTGTGAAAAATATTTAATCAATGAAAACACAAGTTTTTTATGTGTCCAATCCAACTTTAAAAGTTTTTACATACTCAAATT
TAAATAGTTTATTTGCGGCTTTTCAACAACAGCACAATTTGCTTAAGCTTGCTTGTAGCTCGATGTCGAATTGCTGTTCAACTGCTATAGTTGCTATAGCTATATATAATGCAGATTCAC
TGGCAGTTATTATAATTTTAATAATATTATTCATGTATGAACTTCGATTACTACACACAGCCAAGCCACGATTGCTAGAGGGACCCCAGGATATGCAAGTTCAGGCGGGTGACACTGTGG
ACATGGTCTGCAATGTGGAGGGCCAACCCAAACCGGAGCTCACCTGGATGCACGACACCAACGAGATCGGTGTAGAGCAGTCGCCGCGTATTCAGATCCTACCCACTGGCTCATTGCGAA
TCAGTGGCGTCCAGTCCAATGACATTGGCATCTACGAGTGCATAGCACGCAATGAAATGGGTGAGATCAAATCACAGCCCGTACGACTGATGGTCAGCAATGTGGACAGCCAGCAGGCTG
GCAGCAATCAGGTATGGGCAGCGGATGTCGCTGCGAATGCGATTGCGGATGTGGATACAACACTGGCGCCACCGCGCTTCACCCATCAGCCGCATGACCAAGTGGTGGCACTGCATGGTG
GCGAGCACGTGCTGTTAGATTGCGCCGCCAGCGGCTGGCCACAGCCAGACATACAATGGTTCGTCAACGGTCGCCAGCTGACCCAGTCCACGTCCACACTGCAGCTGCAGGCGAACGGCA
GTCTCGTTCTGCTCCAGCCCAGCCAGTTGACAGCGGGCACGTATCGTTGCCAGGCACACAATCATCTGGGCAGCATTGAAGCCACCGCCCGCATCGAAGTCAAGGGTAAGTCCTATCCAT
TTGGGGCGTAATAGGTCCATATTCGGTTTACTACTGCTACCCCGCTCCATGCTCGTATATTGTATATCTGTCTGCGTTTCCATTTCACAGTCACAACTGTCGCGTTTAACGCAATTTGCA
GTCGATTTAATTTCGTATTGGGTAGCCAGCTTTATAAAACCAACAAATGCTCCAACTGGTACTTGGTTATACACTTTTTGTTGTTGTTTCGGTTGCCTATTAGCGTCATGATTTAAGCCA
ACTACCATTGGCTTCAAATAAAAGTACTTTTATTGCAGACCATGGGGCAAGGCTTAAGATTAATTGGTCGGGCAAAGAGTTTCGAATGGTGTTGTTTTTTTGTGTTTTTTAGTTGCCAAT
GGACAAAGGTATTTCCTATTTATGCGGAGCTTTAATTGTGTGCAGCTTAACTGAAATATAAATATATAAACATATGTATATATATATATATATACGTTCAGAGTTTTTATTTAACGTTCT
GACTGAAATCTATGTTTTTTCTTTTTCATTTAACTACAATTTATTGCTAGTTGACTATTTTGTTCACCTTTATTGCTTTCCATTTCATATTTAATTGTATATTTTGAATTGTTTTTTTTT
TTTAAATCAACTAAACACTTTTTACTCAAAGGGAAATGAAATTCTCTTCAGAAATAGCTTTAAAATCATTTTAATTTATAATCACACGACAAAGCAAGCATATTAATATTATTATACTAT
AAGCGAGTAGTTTAATTATGTTGGTGTATAATATTTAGTGTACTATTATAATTATACAGATCCATATTATGAGCAGCACGTAATAACGATTGCCATAAATTGTGAACTGTATAAGTAGAT
TTAAACTTAAGCTTTAATATCTTTAATTTCTTAGCCAAGCTCTGCGACGTGACTGTACTTTTTATGGCATTAAATACGGGCAGCAGTTTATGGAGTGATGGGGAGGGGCAGGCAGGTGGC
GTGTGTTTCATAAATGTATATATTGTGCAGTCAGCGCCTTAATCACAATGGCTCATTATAATTTGTGGTCACAGCATAAAATGAAGTGCGAAATGCGCGCATTATTTTGCAAATTCAGTG
CAAAAATTATAAACTATTTTGCACTCGACGCATATTCCCGAGTGTAGCACGCACTTCAAATGGGGCAGGGAAAGCGGCAAGGGTATGTTGAGGTTGCTGCTGCCTTTGGTTACCATAATT
AACCCTGCAATCACACACACACACACGAGCGCAAGCCAGCGGCAAACAAAAATGGCGACCAGCTTGTTTGAGCCGCGCCAAAAAGTATGCTATGGAAATTTGGGGAGCGATGGAGTCAAA
TGCAAAAACGACAACTACAAAAGAACGCATAGAAAACTGACCAGCAGCTACAATTTTCCTTTTGTTGTTGCTGGCACGACTGGTGCTACTGCTGCCGCTTTTACTGGTGTTATTTGGAGC
GTTAGAAATTGCTCAAATCACTCAAATACGCCTCGTTGCCAACTCTCGTTGCAGATTTACCCGAAATTTTAATGGCACCGCAAAACCAAACAATCAAACTGGGCAAAGCATTTGTGCTGG
AATGCGATGCCGATGGCAATCCTCTACCCACCATAACCTGGCAATTGAATGGAGCTGCCTTACTCTCTGGCAACACCGTCGACCTCCTGCTGGAGAATGAGAACACCGAACTGGTGGTTA
GCGCAGCCAAAGACCACCATGCGGGTAAGTGCAACAATATCCCTCTCCCTCTCTGTCCCTCCCCCTCTCTCTCTCTCTCGCTCCCTCTCTCTTTCTTTCTGTCTCCCTCTCGATATTTAC
TTGCATGAATGTATATGTAGAGCGGTCGTTTTAAATTGTAGGTGTCTACCGCTGCACGGCGAGCAATGAGAATGGCGAGGTGAGCGTGGAGGCAACCATTAAAGTGGAGCACTCACAAAC
ACCGCCGCGTTTGGCCATTGAGCCCAGCAATTTGGTGGCCATTACGGGCACCACCATCGAGCTGCCCTGCCAGGCCGAGCATCACGAGACCGGACTTCAGGTAAAAGAAATAAAACTTGA
ACGCCACTTGTTGACGTTTCCGTTGTCCGTCTTCAACTTTGCCATTGTTTTTGCCTTTCGATTCACAGATTGTTTGGCGACGCGATGGACGCCTTATCGATCCCAACGTGCAATTGACGG
AAAAATATCAAATAAGCGGCACGGGCAGTTTGTTTGTCAAGAATGTGACCATCTTGGATGGCGGACGGTACGAGTGTCAGCTAAAGAATAAGTTTGGAAGAGCAACAGCCTCTGCTCTGG
TTACCATCAGGTGAGTGGCGGAGAAAAAAACTTGCACATCGAAACGCAAGGAGCCAAGTTTTTGCTCAAACGGCAAACTACTTTGGCAGCAGTCTCAAAGTAAACCTAAAGATGCCTTGC
CTGCCAGATGGCAAGCGCACTTAAAACACATTTAGGGTAGCGAAAAAAATGCTGGCTTAATTAATTGAAAAATAGTTTGGTAGCGCATAAGAGCAACGCCAAAGTAAGCCAAATATAACA
GTACTTCTGGTCAAACACTGTGCTGCAAGCACATATCAAAAGCAGAGTTTTTTGAGCGATTTAACTTCTCGTAAAGTGAGTTGTGAAGAGCAAGATGGTGCGAATAGGTCCGCTGTGCAC
TTTCGAAACAAGCCTTAAAGCAAACTAGTTAAAAAGTTTTCAGACTGAAGGCAGAACATGATTTTTGACATGAAATGTGCAACCATTATCTATATAGTAACTAAACTTCGACTTTCTCAG
ATTTGCCTTTTCGCAAAAGAAAGGTATTTTAGTTTGTAGTGTAAGTTTGCCTAGGCCCATAAGCAGAAAGCTGGCAGGCAAATTAATTATTGATGAACTTTTCTTCAACCTACCTTAATT
GCCTTTCACAATGCTCGCAAAGCAGTCTTGCTTCACTGTGCCGCTGGCTAAACTGCATATAAAATATGCACTAAAAGACATCAAAAAGCGGCGACGAAAGCACCAAAGTTGCTGTGCCAG
TTGGCGTTGGCAAAAACGTGCCAACACAGGACTCGAAACGTGACAACCAGACACAGAATGAGAGACAGAGAGACAGTGGGAAAAATAGAGAGAGAAAGAGAGAGATAGCGACTAGGAAGA
AGAGGAGAGAAGTGTTCTCTGAGGATGAGACAACCGCACAAGTTGTCCAAATTGCCCAAATTGAAATTGAGTTGACAACTTGTTCATGGGACTGAGAAGAATCTAGTTTTCTTTAACTGA
TTCTATTTTTGTATGTGTGTGTGTGTGTGTGCCTGTGAGTGTGTGTGTATTCGTTTGTTCCATTCAAGATGGTTGCCAAATGGGCCTGTGTGCTGCATACATGTAGCCGTAAATCAATTT
GTTACCCTGGTCATGATAAAGCAAAAGCCGCACAAAATGGTAAACCAAAACAGGCCCACAAATCCTGTTCAATTCGAAGGCAAGAAAAAGGCGTTGCTTACGCAGCAATTTTTTAAATGC
ATAATGCAGAAACCGCCTTTATAACAGTAAAAGCTATAAGGCTGGAAGCAATCTTCCAACTTCCATATGACCTGCTTACTTCTATGAGATTGGGAGTGCTGTGTTCTCCGTACGCTTTGT
TTGCACGCGTCATTTAGTTCGCTTGCCAGATGCAGCAGCAGTGGCAGCAATAACTGCTGCTGTGGCAGGATGCTGGAGCAGCTTACGTTGCGTTGCCGCCACCAGCATTAGAAACTTTAC
TCATTACGCTGTGCCAACCTCAGCCGCTAGACCACAGCAAAGAAAACAAGCAAAAAATTTCAAAATAAAAAAAAAGGAGGCGGCGTGCAAACGTTAAAAGTGAAAAACTATGCTGAGTCA
CAGACCAAGAATGGCTAACGGAATTGTGGCGGCCGGGGGTGGCACCGTCGCTGAGGCCAACAAAAAAATGAGCGAAAACCGCTGAAAGCCTGCAGCAACAACAATTACGACGACAGCAGA
AGCAGCAAAAGGCAGTATCTACTGAAATCCGCCTAAGTTGTGGGTAATGCTGGCGTAAAACAAAAGCTTATCCTGGGATGCTGGGATGCTCGGGGTGATTGGAGACGGTGAAAATGGTGC
CGGGCATGCTGGCTCCGGAAATACGTTGCCATTGCCCCAGCATGTGGCATACACACTCACACACACACACATAAAGTGGCTGAAAAGCCAAGAAAAGCCACACACATGCATGCTGAAGAA
GCTGGCAGCTGGACTTTTTAGATACTCTACAGCTAATATACAAGGAACTTGCGTGACCCATATTAAAATAAATATTAATATTATTATTTTAAACAACTCTGGTAACTGTGTTAGTGAATA
CAAAATATGATATGGAATGAATAAATTTATAAGCATTAGCTTTAGAAATAGCAGTAAGTAAACACTTCATCAGTTGAACTTAAGTATTTCGGAAATGAAACCCTTTTGACCTTTGTGCAT
AATTTTCAATTAAGATTAACTTCTGAGTGGAGTAACTTGCTTTAATACAAAGAGAGTGAGATAGAATTTAGAAATAGACTTGCATACCGTTCTGTCAATAATTGTATAAAAATCTTGGAA
TTAGTGAGTAAGCATGCCAATCGCCCATCTCTGCTTGCTTTAATTCCCACTTAAGTTTGTAAATACGAGCCCCAACTACTTAAACAACAAATTCAAAGGACCACGTTAAACAACTGTTTA
GGGTATTTACAAACACCCTGGTGTGCCAGATAAAGCGCAACCACAAAATGGGAGAGAAGGAGGGTGGGAGCAGGTGCAGACGATGGCGGTGGCGGTGGCGGTGGCAGAGGAGATGGGGAG
AATTATATGTATGTAGTTGGCTGGCAGTGGTTGCCATTTAGTTGCTGTAGTGCGATGCGATAGTTGATAGTGGTAAGCCGTGAGCAGTGGCTGTGGTGCAACAGGGTGTATTATGGTCGT
TAAGTTATTACCTACAACGACGACAATGGCAAAGTTTACACAGCGAAACTTTCCAAAGGGAAATTCCTTTAACGGCAATGGCAACGCCAACTGAGAATGAGAGGCATGAATTGTTGTTAA
TACCGCCGTTGTTGTAGCCTGGCACCAGAGCTTGGCGCGGATTTTCCCTTTTTTCCAACAAAACCAAATAACAAAAAGTGTGGCATAATTCTGTTCCTTGCCAGTTCAGCGACTGCCGCT
GGGTTAAAATCAAAAAAAGAACCAGACTAGAAACTAAAAAGAAAAAATATTTAGTTTACTTCTGGATTTTCATGAGACAACGACAATGAAGTTTTAAGGAACTTCTGACGCTTTGGAAAA
ATTAATTGCAATTAAAGTGTGGAATGTAAAAAGTTGGTCTTGCTTCATTTTTTTTTTGGTAATATTAATTAAGGAATTTGCTTTTGTGAGATAAGCGACAGACTGGTCGCTTAACATTTG
TAACGCTTTGAATTTTAAACTGATTTTAGTTCGTAAATAGTTCATATTTTCCACTGCGATGGCTACGCTTTGTAGGCATGACTAGATATCTACAAATGGTTATAGCGGCTGTTCTGCCTT
TAAAATCCCAAATTTCTTTCTTTCCAAACTTTAAACTTATCAAAAAATTATCTCTTTGCAGAAACAATGTAGATTTGGCGCCTGGCGACCGTTATGTGCGCATTGCCTTTGCCGAGGCGG
CCAAGGAAATCGATGTGGCCATTAACAATACACTGGACACGTTGTTCGCCAATCGTTCCACTCGAGCACCACCCAACTATGGCGATTTATTGCGTGTCTTTCGCTTTCCCACCGGCCAGG
CCAGGCAGTTGGCACGTGCCGCGGAAATCTATGAGCGCACACTGGTGAATATTAGGAAGCATGTGCAACGTGGCGATAATCTGACCATGGAGAGCGAACGCTATGAGTTTAGGGATCTGC
TGTCCCGTGAGCATTTGCATCTGGTGGCGGAGCTGTCGGGCTGCCAGGAGCATCGCGAGATGCCCAACTGTACGGATATGTGCTTCCACTCAAAATATCGCAGCATTGAGGGCACCTGCA
ACAATCTAATTCATCCTACTTGGGGTGCATCCTTGACGGCATTTAGGCGACTGGCGCAACCCATCTATGAGAACGGTTTTAGCATGCCCGTGGGCTGGACGAAGGGTGTCCTCTATGCAG
GGCATCCAAAGCCAAGTGCACGTCTCGTCTCGACCTCGCTGGTGGCCACCAAGGATATTACGCCCGATGCACGCATTACCCACATGGTCATGCAGTGGGGCCAGTTTCTGGATCACGATC
TGGATCATGCCATACCCTCGGTTAGTTCGGAAAGCTGGGATGGCGTTGATTGCAAGAAGACTTGTGAATTTGCTCCGCCCTGCTACCCCATTGAGGTGCCCCCGAATGATCCACGCGTGA
CAAATCGTCGCTGCATTGATGTGGTACGCTCCAGTGCCATCTGTGGTTCTGGAATGACCTCGCTGTTCTTCGACGGTGTGCAGCATCGCGAGCAGATCAATCAGCTGACAGCCTATATCG
ATGCCTCACAGATTTATGGCTATAATACACCCTTCGCCCAGGAGCTGCGCAACCTGACATCCGAGGAGGGACTACTGCGCGTGGGCGTGCACTTCCCCAAGCAGAAGGATATGTTGCCGT
TTGCTGCGCCACAGGATGGCATGGACTGTCGCCGCAATCTGGATGAGAACCAAATGAACTGCTTTGTCTCCGGCGATATACGGGTCAATGAGCAGGTGGGTCTGCTGGCCATGCACACGA
TCTGGATGAGGGAACACAATCGCATTGCGAGCAATCTGCACAAGATTAACAAACACTGGGATGGCGATCAACTGTATCAGGAGGCACGCAAAATTGTCGGCGCTCAGATGCAGCACATCA
CCTTTAAGCAGTGGCTTCCCCTTATCATTGGCGACAGTGGCATGCAAATGTTGGGCGAGTATCGTGGCTATAATCCTCAGCTAAATCCAAGCATTGCCAATGAGTTTGCAACGGCTGCAC
TGCGTTTTGGACACACCATCATTAATCCTATATTGCATCGTTTGAACTCAAGCTTCCAGCCCATTCCCGAGGGACATCTGCAGCTGCACAAGGCCTTCTTTGCTCCCTGGCGTCTGGCCT
ACGAGGGCGGAGTGGATCCTTTGTTGCGCGGCATGCTAGCTGTGCCCGCTAAGCTGAAGAAGCCCGATGAGAATCTCAATATGGAGCTCACGGAGAAACTGTTCCACACGGCACACGCGG
TAGCTCTCGACTTAGCTGCGATCAATATACAGCGTGGACGAGATCATGGCATTCCCGGCTATAATGTGTATAGAAAGTTCTGTAATATGACCGTCGCACAAGACTTTGATGATTTGGCCG
GGGAGATTAGCAATACGGAAATCAGGCAGAAGCTACGTGAGCTCTATGGTCATCCAGACAACATTGATGTATGGCTAGGTGGTATACTGGAGGATCAGGTAGAGGGCGGCAAGGTGGGTG
CGCTCTTCCAATGCTTGCTGGTGGAGCAGTTCCGTCGTCTGCGTGATGGTGATCGTTTCTACTATGAGAATCCGGGCATCTTCCTGCCCGAGCAGCTCGTCCAGATCAAGCAGGCCAATT
TGGGACGTGTGCTGTGCGATGTGGGCGATAATTTCGATCAGGTTACAGAGAATGTGTTCATCCTGGCCAAGCATCAGGGCGGCTACAAGCAGTGCGAGGACATCGCCGGCATTAATCTAT
ATATGTGGCAGGAGTGCAGCAACTGCAATAGCCTGCCAACCATCTTTGACTCCTACGTTCCGCAGACGTACACCAAGCGCAGTCAGCGCAATAAGCGTGATGTCCACAGCTCTGAGATGG
AGCTGCCCGCTGCCGAAAGTTATGACAGCCCCCTGGAAGCTCTGTACGAAGTGAATGAGGAACGCGTTAGCGGCTTGGAGGATCTTATTGGGAGCTTCCAGAAGGAGCTGAAGAAATTGC
ACAAGAAAGTGCGCAAGCTGGAGGATTCATGCAATGCTGTTGATGCTGAGCCCGTAGCACAAATCGTTCAACTGGCGCCCGCACCACTGCCCGCCGCCGTGAAGCCTAAGCGGAGCCACT
GCGTCGATGATAAGGGCACCACGCGATTGAACAACGAGGTTTGGACACCGGATGTGTGCACCAAGTGCAACTGCTTCCACGGACAGGTGAACTGTCTGCGTCAACAGTGCGGCGAGGTCA
GCTGCCCGGCTGGCATTGAGCCACTGACTCCTCCAGAAGCCTGTTGTCCACACTGCCCCGTAATGCCAACCAAATCCAAGGTGGTTAAGTGA

Retrieve as FASTA  
CDS
Send to BLAST
.........1.........2.........3.........4.........5.........6.........7.........8.........9.........0.........1.........2
ATGCGCTGGCACTGCTGGCAACTGCTGGCTGCTGTTGCCGTGTGCCTGGCCAGCGTTGTCCAACTCGCCAACGGACAGTGGGTGAACTGCCCCAGCGGTTGCACTTGCCTCCCGGGCACA
GTTCGCTGCATTCGCGCCCGACTCACCGCGCTGCCCAAACAACTGCCAAAGGATATCAAAGTGCTGTAAGTTCAACGCGTCGAGAGGTGTTTTTTTTTTTGGGGGGGGGGGTTTGGGAGT
CTGGTTTGGTACTCGCTGGTTTGCGTGCATAAATCATAGCAAGTTTGGCTTCTGGCAAATCCATAAATTAGTTTTTAATGTGCTTCTCTCACTATCACTGTCTCTCTGACGCTGATTCTG
ATGCTGAAGCTGTTGCCGGCGTTAATTTGAAGACTTCCTCCAGCAAACATCTGCTTCCCCCTTTCCTTATCCACCATCCCCCCATCTGCTGCGTGTTGACTCAATTAAACGTTGTTTAAC
TGTGGCAGCAGCGAGAGAATTTGTATATTTATCATATCGCGCGGCATCCGCGTCGCGATTTGTATGCATGCGAAATATTTCACTGACGCTGCATTTATTTTCCAAATGTCAGCAGTTTTC
CCCATGAATTTCGGCCAAAGTTTCATGCAGAACAGAAGGGGTCTGAGCGGGTGTCTGGGGGTGGCTCGACTTAGTAAAATGTTTGTGGAGCATATGCATATTTATGCATGGGATAGGCTG
CCACCAATTCCATGCCGCATGTCGAACTCAGTGTCGACTGCAAAAAACAGTGCAAGAATAAAGATGTCTGTACTAATGTGCAACGAATTCAATTTGTGACAGATTTGCAGTTGCAAGTTG
TCTCTGCATCTGGCAAGTGGGCGTGATAAGAAAATGATAATTGTCATTTGGGAATGAGCTCAACGGGAATGAGTAAATAGAGGTTTATTAATTTGCTGTTCATTCCGAATTAAATCTGTT
TGCCTGAATTTATATAATTTAAATGAGTTCTCTTTGTTCTTTTAATTGTTAACTATTATGCTTTTGATATTAAAAATTTGATTGAGTTTCGGTTCAAGCTATGGCAGTTTAAAATGTTGG
TAGGGAATGTCTAGAAATATTACTATAATAGTAGAAAAATTTATAATATCCTTTCTCTCAGAGTGTTTACTGTAATCTACCCACATCATCTGATTAAATCTCAATTAGTATTTTCTACAA
TTTTTCCACACATTAGATTCTAAAAATATATATTTTTCCACTCACTTGCCCTTTAGCACGTGCAACTTTTATTTCTTTTCAATCAACCTAAATTTATAGAAAAGATGTTGTATGCATTAT
TAATCATGGGTTGCCAGCAATAATTGCACATTTCATTCTTGCGTTTTAATTTGTTTTGTGACAGATTAAATTAATTTGTTGCCTTTTGTTTTCCGACAGTTTTCTGTTTAGCTAAATGTG
CCATATAAATATAATTGTTGACTGCCTGCAGCAACAATTTCGTATGTTTGGTAGTTTTTCACTTCCATTGCTATGTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCT
CTCTCTCGCTGTCTCTCTTTATATATGTATTTGAAATTCAGCATTTAACACATGTCGCACATGAAGCTTCCAGCAGGCCCCAAATGCATTAATACTAGTGTCATACTAGAGATATGCATG
AGATTCGTGATTCAGTTTGTGGAACGCACATGCTATGATCTTGAATTGTGTGGANNNNNNNNNNNNNNNNNNNNNNNNNGTGGATGGCACTAAGGGGTATATTAGACTTCAGCTAAAAAA
TATAGAAAAATAATATAAAAAATTATATAGCAAACTAGTAGAAACGACACTTTTTAAAATTTCTCATGCTTAAATTGTTATAAGAGTATTTGAGATAAGATTTCCTTACCATTTTAGCGA
AGGTACATTTTTTAAAAATTAAATTTCAGGACAACTTAAATTAACATTTTGTCACCCATTTGGAAAAGGTAGTGTAAAGCTAATATTTAAAATATTGAAAATATTTTTGAATATATTATC
CAATTTTGCTTAGATTTCGTGGCAAACGTCGATATTCAAGCACTCTCTGAAATACCATTTCAATATAAGCTGATTTATTTGAATGCAGTTGCATTAAGAGCTTTTGCAGTTAATTCTATG
TTTACTTTTTGCAAATATGTCCAAGTCGAGTAAGATTAGCAGTTCTTTCATTTGTTTGCTTTAATTTTGTTAATGGCTTCAAATTTGTTTACACTTTTTGCTCGTGTGAATCTGTAGTTG
TGTGCCTCATGTGATGAAAAGACTAATATGCATGAGTGTGAGATAAAAGAGAGAGAGAAAGAGAGAGAGAGACAGACAGAAAGAGAGAGAGAGACACAGATAAAGACACAAGCAACAAAT
GCAAAAAAAAAAGCCAGATTATATTTAAAGATGGTGCACACATAAGAATTGAAAAGGCACAAGTCAAAAAACAAATGTAGAAGATTGAAATAGGATGATAAAATCGGACTTTATTTTTTG
TGTTCTGCCATATATAATATGTATATATTTTAATATATGCTGTTCCCTAACTCACCTGTATGTTTGCAATTCAATTTAAAGTGAATTTTCCATATTTAACTGTGGAAATGTGCCAAGGCC
TATGCCACACAAGTTTCCTTTACTGGCTGTT
CCCATAAGTATGCTATAGTAACGAATATTGAAAGAGAGAGAGAGCGAGAGAGAGAAGGAGGGAGAGGGAGTGGTAGAAGGAAATGAGGG
AGACAGTAAGAGAGGGTAACAGTAAAAAAAAACGCTTGTAGCCAAAGTAAATGTGCGCCAATTGTAGAGCTAAAGAAGTGGCTACTGCCGCTC
GAGGAGTGCGCCTGGGAAAAATATGCT
GTTCGACCAGGCGGCAAACTAAGTAACTAAGCCAAAGTGGCGCGCCACGTTTCCTGCATTCCATTTTTGAAATGTGATAGACAGACGCATAATAATGTTAAGGTAACAGCTTCGGCAGAT
GTCGATGGCGTAGAGTGATGGGGGAGGTGATT
GATATCGTTTTATAAAAGCGCCAAATGGTAATGTGGTTAGCAACGTGACTAAGATTAAGTATCCCGTTAGTCTTATGTACAGGTAGCT
AAGTAGGTAAGTAGTTGGTGTGGGGGCAAACGACGCGGCCATTAATACAGCGGAAGTAAACGGAAGGCTGCTCTTGCAAGGCAAACGTATCAAAAGGAAGCTAAATAAGTGCATTGAAAA
AT
CTCGACATTGCATTGCTCTTATCGCTGGCGGCTGAATGCCACTTTTCTGTATTCTTAGCTGCTAATGTTTTTGTGCCACGTTTTCCACATTTTCCACGTTTGCCACGCTGCCGCTGGC
CACTGCGATTGCCATCCGACATTGCTACAGGTGTAAATGTGCACACACGTGTGTAGGTATGTATCTGTGCGTGTGTGTGTAGGTGTGCTGGCTAAGCTGCTTTCAGCGGAGCCCAGCAAC
TGTTTGGCAACAGTTCTATAGTTTAAGTGGCGCCCCAGCAGGAAAGTGGGCTCCATTTTCAGTTATAATTTTCACGTTTACAGTCGTGTGTGTGTGCGTGTGTGTGTGGGGGTGTGTGGG
GTTGTGTGGATGTGTGTCTGCATGTGCTTGTATTTCTGTTGAAATAAATTTTATTTAAACTTTCGTCTCTTATTTTTGGCAATTTTTGCTATGTTTTTAGTGATTTTTTCGTTGTTTTTT
TTATTTTATTTTTATTATTTTTTTTTTGTGCAGTGTAATGTGTGAAATTCAATTATACTGCAGGATTTATATGTTGAGCATGGCGTAGTTTTGGCGCTTCGAGTTGAAGCCAGCTGAAAT
TTTATTTGAAGCGTCGAAAATACATATATATATATATATATATATAT
AAAGAACTTTATGCATGCAGCAACTCCAAGGTAATTATTTAAAGTGCTCTAAGTACTAAGATAATAGCAAAGG
CCAACTGGACACAATTACATTTACAGTTTAGCACACACACACACACATTCTCCTTAGAGAGTTGGCTAATGTATGTGGGCATGAAGTAAACAAACAAATCAAATTGAATCCCAGCTACAG
CTCAAAACAGTGGCACAGCATTTGGGGCAACTGCAGCTGCGCAGAGGCAGAG
CAAGACTGGCAACAATATAAGCCGGGCGGGGCTGCTGAGAGCAATACAGCAGCAGTGGCTTTTGTTTA
ATAA
TTGCATCGGTTTGTAGGCGCTGACTCAAATTGCATTACCAAGTGTCTGGCTGCAGCTGCGGCTTATAGCAATCATATACACATATGTAACTGTACAGTTGACAATTGTCATGAGTC
TTCGTCTGTGTGTGTATCGCCTGTCAGTCAAAAATCACCTGGGCAACCCTTGCAACAGAAGGCGGCACAGGAGCTCTGTGGATCCTGGCATGATGCAAAA
TGAACAACGAGGTTTGGACA
CCGGATGTGTGCACCAAGTGCAACTGCTTCCACGGACAGGTGAACTGTCTGCGTCAACAGTGCGGCGAGGTCAGCTGCCCGGCTGGCATTGAGCCACTGACTCCTCCAGAAGCCTGTTGT
CCACACTGCCCCGTAATGCCAACCAAATCCAAGGTGGTTAAGTGA

Retrieve as FASTA