Entry information : HsNOx01 (Nox-1 / NOH1 / NOX1 / MOX1)
Entry ID 5410
Creation 2007-06-14 (Christophe Dunand)
Last sequence changes 2010-12-03 (Myriam Duval (Scipio))
Sequence status complete
Reviewer Catherine Mathe
Last annotation changes 2015-12-10 (Catherine Mathe)
Peroxidase information: HsNOx01 (Nox-1 / NOH1 / NOX1 / MOX1)
Name (synonym) HsNOx01 (Nox-1 / NOH1 / NOX1 / MOX1)
Class Ancestral NADPH oxidase    [Orthogroup: NOx001]
Taxonomy Eukaryota Metazoa Chordata Mammalia Hominidae Homo
Organism Homo sapiens (human)    [TaxId: 9606 ]
Cellular localisation N/D
Tissue types Brain
Mammary gland
Inducer N/D
Repressor N/D
Best BLASTp hits
Perox score E-value HsNOx01
start..stop
S start..stop
MmulNOx01 1070 0 1..564 1..564
CfaNOx01 999 0 1..564 1..564
RnoNOx01 957 0 1..564 1..563
MmNOx01 955 0 1..564 1..563
Gene structure Fichier Exons
ExonStart..EndSize ExonStart..EndSize ExonStart..EndSize ExonStart..EndSize
N° 1 100129084..100129128 45 N° 2 100125708..100125803 96 N° 3 100118474..100118584 111 N° 4 100118148..100118232 85
N° 5 100117658..100117809 152 N° 6 100117381..100117562 182 N° 7 100117160..100117292 133 N° 8 100106222..100106314 93
N° 9 100105140..100105375 236 N° 10 100104761..100104923 163 N° 11 100104269..100104415 147 N° 12 100103619..100103743 125
N° 13 100098941..100099067 127  
complement(join(100098941..100099067,100103619..100103743,100104269..100104415,1 00104761..100104923,100105140..100105375,100106222..100106314,100117160..1001172 92,100117381..100117562,100117658..100117809,100118148..100118232,100118474..100 118584,100125708..100125803,100129084..100129128))


exon

Literature and cross-references HsNOx01 (Nox-1 / NOH1 / NOX1 / MOX1)
Literature Suh Y.-A., Arnold R.S., Lassegue B., Shi J., Xu X., Sorescu D., Chung A.B., Griendling K.K., Lambeth J.D. Cell transformation by the superoxide-generating oxidase Mox1. Nature 401:79-82(1999).
Protein ref. UniProtKB:   Q9Y5S8
DNA ref. GenBank:   NC_000023.1 (100129128..100098941)
Cluster/Prediction ref. UniGene:   Hs.592227
Protein sequence: HsNOx01 (Nox-1 / NOH1 / NOX1 / MOX1)
Sequence Properties
first value : protein
second value (mature protein)
Length (aa):   %s   564
PWM (Da):   %s   64681.93 Transmb domain:   %s   o5-27i47-69o104-123i168-190o205-227i397-419o
PI (pH):   %s   8.59
Sequence
Send to BLAST
Send to Peroxiscan
.........1.........2.........3.........4.........5.........6.........7.........8.........9.........0.........1.........2
MGNWVVNHWFSVLFLVVWLGLNVFLFVDAFLKYEKADKYYYTRKILGSTLACARASALCLNFNSTLILLPVCRNLLSFLRGTCSFCSRTLRKQLDHNLTFHKLVAYMICLHTAIHIIAHLFNFDCYSRSRQATDGSLASILSSLSHDEKKGGSWLNPIQSRNTVEYVTFTSIAGLTGVIMTIALILMVTSATEFIRRSYFEVFWYTHHLFIFYILGLGIHGIGGIVRGQTEESMNESHPRKCAESFEMWDDRDSHCRRPKFEGHPPSWKWILAPVILYICERILRFYRSQQKVVITKVVMHPSKVLELQMNKRGFSMEVGQYIFVNCPSISLLEWHPFTLTSAPEEDFFSIHIRAAGDWTENLIRAFEQQYSPIPRIEVDGPFGTASEDVFQYEVAVLVGAGIGVTPFASILKSIWYKFQCADHNLKTKIYFYWICRETGAFSWFNNLLTSLEQEMEELGKVGFLNYRLFLTGWDSNIVGHAALNFDKATDIVTGLKQKTSFGRPMWDNEFSTIATSHPKSVVGVFLCGPRTLAKSLRKCCHRYSSLDPRKVQFYFNKENF

Retrieve as FASTA  
Remarks Complete sequence from genomic (chromo X, 12 introns), 11 mRNA and 80 ESTs.
DNA
Send to BLAST
.........1.........2.........3.........4.........5.........6.........7.........8.........9.........0.........1.........2
ATGGGAAACTGGGTGGTTAACCACTGGTTTTCAGTTTTGTTTCTGGTAAGTGATGTTTGACTTCCTATTAATTAGGAAGGATTAAGGAGAAATCATGTTTTTTAATATTTGTAAAGCAAT
TTGAAAGAGAAAGATGATTCCATGCCGATTATTGGGCTCATCAAGACCAGTTAGTTAAAAAATACAACTGTGGGTCAGATGAGAGGACAGAGGCAAATAACATGCAATTGTTCATGTTGT
CAAATCACAAGTATTTGGAATTTCAATCTGTTTTCATTTTCTGTCATCTCCCTTTCTCTTCCATCTCACTTCTAACTACTACCATGAGTGCTGATTTCTCTCTATCTTTCCTATACTGGT
CCCATCAAGATTTCAAAAAGTCACTGAATGTTTGAGATGAAAGTGATCTTAGAGATCATCTGGCCCAGTACTGACCACTAGAAATATAGCAAACCACATAATGTAATTCCTAAATTTTCT
AATACCTACACCGAAAAGGTAAAAATAAACAGGTGAAGTTAATATTTAACAATATAATTCATTTAACCCAACATATCAACAAATCCTTTCAGTATGTATTCAATATTGAAAATATTAAGA
AGCTAATTTACATATTTTTATTTTTACTGAGTCTTTCAAATCTGATGTGTATATATACCCACAGCACATCTCAGTGAGGACTAGCCACATTTCAAGTGCTCAGCAGCCCCATGTGGGTAG
TGGCTGTGGCATTGCATAGTGCAGATGTAAACCAACTTATTGATTGTACAAAGGAAAATAAGACCTAGATGTCACACAATGAATTGACTGAATTGGCATCACTCGAACCCAGCTCCCCAA
TGACGTTCAGGCCAGAACCCCTTTATCACCCTTTGTATGCACAATCCCTTTCTCCTAACACTCTAACACCTCTCTCCACTCTCATTCTTCCATTTCTGAGCCACAGTTGAGCCTGGGGCT
CCCTGTGTCCTTTCTCACTTTCCTAGATCTTCATTCATTACTCTTTCTCTTTTCTCCTGTTTTGCTTTTGGGTCCCACAGGCAAAACAGAAGAGAGAAGGTGTGATGCTTCTTTTTATTC
CTGTCTACCCCCCCGCCCCCCGACCAGGTGCTCCAGGGAAAAATATGTGGAGTTTCCCTGGAGGGTTGTTTGTTTTACATTTAACAAAAGTGCTTATTTTGTCAGGTTATCCCATGACAT
ATTTTAAATGCTCAATGCCTTATATTGAGTTCCTTTTGCACTATAATGGAAAGAACACTAGTTTAGGAGAAAGGGAACCTGGCAAGTACTTTGAATTCTGCTACTAACTGGGTGATCTCG
ATCAAATTATTTATCCTCTCTAGACTTCAGGTCCTGTGGGTGTGTAGGTGGGGGGAATTGGGCAGGGGAGGGGAGCAGGGGATTAATAAAGTGACTAGATTAGATACAAATATAAGGGTG
TTTCTAGCTCTAAAATCCACATTTACCTGCATTTTTTCCCCCTCTCTTATTTTTTGCTGGGAGAGTTTACCAGCTATGATGGTGACTCACATTTAACTCTCTAGCTTTGAATTTTCATCC
CCCACCAAACCAGCTGGCAAGCTTAGACTTCTCATTATCTCTGACATATACTCCTATGCACTGATTTTTAAATAAAAAATAAATTACTTAAAAATAGTTTTATTCCTCCTTCCTCCCAGG
TCTTGTAGTTTACCTTCTTTGACGTTCATAGTGGAGGAAATGACAGCTAAGATGGGGAATGGAATGCCTTACTCCTAGATATCACTGTATTTCATCATTTGCCTTGCCTACAATTGATGA
TGGGCTGACACAGTTATTTGCCCCTGTGTCTCTTTGCGATCCAGAAATATTTCTGCTCCCTCTAAATAAACTTCTCTCCTCTGTCTTCCAAATTCTTGAGGTGTCTGTGACTGTTGACTT
TCTTTTCTTTCAAAGACGTTTCTCTGGAAGACACTCAGCTCTGGAAAAGGGTAACTGAGCAAAGGAGGCAGGAAGAAATTGATTGGTAAAGCAGGTTCGGTGGTGACACAACTCTGTAGC
TAGCACTTATTGATCTCTTACTAAGCCCCAAGCATTGCATTAATCACTTTACACGCATTATCTGACGTAAGCCTCATAGCATTACTATAAAGTAGGTCCTGTTATTATCCTCATTTTGCA
GGTGAAGAAATTGAGGTTTAGAAAATTTAAATCATATGTCTGTCTGAGATTATAGAGCTATTAATTGGTGATGCTACAACTTGACTCCAATATCACACTTTAAATCACTATATTATAGTA
CTAAAGGTGTGTGAGTGGTCTAGATCTAGGGAGTCTGAATAGGCCATGTCCTAGGCTAAAGGCCCTTTGCCTGTTGTGCTGAGATGGTTCTGACTCATACTGTGGGGCGAGGGATATATA
CTAGCGCCCTGGAGACCTGTCGAATTACAGACTAGCACCTCCACACTTGGGCTAGAGACCAGTTGGTTGGTCCTCAAGGCAATGGGCAGTGAGTTCCAAATTTCACCTTTAGCCAGTGCA
GAGACAGAACTTGGAACAGGCAAAAGCAGTCTTAAGAGCTCAAAAAAGTCCAAAGGAAAAATAGATTAATTTGAAAAAAGACTCACAATCTGAAAACAGAAAAATGTGTGTCAGGGTGTA
ATTAAAAAGGCAGGCCCATCTGGAATGGTTTAGTTCTTTTCAGTTAGGTATTGTTATAGGTGCTAAATTTGTTCTTTGTTTCTTCAGATATCCATTTATTCACTTATTGCCATCTTTTAG
GTGCAACAGTTTGAATGCTCTAGTCCAAGAAATGGCAAATGTTTCTGTAAAAATCTAGATAGTACATATTTTAGGCTTTGCAAGCCATATGGTCTCTGTCCCAACTACTCTACTCCGTCA
TTGTATCACAAAAACAGCCATAAACAATACAAAAATGAGTAGCAGTGGCTAAGTTCCAATACCACTTTATTTATGGTCACTGAAATTTGAATTTCATATAACTTTCACATGCCACAAAAT
ATTCTTCTTTCGATTTTCTCAACCATTAGCAAATTTGAAAATATAAAATATAAAAAACAATTCTGAGCTTGCAGGCTGTGGCAAAACAGGTAATGGGCCATGGGCCTCAGTTTGCTGACC
CTGCTCTAGTCTAATGCATGTCTCAAAGTGCTAACTCACTCTGAAAGCCAGTTAGATACTAGCAGGATTGCACTCATTTAAAATGAAAACAGGTAAACACAAAATAGCCAAAACGGCGAC
ACTATTGCTATCCCTATCCCTTATTTACTCCTTCCCATACTCAAATTTCACTTTATTCTTTGCATGTTTTTTTTTCTTTCTCTAGGTTGTTTGGTTAGGGCTGAATGTTTTCCTGTTTGT
GGATGCCTTCCTGAAATATGAGAAGGCCGACAAATACTACTACACAAGAAAAATCCTTGGG
GTGAGTATCACGGTTGTCACGGATAGAATCTCTATTGTTTTCCTTATCTCTGATTCCAG
CTTCTTTGTGACCCAATGCCCTGATATTCTCTAGGGCTAGGGTTGCCAGAAAAAGTACAGAATGCCCAACTGACTTTGAGTTTCAGATAAATGACAAATTATTTTTTTATGTAAGTATGC
TCCAAATACTGTATGAAACACAGGTATACTAAAATATTTATTTTAAAAAGTCTGAAGTTAAAATTTAGCTTAGCATCCTGTATTTTTATTAAATAAATCTGATAACCCCATCTAGGGCAC
ACTACCCAGACCCAATAAAGGAAACATGCAATAAAGAAAACTATTAGGCAGTTGTTTTCAAACTGGTTTCCAGAAACTCAGGTGTTCCTACAGGGTATGAGGGGAAGGCTAACTGGGCAG
TGCTCCTGCTCCTGCTCCTGCCCCTATTTCTTTTTTTTTTTTTTTTACAAGGAGGAACTGGTACCATTCTTCTGAAACTATTTCAATCAATAGAAAAAGAGGGAATCCTCCCTAACTCAT
TTTATGAGGCCAGCATCATTCTGATACCAAAGCCTGGCAGAGACACAACCAAAAAAGAGAATTTTAGACCAATATCCTTGATGAACATTGATGCAAAAATCCTCAATAAAATACTGGCAA
ACCGAATCCAGCAGCACATCAAAAAGCTTATCCACCATGATCAAGTGGGCTTCATCCCTGGGATGCAAGGCTGGTTCAATATACACAAATCAATAAATGTAATCCAGCATATAAACAGAG
CCAAAGACAAAAACCACATGATTATCTCAATAGATGCAGAAAAGGCCTTTGACAAAATTCAACAACCTTTCATGCTAAAAACTCTCAATAAATTAGGTATTGATGGGACATATTTCAAAA
TAATAAGAGCTATCTATGACAAACCCACAGCCAATATCATACTGAATGGGCAAAAACTGGAAGCATTCCCTTTGAAAACTGGCACAAGACAGGGATGCCCTCTCTCACCGCTCCTATTCA
ACATAGTGTTGGAAGTTCTGGCCAGGGCAATTAGGCAGGAGAAGGAAATAAAGGGTATTCAATTAGGAAAAGAGGAAGTCAAATTGTCCCTGTTTGCAGATGACATGATTGTATATCTAG
AAAACCCCATCGTCTCAGCCCAAAATCTCCTTAAGCTAATAAGCAACTTCAGCAAAGTCTCAGGATACAAAATCAATGTACAGAAATCACAAGCATTCTTATACACCAACAACAGACAAA
CAGAGAGCCAAATCATGAGTGAACTCCCATTCACAATTGCTTCAAAGAGAATAAAATACCTAGGAATCCAACTTACAAGGGATGTGAAGGACCTCTTCAAGGAGAACTACAAACCGCTGC
TCAAGGAAATAAAAGAGGATACAAACAAATGGAAGAACATTCCATACTCATGGATAGGAAGAATCAATATCGTGAAAATGGCCATACTGCCCAAGGTAATTTACAGATTCAATGCCATCC
CCATCAAGCTACCAATGCCTTTCTTCACAGAATTGGAAAAAACTACTTCAAAGTTCATATGGAACCAAAAAAGAGCCCGCATCGCCAAGTCAATCCTAAGCCAAAAGAACAAAGCTGGAG
GCATCACACTACCTCACTTCAAACTATACTACAAGGCTACAGTAACCAAAACAGCATGGTACTGGTACCAAAACAGAGATATATATCAATGGAACAGAACAGAGCCCTCAGAAATAATGC
CGCATATCTACAACTATCTGATCTTTGACAAACCTGAGAAAAACAAGCAATGGGGAAAGGATTCCCTATTTAATAAATGGTGCTGGGAAAACTGGCTAGCCATATGTAGAAAGCTGCAAC
TGGATCCCTTCCTTACACCTTATACAAAAATCAATTCAAGATGGATTAATGCTCCTGCCCCTATTTCAACCAAAGCAGACTATATCTATCTATGAACACCTGCTTACAATTTTAAGAAAG
AGTTTGGTTTTTTTTTAAAAAAAAGGAAAGTAAAAAAGAAAAAACAAACACAACTTGAAAACACTGCTGTCATGGAAACATACCTCTCTATCAAATAGGAGGGATACTTAGGGGAGTCTC
ATGGGTGCTACAGAATTCAAGGCCTGCAGAAAGGAGGGCTCAGGTCAAGGTTACAGAACCTGAGAAGCTTGGGGAAGTGGCAGATCAAAAACAGAAGAGGGAGGGAGGGAGTGGGTAGGG
CACAGGGGTGTGGAGGTGACCAGGAGGAAGCACGGAGTTGAGGATGGTTCTCTCACAGGCTGATGAACCCGGATGCTGCCTGGTTAGAAGAGCATATTTGACTGCTACCTCTAGTCTATT
ATGCAATAACAGATAGAGGATTTTAAATCACTTTCATCTTGACAGTGTCATTTTTTCAGTAGCTTTTGGTATCTTCCCAATGTACATGTTTAAAGACAGCTTGTCCTTTTAAAAAATGCT
TTTTTCTCTCTCCATAATCAAAGAATCCATGTTGAGATCACAACTAATTTGAACGTTCTGTTCATGGTTTATTTCACCCTGCTGTTTTCCATTTTAAATGTTCATCCTTGATCCTTCTTT
AGAAACTATAACTCCAAAGGAGGTATTAATTTGCTTTAAAAATAGCTTTTTACTAAGAGAATGATGCAATAAATGTGACTAGTTATTAACAGCTTGATTACTACATGACCAAAATGTCAG
CAGCACAAAAATAAATTATGCTGATGTCCCATGGACATTTTTTTTTCAAAATTATTTAAAAATTGTTTACATATGTAGGGGGTATAAGTGCAGGTCTCTTTCTTTCCTTCTTTCTTTTTT
CTCTTTCTTCCTTTCTTTATTCTTCCTTCCTTTTCTTTCTCTTTCTTCTCTCTCTCTTTCTTTCCTTCCTTCCTTCCTTCTTTCCTTCTCTCTTTCTCTCTCTCTTTCTTCTTTTCTTTT
CCTTCCTTCCTTCCTTCTTTCTTTCTTTGTTTTCATTCTTTTTATTTTGAGACAGGGTCTTTCTCTGTTACCCAGGCTGGCATGCAGTGGCATGATCATGGTTCACTGCAGCCTCGACTC
TCCCAGGCTTCAGCTATCTTCCCACCTCAGCCTCCTGATTAGCTGGGACCACAGGTGTGCGCCACCAAGCCTGGCTAATTAATATGCCATAATTTATTTAAACATTCCACAGTCATTAAA
ACATTTACCATCACTGCATAACTGCATAGAGCTCTCAGCCTTTTAAGAGAATAACAATTCATTGCATTGATATGCCATAATTTATTTAAACATTCCACAGGTTATTTCTTAAATTCATGC
TCACCTTGGGAAAATACAGGGAACAATTTGATTCACTATGAAGTAGAGCAGATAAGCAGCAGAGGAAGAAGTTTAAATCCATAATTTAAAAACATTTTTTTGCCAGGCGCTGTGGCTCAC
GCCTGTAATCCCAGCACTTTGGGAGGCCGAGGCGGGCGGATCACGAGGTCAGGAGATCGAGACCACGGTGAAACCCCATCTCTACTAAAAATACAAAAAATTAGCCAGGCGTGGTGGCGA
GCGCCTGTAGTCCCAGCTACTCGGGAGACTGAGGCAGAAGAATGGCGTGAACCCAGAAGGCGGAGCTTGCAGTGAGCCGAGATCGCGCCACTGCACTCCAGCCTGGGCGACAGAGCCAGA
CTCTGTCTCAAAAATAAATACATAAATAAATAAATACTTTTTTTTTGTAGACATGAGGTCTCCGTGTTGCTCAGGCTAGTCTCAAAACTCCTGGGCTCAAGTAATATTCCCACCTCGGCC
TCCCAAAGGCCGGGTATTACAGGTGTGAGCGACCATGCCCAGTCACAAGTGTAGGTTTCTTACATGCATATATTGCATAGTGATGAAGTCTGGGTTTTTAGTTACCTATCACCTGAATAG
TGAACATTGTACCCAGTGGGTCATTTTTCAACCCTCACTCCCCTCCCACCCTCCCACATTTTGTAGTCTCCAATATCCATTATTCCACTCTGTAGGACATTTCATTTTTTAAATCCCTAT
TTTAAAACCTTAATTATCAATAATGCTGCTTCCAATGAGATCAAAGCACATATTAGTTTGGTGCAAAAATTATTGCTATTAAAACTGTTTGCAAAAACCGCAATTACTTTTGCACCAAGC
GAATAGAAGTGTATAAGTAAAATGTGAAAATCTCCCTCCCATCCTACTCCCCAGAGATACACACACACACACACACACACACACACACACAGGGACACACACACTGACATAAGCTCACAA
ATGTATCAGACACGCAGGTTTTGTTTTTGAGGTGGGTACTATCGTTTATTCACTTTTTCATTTTCATATAGTAAAATTTGCTGTTTTTTGGTATACAGTTCTATGAGTTTGGGTAAACAC
ATATAATAAGACACACAGCTTTTTGTTTTAACCAAAAAAGGGATCACTTTGTAGATATTGGCTGGAAATTGCTTATGTTAATATATCTCAGATATCTTTCTTTCTTTTTTTTTTTTTTGA
GATGGAGTCTCACTCTGTCGCCCAGCCTGGAGTGCAGTGGCGCAATCTCTGCTCACTGCAACCTCCACCTCCTGGGATCAAGCGATTTTCCTGCCTCAGTCTCCCAAGTAGCAGGGGTTA
CATGTGCGAACTTTCATGGCTGGCTAATTTTTTGTATTTTTAGTAGAGACGGGGTTTCACCATGTTGGCCAGGCTGATCTCAAACTCCTGACCTCAAGTGATCCACCCGCTTTGGTCTCC
CAAAGTGCTAGGATTACAGGCGTAAGCCACTGCTCCCAGCCTCAGATATCTTTCCATGTGAGTGCCTAACCAGTGGTGTGCTGAAACCAGCTCATACCAGGTTGCAATGCCAGTTGCGTG
CATCTCTTCCCAACTCTGCATTCAGTGGTGTTCAATGACATCAAGTTAGTGTCTTGAAATCTGGCATGGTGGGAGTATTTACATCATCAAAATTGGCAAATGCTGGAAATCAGGAATCCC
CTTCCTCCCAAAAAGCTAGTCATTAAAACATTTACCATCACTGCATCACTGCATAGAGCTCTCAGCCTTTTAAGAGAATAACAATTCATTGCATTGATATGCCATAATTTATTGAAACAT
TCCACAGGTTATTTCTTAAATTCATGCTCTGCTCACCTTGGGAAAATACAGATAACAATTTGATTCGCTATGAAGTAGAGCAGATAAGCAGCAGAGGAAGAAGTTTAAATCCATAGTCAA
TTATGCATTAATGACAGCAGGAGTTCAATTATAACACCAGTGAGTGGAGATCTAGAGAAATGAACATACATTGGCATATTTAAATGTGCTGCAACGAGGAAAAAATGTTTTCTCTAAAAA
GAATTCATCCTATACAGATAGCCACCACAGAATATGGAACTGTGAAATTATAGTCCTATATTTTCAATTCACTTGCCAATTTTAGCTTTAAGAAATCTCTGTGATTCAAATAAGCAAGTA
GTGGGAACCAATGTGGAAATGCAGGATCTCTGAGATGAGCAGAGGAAATTTACTCAGAAGTGGAACAGGCTGTCTGTACCAAAAACAGTCAGGGTGTGAGTCAGCAGAGGGAGAAAACAC
AGGTCATGTGGAAAAGCCAGAAATGGAAAACAGTAGGGCAGCTTTTGTTCACCACATTGCCTGACATTCTTAGCCATTATAGATACTAGGCAGATCTTGTCCTGGCTTATTAAACTAACA
TCACATGTTCCTGGGTTTACGATATAAGGAAAAATCAATTTTGTGCTTCATAGATAATTACAAAAAGGCCAAGAAATTGTTAACCTTAACCCATACCCCTCCTTTTAGAAAGTCTTTGAC
AGGCACACAATGTAAGGCTGGCCAGTCAGCAGAAGTGCAACAAAAATTGCCTGGCTGCTGCTGTCAGCTCCTCTGCTACAACATTGTCACACTCCATAGCAGTCCCAAGTTCATGAAGTA
GACTCAGAGACCGGTTGTACAGAGTTGAGGAGAGAAGTCAGATTTAGCTGCCATGGAGTTAAGCATATTCTGTCCAGCTTATACCTAGTAAGGCCTGTTTTTTGGGGCTAAATGCTTCTT
TGAAGCATTGATTCCTTGTCTCCTTTGCTAGCAGCTTCTACTGCTGGATCAGGTTGTTCTTGATTTATGCTGCCTGGCCACCCAAGGAAATCAGCTTAAAATTTTGCTCCTCTGAAGTTC
TCCCTTCTCAAATATCTACCTGTTTAAAAATTTTGCTCCAAGAGGTTTGCTAGTCTTGACTAAATTTATTCAATTTTTAAAGACATCTTAAATAGAATTGGTTAAAAATTTTAAGTGTTT
TTATTATACAACTCTTATGTGCTTATAACTGCAATATTAGAAAATACAGAAAAGAATAAAATACCATCTGTAATTGTACCTCTAAGTATGAGCTTTATTTAAAATGCAAATAAAGGTATA
TATGATCCTTGGCCAGGCATGGTGGCTCACATCTGTAATCCCAGCACTTTGGGAGGCCAAAGCAGGCAGATCTCTTGAGCTCAGGAGTTCCAGACCAGCCTGGGCAACATGGCAAAACCC
TGTCTCTACCAAAAATACAAAAATTGGCTGGGTATGGTGGTGCACGCCTGTAGTCCCAGCTACTCAGGAGGCTGAGGTGGGAGGATGGCTTGAGCCCAGGAGGCAGAGGATGCAGTGAGC
CGATATCTCGCCACTGCACTCCAGCCTGGGCAATAGTGCCAGACCTTGTCTCAAAAAGAAAAATCTATATCTATATCTATATCTATATCTATATCTGATCCTTAGGACTCTTTTACAAGT
GACAAATAACAAAATTATAATAAAGAGTATTAAGTAAAATGTTACAGCCATAGAATGTTTTGCTAACATGTAATCATTAAATCCTATTCTCTTTCATGTTAATAAATGTAGTCAAACATT
TCCAAACTACTGTCATGGGAATTTCTCAACTCAATATTAAATTCAGTATGTTTTATGTATTTTGCAAACAGAGCCTGGCCTGATGGTGTTAGCTACTGAGAGAGAGGAGAGGCAGCTGTA
GCCCTGTTCATTTGCAGGCCTCAGATGAGTGGGCTGGGTCAGTTGCTCACGTGCTAGATGGTGAAATGAAGCAGCTGATGGTCTCTTTTTCTCCTCTGCTGTAGTCAACATTGGCCTGTG
CCCGAGCGTCTGCTCTCTGCTTGAATTTTAACAGCACGCTGATCCTGCTTCCTGTGTGTCGCAATCTGCTGTCCTTCCTGAGGGGCACCTGCTCA
GTGAGTCCCAACCACTCCTAAGTCA
ACTTTCACATTAAAGAAGGAGACCCCAGACTCCTCAGTAGGACAGTCCAACACCATGCTCCTAGGAATGGAAGCTAGAAGTCTCCTTTGGTAGCTAAGGGGGTGGGTTAGTGCGGGTGAG
TATTGGCATGCTATATGCAAGACATATTGGTTATGGGTTAGTGAATTTAATAAAGCTGGCTGGCGACATCTGACCATGATCATTCTACATTTGTAGTTTTGCAGCCGCACACTGAGAAAG
CAATTGGATCACAACCTCACCTTCCACAAGCTGGTGGCCTATATGATCTGCCTACATACAG
GTAACTCAGGCAATCCATGAATCTGCAGACTCCAGGGCATTCAGAATCTTGCTTCATTC
ATCCATCCATATGCACATTCAAAAAATATTTATCGAGCACTGGGCACTATTTGTCAGGCACTGTTCTTGGCCTGTTTTCATGGAGCTTAAGTTCTATTCCTTTGGGAACAGAGTAAATAT
AAAAAAGATCTCTCCGCAATCGAGGGTTTATTGGGCACCTTCTGTGCACTCAGCATTCTGCTAAGCACTATAATGTAGGATTCTTCTAGTCTAGTGGGGCACACCTGCCATGATGTTGCT
GAGATGCCTCTTAACATTTCTTTTCATCTTTCCATTTAGCTATTCACATCATTGCACACCTGTTTAACTTTGACTGCTATAGCAGAAGCCGACAGGCCACAGATGGCTCCCTTGCCTCCA
TTCTCTCCAGCCTATCTCATGATGAGAAAAAGGGGGGTTCTTGGCTAAATCCCATCCAGTCCCGAAACACG
GTGAGTTGACTTTCTAGCAAAGCATCTGAGATCTGGTCATGAGCAGGAA
GTGCACAGGTGGACATTGTGTCAGGCTGACATTTCTCCTTTCACAGACAGTGGAGTATGTGACATTCACCAGCATTGCTGGTCTCACTGGAGTGATCATGACAATAGCCTTGATTCTCAT
GGTAACTTCAGCTACTGAGTTCATCCGGAGGAGTTATTTTGAAGTCTTCTGGTATACTCACCACCTTTTTATCTTCTATATCCTTGGCTTAGGGATTCACGGCATTGG
GTAAGATCCTCG
AACCCTCATTCTCATGCCCCAGCCCCTGACCTTGCATAATTCTTTGTCCCAAACCATCCTTCTTTGTCTATTTCAGTGGAATTGTCCGGGGTCAAACAGAGGAGAGCATGAATGAGAGTC
ATCCTCGCAAGTGTGCAGAGTCTTTTGAGATGTGGGATGATCGTGACTCCCACTGTAGGCGCCCTAAGTTTGAAGGGCATCCCCCTGAG
GTAAGAGCCCTACGGGCAAGGACAGACTCTT
GTTAGGAGCTGTTACTGTTATTATTCTTATTATTACTCTTATTGTTATTATCATCATTATTATTAGTTCAGTCCTGTGCTGGGTCTTATGAAGGATATCTATGGGGTTCCTACCTTTAAG
AAACTTCCAGTATCACTGGCAACAGGCAATTACAAGGGGATCTTGAAGAGAAAAAACTAATAGTTCTTGCATGTTGTGAGACCCTCTGCAAAGGTAATAATGATAGCCCACATTATTAAT
TGTGTTTATCATCTGCCAGCCTTGCTGCATAATATGGATTATTTCATTTATATATAGCAATAGCCTATGAGATATTACTTCTTTTTTGTCTAAATTTTGAAACAAAAGGACAGGATTCCA
AGAGATTAAGTAAACTGACAAGCTCTTACAGTAAGTAGTGGAGCTTGAATACAAACCCAGGCCTTTTGGATTCCAAAGGTTTGAACTCTTGACCACTATACTGTCCCAAAGCTCAGCCGT
GATATTCCAGTCAAATTCTGGGGGGAAATAAAGCATTCTTGAAGTGGGCTTTCTTTGGTGTTCTAAGAATATGCTTGGAAATTTTTGTTAGATACTGGGTGATTATGAAACTGTGTTCTA
GGGAACTCAAGGTGTGCCCCAGGGTAATTCTTGCGGATATTATTATTTACCTTTGCTTGCTCACAAAATAGGTTATATTGAGGAGTAAATGGAAGGGGAAGGTTGATTTGTGGTGCCTCA
GAGTATTCTGAGAATGATTAAGGTCTTTAAATCAGATTCAGGATTAAGAGCAATAGCTTAGTTCTCATCTGGAACAGGAAAAATATATAAAACAAAAAGTCTTCTAAAGTTGGCATTTTA
ATTCAGCAGGAAAAGGATAAATGAATAATTTTTAGCACAATAAGATCATCATCTGGGAAAAAAGCTATATCTTCATTTCACGCCTTGCACTAAAATATGAATCGAGGATACATGAAGCAA
AAAAACCATAAAAGCACCTTAAGACCACGTGGGAAGTTTTTTTCTAATACTGAAGTGGAGGAACATGTTTCTAAATAAGATAAACCACCCTGAAGCCATAAAAGAAGAGATAATTTTGCA
TGGCAAAAGAAATCCCCATCGGGCCGGGCACGGTGGCTCACACCTGTAATCCCAGCAATTTGGGAGGCTGAGGTGGGTGGATTGCTTGAGCCCAGGAGTTTGAGACCAGCCTGGGCAACA
TGGCAAAACCCCATCTCTACAAAAAATACAAAAATTAGTTGGGCATGGTGGTGTGGAGGGTGAGGTGAAAGGATTACTTGAGCCTGGGAGGCTGAGGCTGCAGTGAGCTGTAATCATGCC
ACTGCACTCCAGCCTGGGTGACAGTGAGATCCTGTGTCAAAATAAACAAACAAATAAACAAAAATTCCCATTGTAAATAAAGATAGACAAAAAATTACCAAGTAGGAAAAGTATTTACAA
CTCACAGGGCATGGACTAATTTTCTAATATATAAATAACTCCTAGAAATCAATAAGAAAAAGCCTAATAACATGATAAAAAGAGAAACAGAAGATGTGAACAGAATAATCTCAGAAATGG
AGATATATCCTTATCTTAAATATATGAAATGATGCTTAATGTTATTCATAATGGAAAAAAATGCCAAATAAAACTACAAGAATCTGTTAACCTAACAGATTAGCAAAGATTAAAAAACCT
GCTAATGTATGGTGCTGGCAAGTGTGGAAAAATGCTCTTATGCATTGCTGGTGAGAGTGTAAACCTATACAACTGCTTGTAGAGAGTGATTTGGCAGTAGCAATTAAGGTTTAAAACTCG
ACTTCCAATTTATTCCACAAATATACTTAAATATGTGTTAAATTACATGCATTAAGTTATTCATTACAGCATTGTTGAATAGAAAAAAAGACTGGAAACAAGTGTCCATCAGTGGGGAAC
TAGTTACATTTTGGGACTTTCATGCAGTGGAATAGTCTGCAACCAGTAAAACGAAAGAGACAGTACCATAGACACTAATAGGGACCAGTCTCTAAGATGTTAAATGCAAAAGGCAGGGCA
GTGTGTAGAGTCTCCTATCATTTGCATTGAAAAGATCATTTAAATGCATGTTCTCCAGAAGAATTCACAAAATAATAACATTACCTCTGGGGATCTGGAGGGGCAGGAGGATTTGCTTTT
TACTATTGTACTGTTGTACTTTCAGATTTTGTACCATATACATATATTACCTATTTAGAAAGTAATTTTCTAATAAGATAGATAGAATGCTAGCTACACAAATAAAGAATAGACCACTAG
CTACACTAATAAAGAAAAAAGAGAGACAATCCAAAAAACACAATCAGAAATGGCAAAGAGGACATTATGACTGACCGCACAGAAATTAAAAAAAAAAAAACCCTCAGAGACTACTATGAA
CATCTCTATGCACACAAACTAAAAAAAAAAACAACCTAGAAGAAATGGATAAATTCCTGGACACATACAACCTCGCAAGACCAGACCACGAAGAAATTTAATCCCTGAGCAGACCAATAT
TGAGTTCCAAAACTGAATCAGTAATAAAAAAGCCTACAACTAAAAAATGCCCAGGACCAGATAGATTCACAGCCAAATTCTTCCAGATGTACAAAGAAGATCTGGTACCATTCCTACTGA
AACTATTGCAAAAAAATTGAGGAGGAGGGTCTCCTTCCTAACTCACTCTATGAGGCCAGCATCATCCTGATACCAAAACGTGGCAGAGATACAACGAAAAAAGAAAACTTCAGGCCAATA
TCCCTGATGATCATTCATTGATGAAAAAATCCTCGACAAAATACTGGCAAACTGAATCCAGCAGCACATCAAAAAGCTAATCCACCACGATCAAGTAGGCTTTATCCCTGGGATGCAAGT
TTGGTTCAACATATGCAAATCAATAAATGTGATTCATCACATAAAGAGAACTAAAGACAAAAATCATATGATCATCTCAGTAGATACACAAAAGGCTTTCAATAAAATTCAACATTCCTT
CATATGAAAAACTCTCAGCAAACTAGGCATTGCTGGAACATATTTCAAAATAACAAGAGCCATCTATGACAAACCCACAGCCAACATCATACTGAATGGGCAAAAGCTGGAGGCATTCCC
CTTGAAAACTGGAAAAAGACAAGGATGCATTCTCTTACCACTCCTATTTAACATCGTGCTGGAAGTCCTGTCCAGAGCAATCAGGCAGGAGAAAGAAATAAAAGGCATCCAAATAGGAAG
ACAAAAAGTCAAACTATCCCTGTTTGCAGACAATATGATTCTATACCTAGAAAACCCCATAGTCTATGTCCAAAAGCTCCTAGATCTGATAAACAGCTTCAGCAAAGTTTCAGGATACAA
AATCAATATACAAAAATCAGTAGCATTGCTATACCCCAACAACACCCAAGCTGAGAGCCAAATCAAGAATGCAATCCCATTCACAATAGCCACAAAAAAAATAAAATACCTAGGAATACA
GCCAACTAGGGAGGTGAAAGATCTCTACAATGAGAGTTACAAAACACTGCTCAAAGAAATTAGAGATGACACAAACAAATGGAAAAACATTCCATACTAATGGATAGGAAGAATCAATAT
CATTAAAATGGCCCTACTGCCCAAATCAATTTACAGATTCAACACTATTCCTACCAAACTACCAATGACATTCTTCACAGAATAAGAAAAAAAAACTATTTCAAAATTCATATGAAACCA
AAAAAGAGCCCAAATAGCCAAGGCAATCCTAAGCAAAAAGAACAAAGCTGGAGGCATCATGTTACCCAACTTCAAACTATACAAGGCTACAGCAACCAAAACAGCATAGTACTGGTATAA
AAACAGACACACAGACTGATGGAACAGAATAGAGAGCCCAGAAATAATGTTGCATATCCATGACCATGTGATCTTTAACAAAGTCAACAAAAATAAGCAATGGGGAAAGGACTCTGTTCA
ATAGGTGGTGCTGGGATAACCGGCTAGCCATATGAAGAAGATTGAAACTGGACTCTTTCCTTACACCATATACAAAAACCAACTCAAAATGGATTAAAGACTTAAATGTAAAACCCCAAA
CTATAAACACCGTAGAAGACAACCACCCTGGAAGACAACCTAGGCAATACCATTCAGGACATAGGCCCTGGCAAAGATTTCATGATGAAGATACCAAAAGCAAATGCAACAAAAATAAAA
ATTGATGAATGGGATCTAATTAAACTAAAGAGCTTCTGCACAGCAAAAGCAACTACCAAGAGAGTAAACAAACAACCTACAGAATGGGAGAAAATATTTGCAAACTACACATCCGACAAA
GGTCTAATATCTAGCATCTATAAGGAACCTAAACAAATTAACAACAACAACAAAAAAACACAAATTATCCCATAACAAAGTGTGCAAAGTCTCAAAAAAAAAAAAAAAGTGGGCAAAGGA
CATAAAGAAACACTTTTCAAAAGAAGACACACACGCAGCCAACAAGCATATGAAAAAATGCTCAACATCGCCGATCATTAGAGAAATGCAAATCCAAACCACAATGACACACCATCTCAC
GCCAGTCAGAATGGCTATTATTAAAAAGTCAAAAAATAACAGATGTTGGTGAGGTTGCAAGGAAAAGGGAGCACTTATACAGTGCTGGTGGAAATGTAAATTAGTTCAGCCATTGTGGAA
AGCAGTGTGGTAATTCCTCAAAGAATTGAAAACAGATTACCGTTTGACCTAGCAATCCCATTACTGAGTATATACCCAAAGGAATATAAATCATTCTATGACAAAGACACATGCACTTGT
GTGTTCATTGCAGCACTATTCAAAACTGCAGACATGGAATCCACCTAAATGCCCATCAATGGTAGACTGGATAAAGAAAATGTGGTACATATATACCATGGAATACTACGCAGCCATAAA
AAATAACAAGATCATGTCCTTTGCAGCAAGATGGATGGAGCTGGAGGCCATTATCCTAAGCAAACTAATGTAGAAACAGAAAACCAAATATCACATGTTCTCATTTATAAGTGATAGCTA
AACATTGAGTACATATGCACACAAAGAAGGGAATAACACACTGGGGCCTACTTGAGAATGGAGAAAGGGTGGAGAGAGAGGATCAAAAAACTATCTAATGGGTAGTAGGCTTATTACCTA
GGTGATGAAATAATCTGTACACCAAACCCCTGTGACATGTAGTTTACCTGCAAACTGCACATGTACCTCTGAACCTAAAATAGAAGTTAAAAAAAAAAGTAATTTTGGGTGGGGCACAGT
GGCTCATGCCTGTAATCCCAGCACTTTGGGAGGCTGAGGCAGGAGGATTGCTTGAGCTCAAGAGTTCGAGACCAATCTGAGCAACATAGGAAGACCTTGTCTCTACAGAATATTAAAAAA
TTAGCCGGGCATGGTGGTGCACGACTCTGGTTCCAGCTACATGGGAGGCTGAGATGGGAGGATCACTTGAGCCCAGGAGATTGAGGCTGCAGTGAGCTGTGATGGCACCACCGCACTCCA
GCCTGGTTGACAGAGAAAGACCCCATCTCAAAAAAAAAAAGTAATTTTGGAAGGACATACCTGGGATATGTTAATAGCACATTTCATTTCTAAAGTCAGAGGAAATTATAAGATCATAAC
CAGGGATCTGTATTAGCGGACTAGTAGACAAGAGGACCTTAAAGATAGGGAGCTATTGCCTTTCCGCCCGTGTACGCCACTGAAGAAGCATCGTTAAAGTCTCTCTTCTCCCTTCCATCT
TGTCTAAGTCAGAGTCTCCTAAAGAGCTCAAACAGCTGAGGAAGCTCTTCATTGGAGATTTGAGCTTTGAAACAACTGACGAGAGCCTGAGGAGCCATTATGAGTGATGGGGAATGCTCA
CAGACTGTGTGGTAATGAGAGATCCAAACACCAAGCGCTCCAGGGGCTGTGGGTTTGTCACATACGCCACTGTGGAGGAGGTGGATGCAGCCACGAACGCAAGGCCACACAAGGTGGATG
GAAAAGTTGTGGAACCAAAGAGAACTGTCTCAAGAGAAGATTCTCAAAGACCAGGTGCCCACTTAACTGTGAAAAAGATATTTGTTGGTGGCATTAAAGAAGACACGGAAGAACATCACC
TAAGAGATTACTTTGAACAGTTTGGAAAAATGGAAGTGATTGAAATCATGACTGAGGCAGTGGCAAGAAAAGGGGCTTTGCCTTTGTAACTTTTGACGACCATGACTCCGTGGATAAGAT
TGTCATTCCGAAATACCATACTGTGAATGGCCACAACTGTGAAGTTAGGAAAGCCCTGTCAAAGCAAGAGATGGCTAGTGCTTCATCCAGCCAAAGAGGTCGAAGTGGTCGTGGAGGTGG
TTTTGGTGGGAATGAAAACTTTGGTTGTGGAGGAAACTTCAGTGGTCATGGTGGCTTTGGTGGCAGCCATGATGGTGGTGGATATGGTGGCAGTGGGGATGGCTATAATGGATTTGGTAA
TGATGGTGGTTATCCAGGAGGCGGCCCTGGTTACTCTGGAGGAAGCAGAGGCTATGGAAGTGGTGGACAGGGTTGTGGAAATCAGGACAGTGGCTATGGCAGGAGTGGCAGCTATGACAG
CTGTAACAAGGGAGGCAGAGGCGGCTTTGGCAGTGGTAGTGGAAGCAATTTTGGAGGTGGTGGAAGCTACAATGATTTTGGCAATTACAACAATCAGTATTCAAATTTTGGACCCATGAA
GGGAGGAAACTTTGGGGCAGACGCTCTGGCCCCTAGGGTGATGGAGGCCAATACTTTGCCAAACCACCAAACCACAGTGGCTATGGCGGTTCCAGTAGCAGCAGTAGCTATGGCAGTGGC
AGAAGATGTTAATTGGGAATCAAAGCTTAGCAGGAGAGGAGAGCCAGAGAAGTGACAGAGAAGCTACAGGTTACAACAGATTCATGAACTCAGCCAAACACAGTGGTGGCAGGGCCTAGC
TGCCACAAAGAAGACATGTTTTATACAAATACTCATGTTTATGGGCAAAAAAGTCAAGGACTGTATTTGTGACTAATTGTATAACAGGTTATTTTAGTTTCTGTTCTATGGAAAGTGTAA
AGCATTCCAACAAAGGGTTTTAATGTAGATTTTTTTTGCACCCATGCAAAAAATTGCTATATGTGATAGTCTGATCATGACACTGAATAAATGTCTTTTTTTTTTAATGTGCTGTGTAAA
GTTAGTCTACACTGAAGCCATCTTGGTAAATTTCCCCAACAGTGTGAAGTTAGCATTCCTTCAGGGTGATGCCAGGTTCTATTTGGAATTTATATACAACCTGCTTGGGTGGAGAAGCCA
TTGTCTTCAGAAACCTTGGTGTAATTGAATTGATAGTTACTGTTGTGACCTGAAGTTCACCATTAAAAGGGACTACCCAAGCAAAATCATGGAATTATTGGTTATAAAAATAATTGTTGG
CACATCCTATGCAATATATCTACGTTGAATAATGGTACCAGATAAAATTATAGATGGGAATGAAGCTTGTGTATCATCCATTATCATGTGTAATCAATAAACAATTTAATTCTCTTGAAA
AAAAAGATAGGGAGCTATTTAAAGATTATTAGGAAAGCTTACTAGCTAAGATGGTTAATACCTTGTCTTATCTTGCACATCAGCTTCTGTCTTTTTCTCATCTATTACCTGAGTTAAGTT
ATAGTTGGTCTATTTGGTATCCTTAAAACTTAGGGGTTGCTTTGGTTGGTCGTGTAATACTCTAAGAGAGAGAATACCAGTTTTGCCACCTGAATGTATTGCTTTGTTTCTTCCATAAAC
ATTTAAAAAATACTCTCTCCATATTCACCCCATTTAAAAATTAGAAAAATAATATACATTTATTGTAGAAAGTTTGGAAAATACAAAAAATACTAGAAGTAAATAAAAAATTTCATAGAG
TTCTACCACCTAGAGGAAATAATGTTTTTCCTTGATTGATATAATGGATGCTTTCCTTTGAAACATTTTTTTTTGTTTTGAGACAGTCTCCCTCTGTTACTCAGGCTAGAGTGCAGTGGT
GTGATCTTGTCTCACTGCAACCTCTGCCTCCTGGGTTCAAGTGATTCTCCTGCCTCAGCTTCCCAAGTAGCTGGGACTACAGGCGCGCACCACCACGCCCTGCTAATTTTTGTATATTTA
GTAGAGACGGGGTTTTGCCACGTTGACCAGACTGGTCTCGAACTCCTGACCTCAGGTGATCCACCTGCCTTGGCTTCCCAAAGTGTTGGGATTACAGGCGTGAGCCACCGCACCCGGCCT
TGAAACATTTGTTTTAAAATAGTTGGCCAGGAGTGGTGGCTCATGCCTGTAATCCCAGCACTTTGGGAGGCTGAGGCAGGTGGATCATTCGAGGCCAGCAGTTCCAGACCAGCCTGGCCA
GCATGGTGAATCTCCATCTCTACTGAAAATGCAAAAATTCGCCAGGTGTGGTGGTGCATGCCTGTAGTTTTAGCTAATTGGGAGGCTGAGGCAGGTGGATCATTCGAGGCCAGCAGTTCC
AGACCAGCCTGGCCAGCATGGTGAATCCCCATCTCTACTGAAAATGCAAAAATTCGCCAGGTGTGGTGGTGCATGCCTGTAGTTTTAGCTACTTGGGAGGCTGAAGCAGGAGAGTTGCTT
GAACCCGGGAGGCGGGGGTTGCAGTGAGCCGAGACTGTGTGACTGCACGGAGTGAGACTCTGTCAAAAAAAAAAAAGAAAGAAAGAAAGGAAGGACGCAAGGAAGAAAGCAAGGAAGGAA
GGAAGGAAGAAAAGAAAGAAAGAAAGAAAGAAAGAAAGAAAGAAAGAGAAAGAGAGAGAAAGAAAGAAAGAAAGAAAGAAAGAAAGAAAGAAAGAAAGAAAGAAAGAAAGAAAGAAAGGA
AGGAAGGAAGGAAGGAAAGAAAGAAAAAGAAAGAAAGAGAAAGAGAAGGAAAATATGTGTATGGTATATATACCATTTTAATCATTTCTTAAAGTAAACATTGTGGCCATTACTTTACTC
GTGCATAATACTTTTTCACACCTTAATTATTTATCTTCATTTCCCAGAAGTGAAGTTCCAGGGTAAAAGAGAAGGAATGCTTTTGAGGCTATTGAGACATACTGCTCAACTGCTCTCTGG
GAAGATGTTGCCAATTTGCATTTTCACCCCTGTGAAATGCATGTTCAATTTGCATGCCCACGTGAACACTCCCATTTCCCTGAATCCCAGTTAATGCTGGGCATTATTAATTAAAATTGT
TTTTCAATTTGAGAGACTAAAATGGTATCTTGTTTTAATATTTATTACTCTGACTATTTCTGAGGCCAATATTTTTTTCACATTGTTATTATCCATTTCTTAAATATGTTTTTCCTCAAA
TTGAGCTGGGGAATTTTCTTCAAATAAGAAATAGCACTGAATTGCATAATGTTCACTCTGTTTGATTTGTCCCATCTCTGCCTCTTCCTTCCCTAGAGATACTCAAGGAAGTTATTTGCT
TGCACCAGCTTAAGAAACCTCACTTCACACAGTCCCAATGTATCACACTTGAGCAACTGTGCAAGAAAGGACATAATTTAGTATTGCTAGGAAGTATATTTTTAGTAGTTCCTGTGCAGG
TAGAAGCAAACTGCTGCTTTGCAAAGATCTCAGGGATAGAAAAGCTGCTTTATTTATTTATTTATTTTATTTATTTTGAGACGGAGTCTCACTCTGTCACCCAGGCTGGAATGCAGTGGC
GCGACCTGGGCTCACTGCGACCTCCTGGGTTCGAGTGATTCTCCTTCCTCAGTCTCCCGAGTGTCTGGGATTACAGGCACCCACCACCACACTCGGCTAATTTTTGTATTTTTAGCAGAG
ATGGGGTTTCACCATGTTGGCCAGGCTGGTCTTGAACTCCTGATCTCAAGTGATCCACCCGCCTTGGCTTCCCAAGGTGCTGGGATTACAGGCGTGAGCCACTGCGCCTGGCCAAAAAGC
TGCCTTTAAAAAAAATGTAGACAAGGTAAAAAAGATATTACTATGTTAAATGTTTAAGCACTTGAGAAAGGAGGTGATGGATAAGTACTGAGTTTTATGTACCAGTAGCATCAGTCACAT
ACTTTCCCTTTTTTGTGTTTGTTTTGTTTTTAATCATCTGCCTCTATTTCACATCTACTTTCTCTGTTGGTTTTTTAGATTGGACAAGCTGTCCTCGAAGACAGTCTTAGATTCTTAAAA
TTAAATCTTATTTTATTTTTTTGGAGACAGTGTCTTGCTCTGTTGCCCAGGCTGGAGTGCAGTGGTGTGATCTCAGCTCACTGCAACCTCTGCTGCCTCCTGGGTTCAAGCGATTCTTAT
GCCTCAGCATCCCATGTGGCTGGAATTACAAGCATGCACCACCACGCGCAGCTAATTTTTTGTATTTTTAGTAGAGACAGGGTTTCGCTATGTTGCCCAGGCTAGGTCTCCAACTCCTGA
GATCAGGCAGTCTGCCCGCCTCGGCCTCCTAAAGTGCTAGGATGAGCCACTGTGCCAGGCCTTAAAATTAAATTTTATATGTAATTTAAGAATAAGAATATTTACCATGTGTTCCATTTC
TGTGCTTTTCTCCTGCTTCTTGGTCAGACTTGTAAATTTTCAGGAAATGGTCTGTTTTATGAATAACAGATTAGCAAACGAAACCATTGTCCTTTATTTTTTCTATTTCCATCTTCCAGA
TTTGGTGAAATTAGTAGCTTAAAAATGATACACATTGGAGAACTCAGTAAAGAATGAAGGATGAACTGCTACACAAATAAGTCCTAAACAAGAAATTAGTGTGTAATCTCATTCTTAACC
CTGTCTCTGTGCAGTCTTGGAAGTGGATCCTTGCACCGGTCATTCTTTATATCTGTGAAAGGATCCTCCGGTTTTACCGCTCCCAGCAGAAGGTTGTGATTACCAAGGTAAAGAATATGC
ACTTTCCTCTTGCTGTGATAAGAGTTATCTTCTACCGGACTACAGAACTAAATTTTTATGTTGTCACCCTGAAAGAGGAACTTGGAAACTGGGCACAGTGGGTGGTAGTCCCAGCACTTT
GGGAGGCCAAGGAGGGCAGATCTGTTGAGGTCAGGAGTTCGAGACCAGCCCGGCCAACATGGCGAAACCCCATCTCTAATAAAAAAAAAAAAATTAGCTGAGCGTGGTGGTGCCCACCTG
TAATTCCAGCTACTTGGGAGGCTGAGGCGGGAGAATCGCTTGAACCCGGGAGGCAGAGGTTGCAGTGAGTTGAAATAGCGCCACTGCACTCCAGCCTGGGTGACAGAGAGAGGCTCTGTC
TCAAAAAAAAAAGAAGAAGAACTTGGGTTTGGCATACCTCAGTTCCTCCAGCACTGGACAGAACTGGGAAAGAGGGGCTTGGCCGAAATCATCAGGATGAGTCTATATCAGAGGTTGCAA
ACAGGCAGCCTGGGCCAGAGCTAGTTCACAGCTATATTTTGTTTGGTGCACACAATGTTTGTTTATAAAGTTGAATTGGTTGCCAACATTTAAAAATCTGGATGGAAGCTTTCGTTTGAT
TTTTTAAAAGCTATTTCTTGCTTCTCTTGAAGAATCAGGAAACCTGATAACACTGTCATGGTTCCATATCGCAACCACTGTCTGGAGCTAAGTAGCTGCTGCCCTCTTTAGAGAGGACTT
GTGTTTGTAGTTCACCACTGTCACCAGCCCTCCAGCTTCACTCATTTGCTTTATCTGCCTGTCCCTGTCGTCATTAGAGTTTGCTTTCTTTGGTCTATGTGCTTCATTCACAGGTTGTTA
TGCACCCATCCAAAGTTTTGGAATTGCAGATGAACAAGCGTGGCTTCAGCATGGAAGTGGGGCAGTATATCTTTGTTAATTGCCCCTCAATCTCTCTCCTGGAATGGCATCCTTTTACTT
TGACCTCTGCTCCAGAGGAAGATTTCTTCTCCATTCATATCCGAGCAGCAGGGGACTGGACAGAAAATCTCATAAGGGCTTTCGAACAACAATATTCACCAATTCCCAG
GTAGGTCCTTG
AGACCAGGAGAGTCCCAGACCAGGATGCAGACTGGCAGAAAAGAGAAAGCAATTCTTCGTTGAATCTTAAGTTTGGTACAATAGAATAGGATTATAATAAATATGCAGAAGTCAGCCATG
AGAACAACTATATTTCTGGGAGGATGTTTGAGGTTGGAGGTGGAGGGGAGTCTTCAGTTGCCCGTTATCTTCTGTCTTCTGCCAGGATTGAAGTGGATGGTCCCTTTGGCACAGCCAGTG
AGGATGTTTTCCAGTATGAAGTGGCTGTGCTGGTTGGAGCAGGAATTGGGGTCACCCCCTTTGCTTCTATCTTGAAATCCATCTGGTACAAATTCCAGTGTGCAGACCACAACCTCAAAA
CAAAAAAG
GTATAATCCCGTATATCACTTTTCTTCTGGCCTGAGTCTGACAAGTCTATTGCCTTCTTGGGCTAAGCTCTTTACAATTGATAAGGGAGCAACCTATCCCTGGAGTTATGAG
AATAAGTGATCACTTCTCTTGGCCAGGACATCCACTTCTACAGATTTATCATAAGAACAGGGTCTTCTTTTCAATTTGGAGTTTAAGATCACCCTGACCAAAGATGTTGGAAGGCTCGTT
CCTAAGGAAAATTGTCAGAACTCTGAACATTCCTGCTGCCTAAAGTTTGCGGCTCTATAAATGTGACTTTTAAGGTCACCTAATAAGGCTATGTTCTCTCTTGCTGATTTCAGATCTATT
TCTACTGGATCTGCAGGGAGACAGGTGCCTTTTCCTGGTTCAACAACCTGTTGACTTCCCTGGAACAGGAGATGGAGGAATTAGGCAAAGTGGGTTTTCTAAACTACCGTCTCTTCCTCA
CCGGATGGGACAGCAATATT
GTGAGTCCAAATAACACACTAATTCCCCTACTAAACATAAGACGAATGTCAGACAAAGGATAGTGCATATGGATTAGAAGTTATTTCTTATGATTTCCTA
CCTGCCCTCACACTCACACACAAGTTTAAAAGTGGTGGAAAGAAGAGGCAGCTATCAGGACTTGGTTTTTCTTTTCTTTCTTTCTTCTTTTTTTTTTCTTTTTGAGACAGAGTTTCACTC
TTGTTGCACAGGCTGGAGTGCAATGGTGCGATCTTGGCTCACCACAACCTCTGCCTCCTGGGTTTAAGCAATTCTCCTGCCTTAGCCTCCCGAGTAACTGGGATTACAGGCATGCGCCAC
CATGCCCAGCTAATTTTGAATTTTTAGTAGAGATGGGGGTCTCACCATGTTGGTCAGGCTAGTCTCGAACTCCTGACCTCAGGTGATCCACCCACCTCGGCCTCCCAAAGTATTGGGATT
ACAGGCGTGAGCCACGCACCCAGCCTAGGACTTGGTTTTTCTAACTTTTATTCCTCTGAATCCAGGTTGGTCATGCAGCATTAAACTTTGACAAGGCCACTGACATCGTGACAGGTCTGA
AACAGAAAACCTCCTTTGGGAGACCAATGTGGGACAATGAGTTTTCTACAATAGCTACCTCCCACCCCAA
GTAAGTATATTTTCCTCTAGTAAGATGAGTTTACAGGGGCCGTGCGTGGT
GGCTTACTGCCTGTAATCTCAGCACTTTGGGAGGCCGAAGTGGGTGGATCACCTGAGGTCAGGAGTTCGAGACCAGTCTGGCCAACTTGGCAAAACCCCGTCACTACTAAAAATACAAAA
ATTAGCTAGGCGTGGTGGCACATGCCTGTAATCCCAGCTACTTGGGAGGCTGAGGCAAGGAGAATTGCTTGAACCTGGGAGGCAGAGGTTGCAATGAGCTGAGATAGCGCCATTGCACTC
CAGCCTGGGCAACAAGAGAGAAACTCTGTCTCAAAAGAAAAAAAAAAAGATGAGTGCGGAGTTAGGATTTAGGAAAGGTATTACAACATGTTGAACACTCTTAAGAAAAGATCTCTGGGG
CAGAAATCTTTTGTGCCATTCTTAGATTCTTGGTGAAGACCGAGGAAATTTCATCTGGGGTTTTAGAAAAATAGGGTCATGATCTTGAAAATGATGAAAAGAGGTTTTTTTGCCCCAGCA
AACTCCATTCAAACAGTGAGGCAAGTGGACCCACTTCTGATCTATACTACCAAACAAACTAGAGAACTGGAGCAATTCAAATGCATTTTTGCGGGGAGGGGACTCAATAATCTCTACTTA
AAGTAACAAAGGTATTATCTAGTTTACTGGCCACCTGAGCTCAATCTTTCTGGAGGGTTTTGAGACATGTTACAGCACAAAAAATCCTGGTGCTATGAAATCAGCCATTCCAATGGGAAG
GAGATGAAGCTGAGATTCCCTGAACAAGTAGGGAGGTGATGATCAATTCAATGCTACAAATATTCTTGATTACCTTTTTTTTTTTTTTTTTTTGAGATGGAGTTTCGCTCTTGTCGCCCA
GGCTGGAGTGCAGTGGTGCGATCTCTGCTTGCTGCAATCTCCGAATCCCGGGTTCAAGCGATTCTCCTGCCTCAGCCTCCCATGTAGCTGGGATTACAGGTGCCCACCACCATGCCCAGC
TAATTTGTTGTATTTTTAGTAGAGATGGTGTTTCACCACGTTGGTCAGGCTAATCTCGAACTCCTGACCTCAGGTGATCCACCTGCCTCAGCCCCCAAAAGTGCTGAGATTACAGGCATG
ATCCACCAAGCCCCGCCTTGGTTACCTTTTATAAGCTCAGCTCTCACCATTCTAGAAGCTTTGGAGGTTGAAAGAGAAATAGGATATGGTTCTTGCCCACAAGGAACATACATTTGAATA
AGAGATGCACACAATCACCTCAAAGCAGAATAATGCACTCCGTGAAAGAGGTTCACGGATGCTGGAGGGAAGAAAAGTCTACGGCCACATGGGGTGATTAGGAAAGGCTTCAGGAAGGCA
GTGGCTAGAGCACTTAGTGACTTGGATTCAGATGATCCTGGGTCCTCATGCTGGTTCTCTCTTTTTTTCTCGAGACACAGTCTTGCTTTGTCACCCAGGCTGGAGTGCAATGGTGCCATC
TCGGCTCACTGCAACCTCCGCCTCCTGGGTTCAAGCAGTTCTCCTGCCTCAGCCTCCCGAGTAGCTGGGATTACAGGCATCCACCACCACATCCAGCTAATTTTTTGTATTTTTAGTAGA
GATGGGGTTTCGCCATATTGGCCAGGCTGGTCTCGAACTCCTGACCTCAGGTGATTCACTCACCTCAGCCTCCCAAAGTGCTGGGATTACAGCATGAGCCACCATGCCCGGCCCTTATTC
TGGTTCTGACACTTTCTAGTTATGAGACCTTGAACTTCTGAACTCTCTGATCTTGATTCCTCATCTGTAAGACAAGGGTCATATTAGTGAATGCCTGCTCTACTCACTTGCAGGGTTGTT
ATGACAATTAAGTGAGACAATATATGAAAAAATGCTTTGTAAATTTTAAAGCAGCATATAAGCATAAAAGATGCTAATTATCATGTTGAATGTAACTGAAGTTTTGAGAGAGTATGAGGT
TGTCAGGAGAGAGAGAGAGAGGGAGGGAGAGAGAGAGACTAGCGAGGGACAGAGTACCAAGGAATGCTGCCTAGGTTATATGGGAAGGGAAAAAGACAAACCAGGGAAGAAATAGGAGTA
CACAGAGAAGTGGTGTCACAGAACCCAAGGGAGCAAATATTAGAGAAGCGTGGTCAATAGTGTTGGAAGAGTAGCAGGGTCAGGAAATGTTCATTTAGCTTAAGCATATTTATAGACAGA
ACAAGGACCAGTACATAAAATAAAATAAATACATGAAAGAGGGGAGAGGACTAAGATGGCCATAATAAAAGATGGACAATAGTATTGGCAAGGAAGTGGAGAAGTTGCAATCCTAGTACA
TTGCTTGTGGAAATGTGAAATGATACCACACTCGGGGAAAACTCTTTGGCAGTTCCTCAAAGTGTTAAACACAGTTTCCAGCTGGGCATGGTGGCTCGCGCCTGTAATCCCAGCACTTTG
GGAGGCCAAGGCAGATGGATCACGAGGTCAGGAGTTCAAGACCAGCCTGGCCAACATAGTGAAACCTTGTCTCTACTAAAAATACAAAAAATTAGGCCGGGCGTGGTGGCTCATGCCTGT
AATCCCAGCACTTTGGGAGGCCGAGGTGGGTGGATCACGAGGTCAGGAGATCGAGACCATCCTGGCTAACACGGTGAAACCCTGTCTTTACTAAACATACAAAAAAAAATTAGCCGGGTG
CGGTGGCGGGCGCCTGTAGTCCCAGCTACTTGGGAAGCTGAGGCAGGAGAGTGGCGTGAACCCAGGAGGCAGAGCTTGCAGTGAGCCAAGATCGTGCCACTGCGCTCCAGCCTGGGCGAC
AGCGAGATTCCATTAAAAAAAAAAAAGGTGAAAAGAATTAGCTGGGCATGGTGGCGGGCACCTGTAATCCCAGCTACTAGGGAGGCTGAGGCAGGAGAATCGCTTGAACCCGGGAGGTGG
AGGTTGCAGTGACCCCAGATCATACCATTGTACTCCAGCCCGGGTGACAGTGCAAGACTCTGTCTCAAAAAAAAAAAAAAAAAAAAAACACATAGTTTCCATATGACCCAGCAATCCCAC
TCCTTGTTATACACCCAAGAGAAATGAAAATATATGTCTACACAAAAACTTGTACATGATGTACATAGCAGCATTACTCATAATAGCCCCGAAGTGAAAACAAGCCAAGCATCCATCAAT
AGATGAATGGATGAAGCAAATGTAGTATATTCACATACTGGAATATTATTTAGCTATTAAAAAAAAAACAAAGTACTGAATCATGCTACAACATGGACAAATCTTGAAAACATCATGCTG
AAAAACACCAGACACCAAAGGCCATGTATTGTATGATTCCACTTATGTGAAACATTCAGGATAGGCATACCCACAGAGACAGAAAGTAAAGTGATTGTCTTGGGTAGGACAGGGTAGTTG
GGAGGAAATGAGGACTGCTAATGTGGATGGGGTTTCTTTGCGGATGATGAAAATGTTCTGGAATTAGATAGTGGTGATGGTTGCATAACTTTGTGGCTGTGCTAAAAAGCACAAATTGCA
CACTTCAAAGGGGCGAATTTTATGGTATAGAAACTATACCATAATTATATTTTTAAAAAAGAGGGGGAGAGAAAGGTATGAGAGAAGGAAGAAGACGGTGAGACCCAGAGCATAGTTGGA
AAGATTAGCTTTGGCAAGAAAGAACACTACCTCTCCACTAGGAGAAATTTTGAGGTAGGGATAAGCTCACAGTGGATGGGTTTAATGGGAGCTAATACATATGTACTTGCTATGTGCCAG
GCATTTTTCTAATTTATTTACATGTTCTTATTTAATCCTTAAAACAACCCTATGTGGTAAGTACTATTTTTATCCCCATTTTACAGGTGGGAAAGCTGAAACAGAGAGAGGTTAAGAAAT
TTTCCCTTGTCGGACATTGTGGCTCACGCCTGTAATCCCAGCACTTAGGGAGGCTGAGGCAGGCGGATCACTTGAGGTCAGGAGTTTGAGACCAGCCTGGCCAACATGGTGAAACCCCAT
CTCTAATAAAAATACAAAATTTAGCTGGGCATGCTGGTGCGTGCCTGTAGTCCCAGCTACTCAGGAGGCTGAGGCAGGAAAATTGCTTGAACCTGGGAGGTGGAGGTTGCAGTGAACCGA
GATTGTGCCACTGCACTCCAGCTGGGGGACAGAGCAAGACTCCATCTCAAAAAAAGAAAAGAAAAAAGAAAAAAAGAAATGTGCCCAAAGTCCCACAGGTGGGATAAATGTCAGAGCTGA
GATTTGAGCCCAGACAACCCAGACAGACTGGCTGCACAGTCTGGCACTTAGCCACTGCACTGTCTTATGTCTGTCATCTGTGTTCTCAAAACAGGGAAGGCTGAGTGCTGAGAGTGTTAA
GGGCTGAGAGCATATTTGGGGTTTGTGCGCAGAAAAGGTTAAAAAACTACCATGAAGAACGTGGGAGTAAACAACCGAATTTTTATTCAAGGTTCTTGGAAGTAGTAGAGGCCTAACAGA
GGCAGTTTCTCCATTCTGTCATTGCTGCATTCTAGCCCTTACTATTGTTCTGTTCCTACAGGTCTGTAGTGGGAGTTTTCTTATGTGGCCCTCGGACTTTGGCAAAGAGCCTGCGCAAAT
GCTGTCACCGATATTCCAGTCTGGATCCTAGAAAGGTTCAATTCTACTTCAACAAAGAAAATTTTTGA

Retrieve as FASTA  
CDS
Send to BLAST
.........1.........2.........3.........4.........5.........6.........7.........8.........9.........0.........1.........2
ATGGGAAACTGGGTGGTTAACCACTGGTTTTCAGTTTTGTTTCTGGTTGTTTGGTTAGGGCTGAATGTTTTCCTGTTTGTGGATGCCTTCCTGAAATATGAGAAGGCCGACAAATACTAC
TACACAAGAAAAATCCTTGGG
TCAACATTGGCCTGTGCCCGAGCGTCTGCTCTCTGCTTGAATTTTAACAGCACGCTGATCCTGCTTCCTGTGTGTCGCAATCTGCTGTCCTTCCTGAGG
GGCACCTGCTCA
TTTTGCAGCCGCACACTGAGAAAGCAATTGGATCACAACCTCACCTTCCACAAGCTGGTGGCCTATATGATCTGCCTACATACAGCTATTCACATCATTGCACACCTG
TTTAACTTTGACTGCTATAGCAGAAGCCGACAGGCCACAGATGGCTCCCTTGCCTCCATTCTCTCCAGCCTATCTCATGATGAGAAAAAGGGGGGTTCTTGGCTAAATCCCATCCAGTCC
CGAAACACG
ACAGTGGAGTATGTGACATTCACCAGCATTGCTGGTCTCACTGGAGTGATCATGACAATAGCCTTGATTCTCATGGTAACTTCAGCTACTGAGTTCATCCGGAGGAGTTAT
TTTGAAGTCTTCTGGTATACTCACCACCTTTTTATCTTCTATATCCTTGGCTTAGGGATTCACGGCATTGG
TGGAATTGTCCGGGGTCAAACAGAGGAGAGCATGAATGAGAGTCATCCT
CGCAAGTGTGCAGAGTCTTTTGAGATGTGGGATGATCGTGACTCCCACTGTAGGCGCCCTAAGTTTGAAGGGCATCCCCCTGAG
TCTTGGAAGTGGATCCTTGCACCGGTCATTCTTTAT
ATCTGTGAAAGGATCCTCCGGTTTTACCGCTCCCAGCAGAAGGTTGTGATTACCAAG
GTTGTTATGCACCCATCCAAAGTTTTGGAATTGCAGATGAACAAGCGTGGCTTCAGCATGGAA
GTGGGGCAGTATATCTTTGTTAATTGCCCCTCAATCTCTCTCCTGGAATGGCATCCTTTTACTTTGACCTCTGCTCCAGAGGAAGATTTCTTCTCCATTCATATCCGAGCAGCAGGGGAC
TGGACAGAAAATCTCATAAGGGCTTTCGAACAACAATATTCACCAATTCCCAG
GATTGAAGTGGATGGTCCCTTTGGCACAGCCAGTGAGGATGTTTTCCAGTATGAAGTGGCTGTGCTG
GTTGGAGCAGGAATTGGGGTCACCCCCTTTGCTTCTATCTTGAAATCCATCTGGTACAAATTCCAGTGTGCAGACCACAACCTCAAAACAAAAAAG
ATCTATTTCTACTGGATCTGCAGG
GAGACAGGTGCCTTTTCCTGGTTCAACAACCTGTTGACTTCCCTGGAACAGGAGATGGAGGAATTAGGCAAAGTGGGTTTTCTAAACTACCGTCTCTTCCTCACCGGATGGGACAGCAAT
ATT
GTTGGTCATGCAGCATTAAACTTTGACAAGGCCACTGACATCGTGACAGGTCTGAAACAGAAAACCTCCTTTGGGAGACCAATGTGGGACAATGAGTTTTCTACAATAGCTACCTCC
CACCCCAA
GTCTGTAGTGGGAGTTTTCTTATGTGGCCCTCGGACTTTGGCAAAGAGCCTGCGCAAATGCTGTCACCGATATTCCAGTCTGGATCCTAGAAAGGTTCAATTCTACTTCAAC
AAAGAAAATTTTTGA

Retrieve as FASTA