Entry information : PretPGHS01
Entry ID 13818
Creation 2016-06-27 (Harold Duruflé)
Last sequence changes 2016-06-27 (Harold Duruflé)
Sequence status partial
Reviewer Not yet reviewed
Last annotation changes 2016-06-27 (Harold Duruflé)
Peroxidase information: PretPGHS01
Name PretPGHS01
Class H synthase    [Orthogroup: N/D] N/D
Taxonomy Eukaryota Metazoa Chordata Actinopterygii Poeciliidae Poecilia
Organism Poecilia reticulata (guppy)    [TaxId: 8081 ]
Cellular localisation N/D
Tissue type N/D
Inducer N/D
Repressor N/D
Best BLASTp hits
Perox score E-value PretPGHS01
start..stop
S start..stop
MunPGHS01 1081 0 1..594 1..594
TrubPGHS03 962 0 1..595 1..598
SfoPGHS01 948 0 1..595 1..598
OmyPGHS01 940 0 1..595 28..624
Gene structure Fichier Exons
ExonStart..EndSize ExonStart..EndSize ExonStart..EndSize ExonStart..EndSize
N° 1 1..206 206 N° 2 367..450 84 N° 3 4201..4317 117 N° 4 5897..6037 141
N° 5 6120..6263 144 N° 6 7689..7870 182 N° 7 8008..8091 84 N° 8 8380..8626 247
N° 9 9390..9676 287 N° 10 11223..11370 148 N° 11 12278..13027 750  
join(1..206,367..450,4201..4317,5897..6037,6120..6263,7689..7870,8008..8091,8380 ..8626,9390..9676,11223..11370,12278..13027)


exon

Literature and cross-references PretPGHS01
Cluster/Prediction ref. Genebank:   103473446
Protein sequence: PretPGHS01
Sequence Properties
first value : protein
second value (mature protein)
Length (aa):   %s   595 (572)
PWM (Da):   %s   67941.21 (65531.9)  
PI (pH):   %s   6.84 (6.67) Peptide Signal:   %s   cut: 24 range:24-595
Sequence
Send to BLAST
Send to Peroxiscan
.........1.........2.........3.........4.........5.........6.........7.........8.........9.........0.........1.........2
FSI*WEVVGQQFSEIGGSLLDSSSSCSHSDLQLLSLLPLTLSLSAGLLHFCCFTHWNDILLN*GCCNESLYPWISLCSSLAPAGARMPGR*GYDQHSEPMLLPPVSALERLRALRRGQV*VRLHSHRILRRKLHRP*TLDPGASVPQAQSRCGALHSHPFPLAVGRHQQHVLTERPHAAGSDGEVQPDPQSSHVQFKI*LPQLGVLLQSQLLHQDPAACS*GLPHAHRGQRPKWPPGP*GFG*EAAEKKDIQARPSGLQYDVCFLCSALHPPVLQDLQPHGSGLHQGSVTGGCGPHLWRQPGTSAQPPAFQRRKTEISVDRWRNVPSICS*CSHQDELPSRGPGGETDGHWSGGVRAPSWFGFVRHTVAQGAQQSL*RPESRASDLGR*AAFPDDPPCHHRRDHTDRDRGVRAAPERLPAAAQVRSHPALPLPLPVREPHRAGIQPALPLAPADARHLPHRRRRADVRAVPLQHVCPDALRRGETGGCLLSASCWDWWRPQHERYCLQSRCDNDKGVPRAPDPAFQRVQEAF*PRAVHIIQRLHR*RGDSQHPRGALRGYRRS*ILPRVTAGEDSNGGDIRRKHGGNGRPLFPQRPPG*PHMLPSILEAQHIRRQSRLRHRELGHSEEAGVPELPDVSLRGVQCSSRGETSQERTKH*AMTMCRSPGRGGCVFFLFVFLLQVASQSKQRYSFGENSSACFSSTADRYRAQCSV*NPTLLLLNSLAARPTLERSHQ*GAERGFFLLNAFCLQTEKLLKFGPSDKIDVYLLVNSLFWNKNYTHMMCCFQ*IKIGRX

Retrieve as FASTA  
Remarks
Promoter
Send to BLAST
Send to cis Analysis
.........1.........2.........3.........4.........5.........6.........7.........8.........9.........0.........1.........2
TCTATTGTTC TCTCCACTTC CATTTACTGA AAGCACTGAA TCAGTATTTA TTCTGGCCTG GAGTCGTGAT GGGAACGGAA GCCTCTCACA ATAACCGTGG GTGTTGGTTT AATGATTGGT  CACATTAAAC CCCAACGTTA CATTAAAGGA TGGAAAACTA ACACTTTAGG AAACCATTTA CGATAGATAA AGGTCTTTAG AGACAAAGCG ATCTATTCAA ATCTTAAGAC AACACATGTT  CATTTTGACA GGATGTTTCT CTACCATGGC TGAAACTTTT GTCTTGGAGC GAGGCTGAGT CAATACAAAG CTTGTTGCTG GCACCCTGCG CCTTTTGTAA GAACATTTAA AAGAAAACAT  CTGGATGTGT GACTTGGCAA ATTCGCTGCT CACTGCAGTG ATTGTAGTTA ACGCTGCAAG TAGCTCCTAC GCAGACGATT GAAGTCTGGA GCTTGATTTA AGCGTTTCCA GGTCTGGAGA  AGTGTAGATA AAGAAAACTA TGTAAATAGA GAGAGGGAGA AAAAAAATAT TTGTATTCAA GACCATCCCA TTGTCAAAAA TTTGTCTTTC AATGTATCCT CCCATCCATC TTCCTTCTTT  CCTGTCTTGT CTCCTTACTT CTTTTCTTGT TTCCCTTTTT CCTTTGTTCA TCCATTCTTT TTTCTTCTCT TTATTTTTCT ATCCTTCACT CATTCCTTCC TTTTTACTTA CTTCCTTTCT  TTATCGTCTG CTTACCTTCT TCATTCCTTT TTTATTATTC ATCTTTTTCT TCCTTTGTTC TGCCCTGTTT ACCATTTTCT TTATGCCTTT CCTCACCCTC TTCCTTTATT AATTTATTCA  TTTCTTCTGT CTATCTGTTT TTATTTTTCA TTTCTATTTT CCCTTGTATT TTTCTTTTAT ATCCGGGACA CTTTAGAAAT ATGTGTCATA AATTCATTCT ATCCTTTGTA TTTTTACTTT  TAGCCTAAGA GTAAGAGGTC TGAAAATATC CACGTAGAAG AGTTTATGGT CACATTGCCC TCTAGGGGTG AAAGCTCTAA CTACATGTAA AGGCTTGCAG CAAATTCTCA TCCCACAACG  TCACCCGTGC TGCCTTCAAG TGCTTCCAGT AAAGTCTATA TGACATGCAA GTAAACAGTT TTTGCAGTTT TGCTTTACTA TGGTGGGGCA TCTAGTTGAG CCTATCTCAA ATGTTCTGTG  GAAAGTTATT GAAATATGTT CAGGAGTAAA CTTTTGAGGA CATCCAATGT GACCTGATAG AAGTTATGTC TATAAATCTA ATTCTTTCTT GAAGAAACGC CTGACATTGG CTGCATTGTC  TTTCACAATT AATGGCCTTT GGAACAAGAC AATAACAGAT TGTTAGTTCA ACCAAAACAA AGATAGACAT AAAAAATTGT AGTCATCACC CCATCCTCCC AATCCAACCC AAAGCACAAT  GCAACATTTT TGAAAACCAA ATGAAAGTGG AACATTTTGA ATGTTATGGT CTGTTAGCTG GGTTCAGATA AATATTAAAT CTACTTCCAC TGACATAAAT CTGTTTGCTG AATATGACTC  TTCATAAAAA TGACGTGTAT TTCTGGAAGT AATAGATGTT GACTGATGTT GTTTTGTTGC AGCCCTGATC CTAATGTGGA GAAAAGTAAA CAGCTTTCTG ACTGGCAGTG AAATCTTCTC  CGTCTGAGCT TGTAGTCACG CAGACTTGAA ATCTGTCTCT TTTCAGACTC CATAATTTCA TTGTGTATTT GCATCCTTTA TTTGTTTGTA AAATGAATGA GCATAATTGT TTTTTCTCAT  GATGTTGCAA AGAAACAATC CATTACAGCT AGGACCAGAC GCATTGCCTA CGTATGTTTC CACAGCTTTG CTTGCCATCA GCGCTTGAAT TACTTCAAGC AGGTATGTGT GTGTTTCTTA 
GTTATGATTT CATATTAAAA GCTTTTGAAA TAAATAATAG TGAACTGTAG AAGAAATATA ACGGACAAAA AAATAACCCA C 

Retrieve as FASTA  
Terminator +
Send to BLAST
Send to cis Analysis
.........1.........2.........3.........4.........5.........6.........7.........8.........9.........0.........1.........2
CAGCCAGCAG CAGCTTTTGG GCAGAAACTG CTTCAACACA CAGAGAAAAC ATCCCTGCTC TGCTGAGCTG AGGACGTTGA GTCTGCATTT TGCTCTTGCA TATCTGCCAG GGATGAATTT  CCTTCAGGTT GAGGCAGCAG CCATGTTTAT GTGATCTGGA AAAATCCAGC TGGGAGATGA TTTTTTGGGG GGGAGTGGGA GTCCATGAAA CAAGTAAATA TTTATAAAGC ACCAAACAAT  GCTGAAACTT CTCCGAAGAT GACCGTCTGT TTACAAGTGA GTCAAATGAT TAAATTTTAT GAGTAAGGCT GGAAAATGTC AGCGGAGGCA TCCTTATAAA GAAAAGCAAC TTACCTCCAA  AGTGACCTAA CGTTAGGTCA AGTAAAAAAT AAAACCCCAG ATGTGTTGCT TCAAATGGGG AACCAACAGA TTACACATAA AGATGCTAAT GGTTTTCCAA CAAATGTTAA TATTTTATCT  GTTGAGATCT GGCATGCTGA CCTCTAACCT CTTAACATTG GTCTGGTTTC AGTCACAGAT AAGCCCAGCA GCATTTCCCA ACATTCCTCT GCAAACTGGT GCCTGGTTTC TCTGTTTTAC  ACAACCAGCG CACTCCTCCA CCTCTGGCAA AGTGGTGCTG CTGGCCAGCC TCTAGTTTCG AGTTGTTCCC ATTACTTAGA CTACAATCTA TTTTACTGTC TTGCTGGGTG GTGATAGATT  GCTGCAATGA TTGCAGTTGC CAAACTTTAA GGTAGGAGTT CAGTTTCCTG AAGGACATGT CGGCTTGGCT TATGTTTTTG GTGTATACAT GCACTTAGTT GATGTAAGGT TAGTGAATAA  TTGAGAAAAT GTTTGTAAAA GTGCAGTAAA TGGGAATCTA AAAAAACCCC CAAAACTATT GCTTTATTGG GCAATAAATA ATTTTCCAGG AAGAAGGGGT GAGACTCATT ACATTCCACC 
AGCAGGAGGC AATAAAGAGC GGCCACCTTT CAGTCTCTTC T 

Retrieve as FASTA  
DNA
Send to BLAST
.........1.........2.........3.........4.........5.........6.........7.........8.........9.........0.........1.........2
TTTTCCATCTGATGGGAGGTGGTGGGACAGCAGTTCTCAGAAATAGGAGGAAGCTTGTTGGACAGCTCGTCCAGTTGCTCTCACTCCGACCTTCAGCTGCTGAGTCTCCTTCCTCTGACT
CTCAGCCTGTCTGCTGGATTATTGCACTTCTGCTGTTTTACACATTGGAATGACATCCTCCTGAACTGAGGCTGCTGTAATGAGAG
GTAAGCACATGCAGCTGCAGCCCCCGTTTGTGCC
CCTCTTATATCAGCATGCACTAGGATCTCAAGCTATGGTCAGTGTAGTTATTACCTCTGTGATCGCCATGTGTTGAGTTGTTAAAACTGATTTAATCCTTTCTTTTTTCTCTCTCTGTCT
CCAAAGCCTCTATCCTTGGATCAGTTTGTGCTCTTCTCTTGCTCCTGCGGGAGCCCGGATGCCGGGGAGATGAGGTTACGACCAGCACAGGTGGGTAGGAGGTTAGTGGGTTGGAAACCC
GCAATGTTAGTCTCAGAGGAGCTTCGGAAAACACATGTGGAGTTTAAACCGGAGCTCTTGTTTTCGTGATCCCTCTTGGTTTTGTCAGTTCATAATCTGAACGTGGCAGATTAGGTTGGT
GTGGGGGTATCAGACATTCCTGGAGCCAAGAAAACAAAGGCATGTCTTGGCAGGTAGAGAGTCCTGGTGTTTGAGCGAGCATCAGATGCAGTTGCATGTGCAAGTTTGACACAATTGTCT
TTTTAAGCTTTTTAGAAAGATGAAAACCAAAGAGGGGGAAGGTTCTGATGTTATAATTGTCGTCGCAGAAGGATATCTGTGCAAAAACCAACTAAGTGGATAATTCTGAAATTAAAGCAA
ACATGATTCTGGTGCTATTTCAAAATGTCACTGAGAAAATTAGCAAAACAAAAGGAAAATCTTTTTTATCATCTATTTATTGTCATTTGTTTTGCCCTGACTTAATCTGATGCGATTCAA
TCTTAAGCAGAATCACTGCATTAGGAATTATGGAATGTTTAAATGAAAATTACTGCCAACCAAATCAATCACATGGAAAATTCTGACACCGTATTCTCTTAAAATCTTCTAAATAAACAA
ATAAATCAATAAAATACCTCAGGCCAAATAGTGATAAATCTGAATGTCATTCCTCCAATCACAATACAAGCACAATTTCAGCTTTCAGCCAATACTCGGAATTGGGGGGGGGAAATTCCA
AGTATTTGTTCATCTTAGCCAGACTTTTCCAGTCCGTCTTGCACGGACACATCCCCCTCTCACGCCCCGTGTGCCATCTCGCTCTGGATCGTTTTACCTGGAACAACTCATCTCAGAAGA
CCGTGTTTGTGGTTCATTTCAGGTCAAACTAAAACGAGATTCGAATCCGTGTTGACCCGAGAAATCAGATAGTCTTCGGTTGAGTTTACATAGCTGTCAGGTGTGATTCCTGGATCTGAT
AAGGCTCAGAGAGAGGAGTTATGGGGGTGGTGTCTCTGCATGAACAGTGGACTGTATAAAACCACCTTCACAGAACATAGGAAGTGTTTGGATATTTCATGGTTCACCACCCACCCCTCA
CTGTGAGCGTATCGACAGTCATACAGTGTGATGCAGAGCCTGAGGCAATGATTTACAAAAATTTCTGTCATCCCACAACAAGCCTGTGTGAACCAGTTAACTTATGCCACAGAAACTCTA
TCCTCTCCTCTTTGTTTCTCGCCTTTCTTCTCTCCACGGACAAACAATGCGCTTTTCATGTGGGTTGTGCTATGCGCCACCTGCTTCACTTGACTTGTAAAAAGGAAAGTTAATGATTAT
TCCTAAGCGTGTGTTATCTTCCGCTACGTTAAATCCTCCATCAATCTGCACCGACTGGTAACAGTAGGAAGCTGTTAGGTAACGCAGTCTGGGTGCCGGCGCCACTGCAGCTAACTAATC
AGCTCATTTTGTTGATATTGTTTGATTCGAAAGAAAACTGAAGTTGTGGGGGGGGGGATCTATTTTGTTTCATGTGTGGGAATGTTGTGTACTGTTCCAAGGCAGTTCTGCAAAGATGAG
AGTGAGTGGGCAAATGTTTGGCTGCGGCATAGCTGTTGAGTTTGTGTTTCAGATAAACCAAGTAAAAAAAAGAAAGAAACATTGAAACTTCTGGTGGAATGAAGTGTTCATACCCCTTAA
ACTTTTTTTGTCTAGAATACAAATGTATGCCACACGTTTCAGATTTTTATTTGCCAAAAAAAAAACAACTTGAAAAATAATAAATCATTTTCATTCAATTTCATGCATACTCTAAACCCC
CAGAAGTTTGTGGTTGTAAAGTAATAACCGCAAGGCTGTCGTCTACCTGCAGACTGAGGGAACATTTTCAGCCATGGACCTCTGCACATTTCTCACAGTAAAAACGTTTTCTCACCATTT
AAATGGTAGAACTTTGGTTTAGAGGTCTATAAATTACAACTGATTTGAATCTGAGTTAATGTTACATGAGGCCCAGTCATGATTAACTCGGCGAGTTTACAGTTTGGCTTAAATAAATAA
CAGGAGAATAAATCACATCGTTTTATAACATTGTTTAGCAGACGTACTGTAATTAGTTTGTCACAGTTTATCATTTTCTTCTCTGTTTGCAGTTGTCAGACATGATGTGTAATAAGTCGT
TTACAAACCCCAAAACCAAATAAATACGATGTTTTAGATCAAACTAACTTCGGACATCGCTGTATCCAGTTTTCATCTTGTGCACTCCTTTCATATTGTCTATTCATTAGTTGAAGTTTT
CTCTTGAAATAGTCTTTGCTTTAAATGAAGGCGTTCATGTTTGCTCAAAAGAAAGTACTGCTATATTCAGTATGTTAAAGAAGCCATCCCATTCCTTTTAAACACCTATTTTAACCGTAC
TTTTATCTAATTTTGCACGCAGTTATTGTTCTGTTTTCCTGCACAGTCGAGATTGTCTCACTAGATTACAAACAAAAATGTAATTTAATTAAACTAGGAACAAAAGGAAAGTCAGAGTGC
GATCCTGTTGGGGGTTGAGTTAAAAGACAAATCCCTGAAGCTCATAAGACTTCACATCTGTCTCCGAAACATATCTGTTGTGTGTGAAGTTGGAAGAGCTATCGCAGGCTTGACCCGAAC
AGATGGTGCTGTAGGAAGTAAGTTAGTGTCAAGTAATGAGAACTGCTCACATGGAGAGAGGCAGCAACAACAATGCCTGATTTCTGTTCCCCACCCTTTGGCTTTATGTGATGGTTTGAA
AAAGTTTGTGTGTTTATCATGTTGCCTTATTTTTGTGACAGAAAAAAAAAATTGACCATGATGAATCTTTTCAAAAATAACTCCCACCTTTAATGTGGCAAGTGTGCTGCAACCTCAGCA
TTTTGTGTTATTTGGTTTGGAGTATCAGCATTCCACAGCTTGACTTGGCAACATTAGGCTTCCCACTTTTTTTTTTCCAGGGTTGATTTCTCTCTACCACTGCGCTCCTCAGGTGACGCT
ACAGATTTTCCAGCGATTGGTGTTCATAGACTTGCATTTCCTTTAATTCTGGTGTAACCTTTTTTTGTGTGTTGTTCTTTTAACTTGCATATCATTCCCACTTCACTAAACATGACAAGA
AGTCTAGTAAGTGAAGAAAAGTGATCCCAGACCATGATGGTACCGCTACCTTGCTTTACCATGGATTTAGTGGGGGGGTTTTGGTGATGTGGTGTGTTGTTTAATAGGTTATTTATATAA
CTTGAGCAAATACAAAATGTAGTTTTCAAAAGATGATCTTGTCTTTTGAGAGAATGTAGCTGTACAAACAAACCTCTCTACAAACTGGACTTTACCTAAAGCTGCAAATGAGCAAATATA
AGGAAAATCCCACTAACAGCTGGACTTTATTGACACTTAATTACACTCTGTAAAGTTGACGGCATGCGCGTAAGAATGAACCCTGGAAAGGACTCAAAGGGTGGTCCAACAAAGTTTTAC
TTATGTAACCAGTTTACTGCAGCTTTTAAAAGTGAGTTTTTTTGTTCATTAATGCAGCTTGTTTGTCTCAGAATGAAAAGACTTTTGAAATCATTTGTTTTGGTTCATGATGTTACAAAA
CTTGGGCTTTTTGGCAGCAGTGTGTGTCAGGGTCTGCTTATAACCACTGAATGATCCACTTTCTTTTTTATGACCAGAAGGGAGAGCTTTTAACTCAGGTTTTCCTCCTGTTTTCCACAG

TGAACCCATGCTGTTACCTCCCGTGTCAGCACTGGAGCGTCTGCGTGCGCTACGGCGAGGACAAGTATGAGTGCGACTGCACTCACACCGGATACTACGGAGAAAACTGCACCGTCC
GTG
AGTCGACTCATCTTCAAAAGAGCCTCCTCTCATTTCCTCCGTCGTTATTACACTTCTCAGGAATTCAAGATCCGTGTTTTCTCCAAAGAGTCGCTTACGGATCAAGAGGGATTCTTGTTA
TATTGCGACAAAGCTCCCTGGTCACGGAGTCGAAGCCGTCTTGTCTAGACCAAATATTTGGGGAAAATCTGGTGAAACTGCCAGCAGAAGAGCAGCTGCATCAGAAGTTAATCTGTTGAT
TTCTTCTGCAGAGGCTTCTACTCTGCTGGTCTGAACTGGTCTGCTTCTCATTTCCACGAAACAGTCACCCTGCTGCGGTTTGCAGTCAGGGGTTATGCATACTCTGAGACTGACAGATAT
TTAAAGTGCAACAATTACTTTTAATGGTGATGCGGGGGGGCGGGGGGGAGATGAGAGGGAAGTGAAGAAGGAAAAGGCCAGCAGAGTTAAAGGAGCCGGAGGAGAGGGGCTGGGTGAGAA
CGTCTGCATAGCTTTTTTTATTATCTGACTTTTCGGATGACCTTCCCTTAATGTTTCCGGGAATCCTGGCCCATTCTCCCTCAGAAAACTGGTGGAGTCGCGTTTGCCGGAGTCACTGGT
TGCGTACACCATTTTTACAGCAATATTTTCATAGAGTGTTCATCCTTTATGATGTGATTTCTTTTATGAAGAGCATCACACACACACACACACAATGGAGAACGGATGCCGTCACACCCC
TCACTTTGTATTTGACTAGGGAGGGCTAGAAGCCTCCCTCTTTTTCCTCCAGATGTAGCGGCTGTCATTATGGCCGAGCACGCAATGCTAACTGATGTCAGACAGGAAGACTTTAGTCTG
ATTTCAAAAAGGAAAAACTATGACGTGGCGTCTATACAGTGAATGGAAATACCTCGTTTCAGCTGCAGTATGTTACAAATCTCGGCACATGATCAAAGGGTTTGGACCGCAGCAGACATG
TAGGAAATAACATTTTGGTTTTTTTTGTATGTCACATTTTGTAAGTGTCTGACTTAGGTCATTATTTCATTATTATTTGTAGAGTAGAGACAGACTCTACATTGATGCTTTTTAGTAAGG
AGAGCACCTCAGCGGACGCACTGTGCCGCCCAACGCTGAATGCTAAAATAGAATCCTTTGATTTATGTTCCCTGGGTTCCAAGATGGTAGATAAGTTTAATTCTTGTAACAAAGTAATCT
CCTTATGAAGCCCAGGATTCCCGTAAGTTACATTTTGGCGCTTAAGAGCCTTTGGGAAAACATGCCCAATGTTGATCTTGTGGTTTGAAGGCGTTTTATCTCTGTGACAGGAAAATCCTG
GATTCAGGATTTGTAGCTCAATAATGAGAACGAGCTACCATGTTGTTAGACCCAGTTTATGAAGTCGGTGAATAGAGAGATGTGGGTGGCCTCAGCTGTTAAGGCTTACAAAGGCCCCTG
ATGGACTATGACATAATGACTCAGCTACGTAAAGTACATTTCCTCTCCACATTCCCAGTTGTTCTCATTTCCACTAAAATAAAAAAATAAAAAGTGGGTTTCCCCCCCCCCCCCCCCTTT
TGCCCACTCATCATAGCTGAACTTTGGACCCGGGTGCGTCGGTTCCTCAGGCCCAGTCCAGATGTGGTGCACTACATTCTCACCCATTTCCACTGGCTGTGGGACGTCATCAACAACACG
TTCTTACGGAACGTCCTCATGCGGCTGGTTCTGACGG
GTCAGATGATTGTTTGGACAGATTTGCTAGGGTCACGTACCACGGCGTTTATTTATGCTAGCTCTCTTCCTTTTGTCAACAGT
GAGGTCCAACCTGATCCCCAGTCCTCCCACGTTCAATTCAAAATATAACTACCTCAGCTGGGAGTCCTACTACAATCTCAGCTACTACACCAGGATCCTGCCGCCTGTTCCTGAGGATTG
CCCCACGCCCATAGGGGTCAAAG
GTGAAGTCTGAGACGCTGAGGACTGTCAGCAGGAGTCTAGTTTTTAATTGTACATGCATGCTGTTAAGTTGTTACACATGTTCTCTGAGTTTGAGTT
GATCTGACTCTCGATCAACTTTTAATTAGTAATTGTGTGATTTGACATGTTGGAACATTTCTCACCTTTCTTGCTTCAAGTGGTGAAGAAAAGAGGACAAGGCATTCGAGTACAGCAGAT
TTGTGATCAGGAAATTGCCATATAAAAGTTTCTGCTGGTCTAAACTTGTACATGTCTAGAGTTAGAGCGATATTTAGAAAGTTTAAAACAATTGGTTTTAAACTTGACATCGCACAAAGT
GAGGGGTTGTAACAATTCAACTGGAAAACAAATAAATGTGTGAGGGGAAAAGCCAGGTTGTATTGATATGCACACTATTGAACTAACACTTTGCTAAATCATCATTCAGTTCATTTTCAG
CCTTCAGTCACTTTGAGTTTTTATTATTTTAAATCTGACTAATTGGAGATAAAACTCATCTGTTCTCGTTGGATTTAAAAAAAAAAAAATATATATATATATNNNNNNNNNNNNNNNNNN
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNATATATT
TTACCCTGTTTGCAACCTTTGGCTGAAACCATATCTTGCAGAGATTTAACAAATCTGAACAGTTGTTTTCAGCAAAATTGGACATCGAGATTTGGAGAAAAAGTGGGACAACGGTGACGT
AACAAAAACTGGATACTTTTCCGAGATTTTTTTGAGAAGGAAAGCAGGAAACAGGGAGGCTTTCAAGATGCCAATAAAAACTCTCAAAAAAATTGAGAGCGAAACATATTGCTCAAAAAG
AAAAATGAAAAGATGGGCTAAAATCTCCCAACACTTTGTGAGAAAATGTGTTGTGGTTTAATGAATCCAGCCTTGAAGTTATGGGACACAATTCCAAAAACTACAGTGAACATCACCTTA
AAAACACCATATCCAAGGTGTAACCAGGGTTACTTCTCTTCAGGTGAAACCGAGAGATTTTTTAAAGGTGGATGAAGTTATGAATTTCTACAAATGTCAGTCAGTTTTGACCCAAAACCT
ACAGGAGGCAGATGTGTGCCTGTAAATCCAAGCTTACATCCAAATCTAGAACAAAAAACAGCTTCACAAGAGAAAAATTAAGGTTAAAATAAATTAAAGGTTCATGTATAGAAGTCTCTG
AATGAAAGATGTCTTCACAATCTCACCTATTAGGAGAACTTTAAATGTGCCAATAAACCAATAAATATATGGTTGTGTGTGACGCTTTGTGTTTGTTTTTTTTTCTCTCTCTCTCTCATT
TTGCTCAGGCCAAAATGGCCTCCCGGACCCTGAGGTTTTGGTTGAGAAGCTGCTGAAAAGAAGGACATTCAGGCCCGACCCTCAGGGCTCCAATATGATGTTTGCTTTCTTTGCTCAGCA
CTTCACCCACCAGTTCTTCAAGACCTACAACCGCATGGGTCTGGGCTTCACCAAGGCTCTGTCACACGGG
GTCAGTCCGCGAAAAATAACAAACCTTTTAGAAAAGATAAAAATTATGAC
CCATAAAAGTATTTTAATCAGATCTTGGTCAGCTGTATGTTAAATTTCCCTCCATTTAATCCGTGTTTTATCTTGTTACTCGTGCAGGTGGATGCGGGCCACATTTATGGAGACAACCTG
GAACGTCAGCACAACCTCCGGCTTTTCAAAGACGGAAAACTGAAATATCAG
GTGAGACGTGCGGCGTTAGCTTTAACATATGGAACAAGATCAGAACAGAAAATAATAGTTTCAGATCTC
CAGGTGCTTTTGCATCGAACCAATATGATGATAATGTGTCTTTTAACACATTCAGGGCAGTGTTTTCATTTTCTATTTGTCAAAATTATTTTTTCCTGATTCTTAGCCAAGTACCATTGA
TCAAAAAATATCCTGAGCAACGGTCATGTCGCCAGAAACAGGGAAGCTAATTACCAAGCATGGACCGCGTCATAATTAATTCCTGTTTTTCTCCATCAGTTGATCGATGGAGAAATGTAC
CCTCCATCTGTAGCTGATGCTCCCATCAAGATGAGCTACCCTCCCGGGGTCCCGGCGGAGAGACAGATGGCCATTGGTCAGGAGGTGTTCGGGCTCCTTCCTGGTTTGGGTTTGTACGCC
ACACTGTGGCTCAGGGAGCACAACAGAGTCTGTGACGTCCTGAGAGCAGAGCATCCGACCTGGGACGATGAGCAGCTTTTCCAGACGACCCGCCTTGTCATCATCG
GTGAGCTCGACTCT
TTGGAAGACATGTTTATTCTAGAGTCCACAAGAATTATTCACGTATCGAATTTGCCCCTTATTCCTTGAATGACATGGACGTGAGCTCTTTTGATAATTATTTACTGTTGGTGTGATTAG
CTCAGAATGGTCAGTAAGAAACACAGACTGTGGATTTTGTTTGCAGGATTTCATCATCTGCATCTGTTAGGTGTAAAACATTCATTTTCAGACTCTGTTGCTGCTCACCTTTCATTCACA
GCCTTTAAATGCATCAGTTCTTGCCTGCAGGCAGCTTTCTGTGCATTTAGCAGAGACTGAAACACCTTTCCTGCTCCTGGGTGAGAACCAAGTAGCGAGCAGGATGTGCTTGTTCAGCAG
TTTTTTGCGGGGTTTTTTTCTCCAACCCTGGTTGTCAAGGCGCATCGGCCTGTATGTTTTATGCGTTTTCCTCCTCCAGCACACCTGATTTCAATTTAAGTCTGATTAACATGCTTTTCC
TGAACTGCAGTCATCTGAATCGGGTGTGTTAAAGCAGGAAATATTTAAAACATGCAGGGCAGTGTGCCCAGAGGACCAGGGTGGGGAAACACTGCTTTAGAGTATTATTATTATTTTTAT
TTATTTTTTTTTTCATTTTATGTACTTTTGTTGTCAGTTTTCACAGTGAATCTACAAAATTAAACAGAAGATTCCAAACACATAAAGCTACTATATTAAATGCAGAGTGCAGAACTTGCG
ATGACCACCACCGTCCGTCTGATTTTCAGGCGAGACCATACGGATCGTGATAGAGGAGTACGTGCAGCACCTGAGCGGCTACCTGCTGCAGCTCAAGTTCGATCCCACCCTGCTCTTCCA
CTCCCACTTCCAGTACGGGAACCGCATCGCGCTGGAATTCAGCCAGCTCTACCACTGGCACCCGCTGATGCCCGACACCTTCCACATCGACGGAGACGAGCTGACGTACGCGCAGTTCCT
CTTCAACACGTCTGTCCTGACGCACTACGGCGTGGAGAAACTGGTGGATGCCTTCTCTCGGCAAGTTGCTGGCCAG
GTAACGACGATCTGAAGGAAACGTCGAAACGACCTCCGACTGGT
TTCCTTAGCACTTGACCACATTGCATAAGAATAAAAAATTATATATATATCCATTTTCTTGCACCCTTGTCCCTTAGTGGGGTCGGGAGGGGTGCTGGTGCCGATCTCCAGCTAACATTT
CAGACGAGAGGCAGGGGTCACCCTGGACAGGTCGCCAGTCTGTCACAGGGCAACACAGAGACAAACAGGACAAACAACCATGCACACACACACTCACACCTAGGGGCAATTTNNNNNNNN
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTTTTTTTGGATCATGTTTCTAAGCTCCTTTTTT
CTGCAGACTGTAAAACATTCTTTGGTTGTTTGTAGGTTTTGACGGCATGTAACATTTTAGTTTATCTGCTTTTGTGTGACAGCAAGTCTCACAAGCAACTGAGGTACTGTTGGACTTTCA
TTCATTGTTTCCCGTTTTGCTGCAACTAATAATATGTTGACATGATGTGTTAAAAAAAAAAAGGGTGTTGAAAACGTTGCTTTAGTTTGTTGGACATTTCCCAAAGTAAGCGTGTTAAAA
GCCTCAAGAGGATGCCAGATCTCATACGAGTGGATCCTGGAATGTTTTCCTCTGCTCAAGAACAACAAAGCTAGAACAATGGTTTTTGTATGATATGCATTTCTGCATCTCACTTAATAA
TTTATTAGGCACAGATAATGACAAGTTGGACCAGTCTTCAGGACTGTCTTAAGCCTTTGTTCAACACGGTGTCTAAAATTTAAAAAATCCCTTTGGAGATTTTTGGAGTGTCTGCAGCAG
ATTTGTCATCTGCATAGACATTTTCCATTCCATCACACCCTAAATATGCTCTGTTGGATTGAGATCTGGTAACCGTGGAAACTCATCGTGATAAGGGAATCAGTTGGAGGTCGTTTTATC
TTGTGGCATGATGAATTATCCAACTGGAAGCAGCAATCAGCAGATACATAGATACAGTGTTGGCTGCAGGCTATAAACAATGCTGGTTACTCCGGTGTGCCAAGAAAATACCCCACAGTT
TATTGCACCACCCCTCCAGCTTTATCAGCTCATGTAAGACAGGTTGGATAAATGCTCTTTTTTTCGTTTGCTCCAAATTCAGACGCTATCAATAAAATGTGACGGTGTCCAAATATGATT
TGAACGTTAAAGGCACTGATGCCGTTCTACCATGTTAGTATGTAAATATAAGCTATACATTTAAAAGTATTTTGGTTTTAATGTAAACCAAATACTTGACTTAAATAATAAACAATAGAA
CAGGATAAAACTAAAATTTCACTGACAAATATTTCAGATTTTGTTCCTAGTTTTTTTTCTTGTTTGCTTGTTTTTTTGTTTTGTTTTTTGTAAGGAAAAATAATGTGGAATAAGCAACTT
GCAAGAAGTAACTAAGCAATTCATTTACAATTGTTCACGTTTCTAATATTTTTAATCTGCAGATTGGTGGAGGCCACAACATGAACGCTATTGTCTCCAAAGTCGCTGTGACAACGATAA
AGGAGTCCCGCGAGCTCCGGATCCAGCCTTTCAACGAGTACAGGAAGCGTTTTAACCTCGAGCCGTACACATCATTCAGAGACTTCACCG
GTAAGACAGACGGCTGTTTACCGTAAAAAT
CATTTGGAGACATCTTGTCTTCATTTCAAATAGTTCCAGAAACGAGGATGATTTATAGCTGGAAGAAAGAAAAAAAAACTCTGGCCACCATAGACAGGGTCCAAAATATTTGAGGGTGCA
TAATATGACAGTGCTCTCTTTGAGAGGCCAGAAAAAGTCAAACTCAGAGCAGCAGCTCTCATGATTTCATGTCTGAAAGAGTGTGTGGTGCTGCAATGCTCAGAGCACCAATGCCACATA
TGCAGCTTTGAAACTTTGTTTATGGGGTAAAGCCAGGAATAGCACATAAAACAAGTGCAATGGAGCATCTGCCTTGCTGCTCAATGCTCCGGTAATATTATAGCCTGGCTACAAATCAAA
CCAGGTTTGAGTTTCTTTCATATTTTGAAAGAAATCAGTCTTCGTTTAATGTCGATGGCCGGGTTTGGGATTTGACCTGTGCAGTTCAAAGTGATGCTAACTTGTAAAGTAGAAGGTAAA
CAATGCTTTATTTTTAAAATCTTATGGAAATAAAGGAAAGCTGACTGTCTTTTTTATGTAAGCATCAGCTTTCCAAACCTCGATCTTTGCTCTTTCTTCTTTTCATAATTGCTCAAGTTC
AGTCAAATTGAAAGAAGAGTATCTCTGTTTTTTTCTTGATAGTTTTTCCAATTCGATTTGGGTCTGGACTTTGACTAGGGCATTCTAGCACATGATTGTCTTTTAACCTAAACTACTTCA
GAGCATCTTCTTCTGTACCCATCTGAAGCGTTACATATTATACTGATCTGGCACCTTAACATTCACACATCTGTCAGATTGATATATTTACTCATCTTCCTTCTACCGTACTATCAGTGT
ACATTTTAAGTGTTACTTCTGGTCCCTTTTTTTGCAGATAACGAGGAGATAGCCAGCACCCTCGAGGAGCTCTACGGGGATATCGACGCTCTTGAATTTTACCCCGGGTTACTGCTGGAG
AAGACTCGAACGGGGGCGATATTCGGAGAAAGCATGGTGGAAATGGGCGCCCCCTTTTCCCTCAAAGGCCTCCTGGGTAACCCCATATGCTCCCCAGCATACTGGAAGCCCAGCACATTC
GGAGGCAAAGTCGGCTTCGACATCGTGAACTCGGCCACTCTGAAGAAGCTGGTGTGCCTGAACTCCCGGACGTGTCCCTACGTGGCGTTCAGTGTTCCAGCAGAGGAGAAACCAGTCAGG
AAAGAACCAAGCACTGAGCTATGACCATGTGCAGATCCCCGGGGAGGGGGGGTTGTGTTTTTTTTTTGTTTGTTTTTTTACTCCAAGTGGCTTCACAAAGCAAGCAAAGATATTCGTTTG
GAGAAAACAGCAGTGCTTGTTTTAGCAGCACTGCAGATCGTTACAGAGCCCAGTGCTCTGTGTGAAATCCAACTCTCCTGTTACTAAACTCGCTTGCAGCGCGTCCCACACTTGAACGAT
CACATCAATGAGGAGCCGAACGTGGTTTTTTTTTATTAAATGCTTTCTGCCTACAGACTGAAAAGTTGTTGAAGTTTGGACCGTCCGATAAAATAGACGTGTATTTGTTGGTAAATAGTT
TATTTTGGAATAAAAACTATACCCACATGATGTGCTGTTTTCAATGAATAAAGATTGGAAGGTGACA

Retrieve as FASTA  
CDS
Send to BLAST
.........1.........2.........3.........4.........5.........6.........7.........8.........9.........0.........1.........2
TTTTCCATCTGATGGGAGGTGGTGGGACAGCAGTTCTCAGAAATAGGAGGAAGCTTGTTGGACAGCTCGTCCAGTTGCTCTCACTCCGACCTTCAGCTGCTGAGTCTCCTTCCTCTGACT
CTCAGCCTGTCTGCTGGATTATTGCACTTCTGCTGTTTTACACATTGGAATGACATCCTCCTGAACTGAGGCTGCTGTAATGAGAG
CCTCTATCCTTGGATCAGTTTGTGCTCTTCTCTT
GCTCCTGCGGGAGCCCGGATGCCGGGGAGATGAGGTTACGACCAGCACAG
TGAACCCATGCTGTTACCTCCCGTGTCAGCACTGGAGCGTCTGCGTGCGCTACGGCGAGGACAAGTATGA
GTGCGACTGCACTCACACCGGATACTACGGAGAAAACTGCACCGTCC
CTGAACTTTGGACCCGGGTGCGTCGGTTCCTCAGGCCCAGTCCAGATGTGGTGCACTACATTCTCACCCATTT
CCACTGGCTGTGGGACGTCATCAACAACACGTTCTTACGGAACGTCCTCATGCGGCTGGTTCTGACGG
TGAGGTCCAACCTGATCCCCAGTCCTCCCACGTTCAATTCAAAATATAACTA
CCTCAGCTGGGAGTCCTACTACAATCTCAGCTACTACACCAGGATCCTGCCGCCTGTTCCTGAGGATTGCCCCACGCCCATAGGGGTCAAAG
GCCAAAATGGCCTCCCGGACCCTGAGGT
TTTGGTTGAGAAGCTGCTGAAAAGAAGGACATTCAGGCCCGACCCTCAGGGCTCCAATATGATGTTTGCTTTCTTTGCTCAGCACTTCACCCACCAGTTCTTCAAGACCTACAACCGCAT
GGGTCTGGGCTTCACCAAGGCTCTGTCACACGGG
GTGGATGCGGGCCACATTTATGGAGACAACCTGGAACGTCAGCACAACCTCCGGCTTTTCAAAGACGGAAAACTGAAATATCAGTT
GATCGATGGAGAAATGTACCCTCCATCTGTAGCTGATGCTCCCATCAAGATGAGCTACCCTCCCGGGGTCCCGGCGGAGAGACAGATGGCCATTGGTCAGGAGGTGTTCGGGCTCCTTCC
TGGTTTGGGTTTGTACGCCACACTGTGGCTCAGGGAGCACAACAGAGTCTGTGACGTCCTGAGAGCAGAGCATCCGACCTGGGACGATGAGCAGCTTTTCCAGACGACCCGCCTTGTCAT
CATCG
GCGAGACCATACGGATCGTGATAGAGGAGTACGTGCAGCACCTGAGCGGCTACCTGCTGCAGCTCAAGTTCGATCCCACCCTGCTCTTCCACTCCCACTTCCAGTACGGGAACCG
CATCGCGCTGGAATTCAGCCAGCTCTACCACTGGCACCCGCTGATGCCCGACACCTTCCACATCGACGGAGACGAGCTGACGTACGCGCAGTTCCTCTTCAACACGTCTGTCCTGACGCA
CTACGGCGTGGAGAAACTGGTGGATGCCTTCTCTCGGCAAGTTGCTGGCCAG
ATTGGTGGAGGCCACAACATGAACGCTATTGTCTCCAAAGTCGCTGTGACAACGATAAAGGAGTCCCG
CGAGCTCCGGATCCAGCCTTTCAACGAGTACAGGAAGCGTTTTAACCTCGAGCCGTACACATCATTCAGAGACTTCACCG
ATAACGAGGAGATAGCCAGCACCCTCGAGGAGCTCTACGG
GGATATCGACGCTCTTGAATTTTACCCCGGGTTACTGCTGGAGAAGACTCGAACGGGGGCGATATTCGGAGAAAGCATGGTGGAAATGGGCGCCCCCTTTTCCCTCAAAGGCCTCCTGGG
TAACCCCATATGCTCCCCAGCATACTGGAAGCCCAGCACATTCGGAGGCAAAGTCGGCTTCGACATCGTGAACTCGGCCACTCTGAAGAAGCTGGTGTGCCTGAACTCCCGGACGTGTCC
CTACGTGGCGTTCAGTGTTCCAGCAGAGGAGAAACCAGTCAGGAAAGAACCAAGCACTGAGCTATGACCATGTGCAGATCCCCGGGGAGGGGGGGTTGTGTTTTTTTTTTGTTTGTTTTT
TTACTCCAAGTGGCTTCACAAAGCAAGCAAAGATATTCGTTTGGAGAAAACAGCAGTGCTTGTTTTAGCAGCACTGCAGATCGTTACAGAGCCCAGTGCTCTGTGTGAAATCCAACTCTC
CTGTTACTAAACTCGCTTGCAGCGCGTCCCACACTTGAACGATCACATCAATGAGGAGCCGAACGTGGTTTTTTTTTATTAAATGCTTTCTGCCTACAGACTGAAAAGTTGTTGAAGTTT
GGACCGTCCGATAAAATAGACGTGTATTTGTTGGTAAATAGTTTATTTTGGAATAAAAACTATACCCACATGATGTGCTGTTTTCAATGAATAAAGATTGGAAGGTGACA

Retrieve as FASTA