Entry information : HsPxd02 ( PXDNL / HsVPO2)
Entry ID 5398
Creation 2007-05-29 (Marcel Zamocky)
Last sequence changes 2010-11-10 (Marcel Zamocky)
Sequence status complete
Reviewer Christophe Dunand
Last annotation changes 2016-02-18 (Christophe Dunand)
Peroxidase information: HsPxd02 ( PXDNL / HsVPO2)
Name (synonym) HsPxd02 ( PXDNL / HsVPO2)
Class Peroxidasin    [Orthogroup: Pxd001]
Taxonomy Eukaryota Metazoa Chordata Mammalia Hominidae Homo
Organism Homo sapiens (human)    [TaxId: 9606 ]
Cellular localisation N/D
Tissue type N/D
Inducer N/D
Repressor N/D
Best BLASTp hits
Perox score E-value HsPxd02
start..stop
S start..stop
HsPxd03 3040 0 1..1463 1..1463
PtroPxd01 3018 0 1..1463 1..1463
MmulPxd01 2693 0 1..1463 1..1413
CjaPxd02 2672 0 1..1463 1..1456
Literature and cross-references HsPxd02 ( PXDNL / HsVPO2)
Literature REFERENCE 1. Venter J.C., Adams M.D., Myers E.W., Li P.W., Mural R.J., Sutton G.G., Smith H.O., Yandell M., Evans C.A., Holt R.A., Gocayne J.D., Amanatides P., Ballew R.M., Huson D.H. et al. (2001) The sequence of the human genome. Science 291 (5507): 1304-1351.
REFERENCE 2. Nusbaum C., Mikkelsen T.S., Zody M.C., Asakawa S., Taudien S., Garber M., Kodira C.D., Schueler M.G. et al. (2006) DNA sequence and analysis of human chromosome 8. Nature 439: 331-335.
REFERENCE 3. Strausberg R.L., et al. (2002) Generation and initial analysis of more than 15,000 full-length human and mouse cDNA sequences. Proc. Natl. Acad. Sci. U.S.A. 99:16899-16903.
REFERENCE 4. Kimura K., Wakamatsu A., Suzuki Y., Ota TT., Nishikawa T., Yamashita R., Yamamoto J., Isogai T., Sugano S. (2006) Diversification of transcriptional modulation: large-scale identification and characterization of putative alternative promoters of human genes. Genome Res. 16:55-65.
Protein ref. GenBank:   NP_653252.3 UniProtKB:   A1KZ92
DNA ref. GenBank:   AADB02011479 (148733..483133)
mRNA ref. GenBank:   NM_144651.4
Cluster/Prediction ref. UniGene:   Hs.444882
Protein sequence: HsPxd02 ( PXDNL / HsVPO2)
Sequence Properties
first value : protein
second value (mature protein)
Length (aa):   %s   1463 (1440)
PWM (Da):   %s   163394.08 (160748.8)  
PI (pH):   %s   7.34 (7.35) Peptide Signal:   %s   cut: 24 range:24-1463
Sequence
Send to BLAST
Send to Peroxiscan
.........1 .........2 .........3 .........4 .........5 .........6 .........7 .........8 .........9 .........0 .........1 .........2
MEPRLFCWTT LFLLAGWCLP GLPCPSRCLC FKSTVRCMHL MLDHIPQVPQ QTTVLDLRFN RIREIPGSAF KKLKNLNTLL LNNNHIRKIS RNAFEGLENL LYLYLYKNEI HALDKQTFKG  LISLEHLYIH FNQLEMLQPE TFGDLLRLER LFLHNNKLSK IPAGSFSNLD SLKRLRLDSN ALVCDCDLMW LGELLQGFAQ HGHTQAAATC EYPRRLHGRA VASVTVEEFN CQSPRITFEP  QDVEVPSGNT VYFTCRAEGN PKPEIIWIHN NHSLDLEDDT RLNVFDDGTL MIRNTRESDQ GVYQCMARNS AGEAKTQSAM LRYSSLPAKP SFVIQPQDTE VLIGTSTTLE CMATGHPHPL  ITWTRDNGLE LDGSRHVATS SGLYLQNITQ RDHGRFTCHA NNSHGTVQAA ANIIVQAPPQ FTVTPKDQVV LEEHAVEWLC EADGNPPPVI VWTKTGGQLP VEGQHTVLSS GTLRIDRAAQ  HDQGQYECQA VSSLGVKKVS VQLTVKPKAL AVFTQLPQDT SVEVGKNINI SCHAQGEPQP IITWNKEGVQ ITESGKFHVD DEGTLTIYDA GFPDQGRYEC VARNSFGLAV TNMFLTVTAI  QGRQAGDDFV ESSILDAVQR VDSAINSTRR HLFSQKPHTS SDLLAQFHYP RDPLIVEMAR AGEIFEHTLQ LIRERVKQGL TVDLEGKEFR YNDLVSPRSL SLIANLSGCT ARRPLPNCSN  RCFHAKYRAH DGTCNNLQQP TWGAALTAFA RLLQPAYRDG IRAPRGLGLP VGSRQPLPPP RLVATVWARA AAVTPDHSYT RMLMHWGWFL EHDLDHTVPA LSTARFSDGR PCSSVCTNDP  PCFPMNTRHA DPRGTHAPCM LFARSSPACA SGRPSATVDS VYAREQINQQ TAYIDGSNVY GSSERESQAL RDPSVPRGLL KTGFPWPPSG KPLLPFSTGP PTECARQEQE SPCFLAGDHR  ANEHLALAAM HTLWFREHNR VATELSALNP HWEGNTVYQE ARKIVGAELQ HITYSHWLPK VLGDPGTRML RGYRGYNPNV NAGIINSFAT AAFRFGHTLI NPILYRLNAT LGEISEGHLP  FHKALFSPSR IIKEGGIDPV LRGLFGVAAK WRAPSYLLSP ELTQRLFSAA YSAAVDSAAT IIQRGRDHGI PPYVDFRVFC NLTSVKNFED LQNEIKDSEI RQKLRKLYGS PGDIDLWPAL  MVEDLIPGTR VGPTLMCLFV TQFQRLRDGD RFWYENPGVF TPAQLTQLKQ ASLSRVLCDN GDSIQQVQAD VFVKAEYPQD YLNCSEIPKV DLRVWQDCCA DCRSRGQFRA VTQESQKKRS  AQYSYPVDKD MELSHLRSRQ QDKIYVGEDA RNVTVLAKTK FSQDFSTFAA EIQETITALR EQINKLEARL RQAGCTDVRG VPRKAEERWM KEDCTHCICE SGQVTCVVEI CPPAPCPSPE 
LVKGTCCPVC RDRGMPSDSP EKR 

Retrieve as FASTA  
Remarks Complete sequence from genomic (chromo 8, 3 introns), 5 mRNA and 27 ESTs. Two splicing forms of HsPxd02 described in UniProt file. Isoform 2 is only 1316 AA long.
CDS
Send to BLAST
.........1 .........2 .........3 .........4 .........5 .........6 .........7 .........8 .........9 .........0 .........1 .........2
ATGGAGCCCA GACTGTTCTG CTGGACCACT CTCTTTCTCC TGGCCGGGTG GTGCCTGCCA GGGTTGCCCT GCCCCAGCCG GTGCCTTTGC TTTAAGAGCA CCGTCCGCTG CATGCACTTG  ATGCTGGACC ACATTCCTCA GGTACCACAG CAGACCACAG TTCTAGACTT GAGGTTTAAC AGAATAAGAG AAATTCCAGG GAGCGCCTTC AAGAAACTCA AGAATTTGAA CACACTTCTG  CTGAACAACA ACCACATCAG AAAGATTTCC AGAAATGCTT TTGAAGGACT TGAAAATTTG CTATATCTGT ACCTGTATAA GAATGAAATC CATGCACTAG ATAAGCAAAC ATTTAAAGGA  CTCATATCTT TGGAACATCT GTATATTCAT TTCAACCAAC TAGAAATGCT ACAGCCAGAG ACCTTTGGAG ACCTTCTGAG ATTAGAGCGA CTATTTTTGC ATAACAACAA ATTATCTAAA  ATTCCAGCTG GGAGCTTTTC TAATCTGGAT TCATTAAAAA GATTGCGTCT GGATTCCAAC GCCCTGGTTT GTGACTGTGA TCTGATGTGG CTGGGGGAGC TTTTACAAGG CTTTGCCCAA  CACGGCCACA CCCAGGCTGC GGCTACCTGC GAATATCCCA GGAGACTCCA TGGGCGTGCA GTTGCTTCAG TAACAGTAGA GGAATTCAAT TGCCAGAGCC CCCGAATTAC TTTTGAGCCG  CAGGATGTGG AGGTACCATC AGGAAATACC GTCTACTTCA CCTGCCGGGC GGAAGGAAAC CCCAAACCTG AGATTATTTG GATACACAAC AACCACTCAT TGGATTTGGA AGATGATACT  CGACTTAATG TGTTTGATGA TGGCACACTC ATGATCCGAA ACACCAGAGA GTCAGACCAA GGTGTCTATC AGTGCATGGC CAGAAATTCC GCTGGGGAAG CCAAGACACA GAGTGCCATG  CTCAGATACT CCAGTCTTCC AGCCAAACCA AGCTTTGTAA TCCAGCCTCA GGACACAGAG GTTTTAATTG GCACCAGCAC AACTTTGGAA TGTATGGCCA CAGGCCACCC ACACCCTCTT  ATCACTTGGA CCAGGGACAA TGGATTGGAG CTGGATGGAT CCAGGCACGT GGCAACGTCC AGTGGACTTT ACTTACAGAA CATCACACAA CGGGATCATG GTCGATTTAC CTGTCATGCC  AACAATAGCC ACGGCACTGT TCAAGCTGCA GCAAACATAA TTGTACAAGC TCCTCCACAA TTTACAGTAA CCCCCAAGGA TCAAGTGGTG CTGGAAGAAC ATGCTGTAGA GTGGCTCTGT  GAAGCTGACG GCAACCCACC TCCTGTTATT GTCTGGACAA AAACAGGAGG GCAGCTCCCT GTGGAAGGCC AGCATACAGT TCTCTCCTCT GGCACTTTGA GAATTGACCG TGCAGCACAG  CACGATCAAG GCCAATATGA ATGTCAAGCA GTCAGTTCGT TGGGGGTGAA AAAGGTGTCT GTGCAGCTGA CTGTAAAACC CAAAGCTCTT GCAGTGTTTA CTCAACTTCC TCAGGATACA  AGTGTCGAGG TTGGAAAGAA TATAAACATT TCATGTCATG CTCAAGGAGA ACCACAGCCC ATAATTACTT GGAATAAGGA AGGTGTGCAG ATTACTGAGA GTGGTAAATT CCATGTGGAT  GATGAAGGCA CGCTGACTAT CTACGACGCA GGGTTCCCTG ACCAGGGAAG ATATGAATGT GTGGCTCGGA ATTCTTTTGG CCTTGCTGTG ACCAACATGT TTCTTACAGT CACGGCTATA  CAGGGTAGAC AAGCTGGCGA TGACTTTGTT GAATCTTCCA TTCTTGATGC TGTACAGAGA GTTGACAGTG CAATTAACTC CACACGAAGA CATTTGTTTT CACAAAAACC TCACACCTCC  AGTGACCTGC TGGCTCAATT TCATTACCCG CGTGACCCAC TGATTGTGGA AATGGCAAGA GCAGGGGAGA TTTTTGAGCA CACGCTGCAG CTGATACGGG AACGTGTGAA GCAGGGGCTC  ACTGTGGACT TGGAAGGCAA AGAATTCCGG TACAATGACT TGGTGTCCCC GCGCTCCCTC AGCCTCATCG CCAATTTATC TGGATGCACA GCTCGCAGGC CTCTGCCAAA CTGCTCCAAC  CGGTGTTTCC ATGCGAAGTA CCGCGCCCAC GACGGCACGT GCAACAACCT GCAGCAGCCC ACGTGGGGCG CGGCGCTGAC CGCCTTCGCG CGCCTGCTGC AGCCAGCCTA CCGGGACGGC  ATCCGCGCGC CCCGCGGGCT CGGCCTTCCT GTGGGCTCCC GCCAGCCCCT CCCGCCGCCC CGGCTGGTCG CCACAGTGTG GGCGCGCGCG GCGGCCGTCA CCCCCGACCA CAGCTACACG  CGCATGCTCA TGCACTGGGG CTGGTTTCTA GAGCACGACT TGGACCACAC AGTGCCTGCG CTGAGCACAG CCCGCTTCTC GGATGGGCGG CCGTGCAGCT CCGTCTGCAC CAACGACCCT  CCTTGTTTCC CCATGAACAC CCGGCACGCC GACCCCCGGG GCACCCACGC GCCCTGCATG CTCTTCGCGC GCTCCAGCCC CGCGTGTGCC AGCGGCCGTC CCTCTGCGAC GGTGGATTCA  GTCTATGCAC GAGAGCAGAT CAACCAGCAA ACAGCCTACA TCGATGGCTC CAACGTTTAC GGGAGCTCGG AGCGGGAATC CCAGGCTCTC AGAGACCCTT CGGTGCCTCG GGGTCTCCTG  AAGACAGGCT TTCCTTGGCC TCCCTCCGGA AAGCCCTTAT TGCCCTTTTC TACAGGCCCA CCCACCGAGT GCGCGCGACA GGAGCAGGAG AGCCCCTGTT TCCTGGCCGG GGACCACCGG  GCCAACGAGC ATCTGGCTCT GGCCGCCATG CACACCCTGT GGTTCCGGGA ACACAACAGG GTGGCCACGG AGCTGTCCGC CCTGAACCCC CACTGGGAGG GAAACACGGT TTACCAGGAA  GCCAGGAAGA TCGTGGGCGC GGAGCTGCAG CACATCACCT ACAGCCACTG GCTGCCTAAG GTCCTGGGGG ACCCTGGCAC TAGGATGCTG AGGGGTTACC GAGGCTACAA CCCCAACGTG  AATGCAGGCA TCATTAACTC TTTTGCTACT GCAGCCTTTA GATTTGGCCA CACATTAATC AATCCTATTC TTTACCGACT GAATGCCACC TTAGGTGAAA TTTCCGAAGG CCACCTTCCG  TTCCATAAAG CGCTCTTTTC ACCGTCCAGA ATAATCAAGG AAGGTGGGAT AGACCCGGTT CTCCGGGGGC TGTTTGGCGT GGCTGCTAAA TGGCGGGCAC CCTCCTACCT TCTCAGTCCT  GAGCTGACCC AGAGGCTCTT CTCCGCGGCT TATTCTGCGG CCGTGGATTC GGCTGCCACC ATCATTCAAA GGGGTAGAGA CCACGGGATC CCACCATATG TTGACTTCAG AGTTTTCTGT  AATTTGACTT CAGTTAAGAA CTTTGAGGAT CTTCAAAATG AAATTAAAGA TTCAGAGATT AGACAAAAAC TGAGAAAGTT GTACGGCTCT CCAGGTGACA TTGACCTCTG GCCCGCCCTT  ATGGTTGAAG ACCTGATTCC TGGTACAAGA GTGGGACCAA CACTTATGTG CCTGTTTGTT ACCCAGTTTC AGCGGCTAAG AGATGGAGAT AGGTTCTGGT ATGAAAACCC TGGAGTATTT  ACCCCGGCAC AACTCACTCA GCTGAAGCAG GCGTCCCTGA GCCGGGTGCT TTGTGACAAT GGTGACAGCA TTCAGCAAGT GCAGGCTGAT GTCTTTGTAA AGGCAGAATA CCCACAGGAT  TACCTGAACT GCAGCGAGAT CCCGAAGGTG GACCTGCGAG TGTGGCAAGA CTGCTGTGCA GACTGTAGGA GTAGAGGACA GTTCAGAGCA GTGACGCAAG AGTCTCAAAA GAAACGCTCA  GCTCAATACA GCTATCCTGT TGATAAGGAT ATGGAGTTAA GTCATCTAAG AAGTAGGCAA CAAGATAAAA TATATGTGGG TGAAGATGCT AGAAATGTGA CAGTTCTGGC AAAAACAAAG  TTCTCCCAAG ATTTCAGCAC GTTTGCAGCG GAAATTCAGG AAACCATCAC AGCACTCAGA GAGCAGATAA ACAAGCTGGA GGCACGCCTG AGGCAGGCAG GGTGTACAGA TGTTAGAGGG  GTTCCAAGGA AGGCCGAGGA GCGCTGGATG AAAGAAGACT GCACTCACTG CATTTGTGAG AGTGGCCAGG TCACCTGTGT GGTGGAGATT TGTCCCCCGG CTCCCTGTCC CAGTCCTGAA 
TTGGTGAAAG GAACCTGCTG TCCAGTTTGC AGAGACCGAG GAATGCCAAG TGATTCCCCA GAGAAGCGCT AA 

Retrieve as FASTA  
cDNA
Send to BLAST
.........1 .........2 .........3 .........4 .........5 .........6 .........7 .........8 .........9 .........0 .........1 .........2
AGTCCAGCAG CCACCATCAC CACCACTGCG GTTGCTGCTG CAGCTGCAGC TGCTGCTCTC CCTCCGGCTG CTTCTTCGCG TGGCCAGCAG CGAATGGAGC GATGGAGCCC AGACTGTTCT  GCTGGACCAC TCTCTTTCTC CTGGCCGGGT GGTGCCTGCC AGGGTTGCCC TGCCCCAGCC GGTGCCTTTG CTTTAAGAGC ACCGTCCGCT GCATGCACTT GATGCTGGAC CACATTCCTC  AGGTACCACA GCAGACCACA GTTCTAGACT TGAGGTTTAA CAGAATAAGA GAAATTCCAG GGAGCGCCTT CAAGAAACTC AAGAATTTGA ACACACTTCT GCTGAACAAC AACCACATCA  GAAAGATTTC CAGAAATGCT TTTGAAGGAC TTGAAAATTT GCTATATCTG TACCTGTATA AGAATGAAAT CCATGCACTA GATAAGCAAA CATTTAAAGG ACTCATATCT TTGGAACATC  TGTATATTCA TTTCAACCAA CTAGAAATGC TACAGCCAGA GACCTTTGGA GACCTTCTGA GATTAGAGCG ACTATTTTTG CATAACAACA AATTATCTAA AATTCCAGCT GGGAGCTTTT  CTAATCTGGA TTCATTAAAA AGATTGCGTC TGGATTCCAA CGCCCTGGTT TGTGACTGTG ATCTGATGTG GCTGGGGGAG CTTTTACAAG GCTTTGCCCA ACACGGCCAC ACCCAGGCTG  CGGCTACCTG CGAATATCCC AGGAGACTCC ATGGGCGTGC AGTTGCTTCA GTAACAGTAG AGGAATTCAA TTGCCAGAGC CCCCGAATTA CTTTTGAGCC GCAGGATGTG GAGGTACCAT  CAGGAAATAC CGTCTACTTC ACCTGCCGGG CGGAAGGAAA CCCCAAACCT GAGATTATTT GGATACACAA CAACCACTCA TTGGATTTGG AAGATGATAC TCGACTTAAT GTGTTTGATG  ATGGCACACT CATGATCCGA AACACCAGAG AGTCAGACCA AGGTGTCTAT CAGTGCATGG CCAGAAATTC CGCTGGGGAA GCCAAGACAC AGAGTGCCAT GCTCAGATAC TCCAGTCTTC  CAGCCAAACC AAGCTTTGTA ATCCAGCCTC AGGACACAGA GGTTTTAATT GGCACCAGCA CAACTTTGGA ATGTATGGCC ACAGGCCACC CACACCCTCT TATCACTTGG ACCAGGGACA  ATGGATTGGA GCTGGATGGA TCCAGGCACG TGGCAACGTC CAGTGGACTT TACTTACAGA ACATCACACA ACGGGATCAT GGTCGATTTA CCTGTCATGC CAACAATAGC CACGGCACTG  TTCAAGCTGC AGCAAACATA ATTGTACAAG CTCCTCCACA ATTTACAGTA ACCCCCAAGG ATCAAGTGGT GCTGGAAGAA CATGCTGTAG AGTGGCTCTG TGAAGCTGAC GGCAACCCAC  CTCCTGTTAT TGTCTGGACA AAAACAGGAG GGCAGCTCCC TGTGGAAGGC CAGCATACAG TTCTCTCCTC TGGCACTTTG AGAATTGACC GTGCAGCACA GCACGATCAA GGCCAATATG  AATGTCAAGC AGTCAGTTCG TTGGGGGTGA AAAAGGTGTC TGTGCAGCTG ACTGTAAAAC CCAAAGCTCT TGCAGTGTTT ACTCAACTTC CTCAGGATAC AAGTGTCGAG GTTGGAAAGA  ATATAAACAT TTCATGTCAT GCTCAAGGAG AACCACAGCC CATAATTACT TGGAATAAGG AAGGTGTGCA GATTACTGAG AGTGGTAAAT TCCATGTGGA TGATGAAGGC ACGCTGACTA  TCTACGACGC AGGGTTCCCT GACCAGGGAA GATATGAATG TGTGGCTCGG AATTCTTTTG GCCTTGCTGT GACCAACATG TTTCTTACAG TCACGGCTAT ACAGGGTAGA CAAGCTGGCG  ATGACTTTGT TGAATCTTCC ATTCTTGATG CTGTACAGAG AGTTGACAGT GCAATTAACT CCACACGAAG ACATTTGTTT TCACAAAAAC CTCACACCTC CAGTGACCTG CTGGCTCAAT  TTCATTACCC GCGTGACCCA CTGATTGTGG AAATGGCAAG AGCAGGGGAG ATTTTTGAGC ACACGCTGCA GCTGATACGG GAACGTGTGA AGCAGGGGCT CACTGTGGAC TTGGAAGGCA  AAGAATTCCG GTACAATGAC TTGGTGTCCC CGCGCTCCCT CAGCCTCATC GCCAATTTAT CTGGATGCAC AGCTCGCAGG CCTCTGCCAA ACTGCTCCAA CCGGTGTTTC CATGCGAAGT  ACCGCGCCCA CGACGGCACG TGCAACAACC TGCAGCAGCC CACGTGGGGC GCGGCGCTGA CCGCCTTCGC GCGCCTGCTG CAGCCAGCCT ACCGGGACGG CATCCGCGCG CCCCGCGGGC  TCGGCCTTCC TGTGGGCTCC CGCCAGCCCC TCCCGCCGCC CCGGCTGGTC GCCACAGTGT GGGCGCGCGC GGCGGCCGTC ACCCCCGACC ACAGCTACAC GCGCATGCTC ATGCACTGGG  GCTGGTTTCT AGAGCACGAC TTGGACCACA CAGTGCCTGC GCTGAGCACA GCCCGCTTCT CGGATGGGCG GCCGTGCAGC TCCGTCTGCA CCAACGACCC TCCTTGTTTC CCCATGAACA  CCCGGCACGC CGACCCCCGG GGCACCCACG CGCCCTGCAT GCTCTTCGCG CGCTCCAGCC CCGCGTGTGC CAGCGGCCGT CCCTCTGCGA CGGTGGATTC AGTCTATGCA CGAGAGCAGA  TCAACCAGCA AACAGCCTAC ATCGATGGCT CCAACGTTTA CGGGAGCTCG GAGCGGGAAT CCCAGGCTCT CAGAGACCCT TCGGTGCCTC GGGGTCTCCT GAAGACAGGC TTTCCTTGGC  CTCCCTCCGG AAAGCCCTTA TTGCCCTTTT CTACAGGCCC ACCCACCGAG TGCGCGCGAC AGGAGCAGGA GAGCCCCTGT TTCCTGGCCG GGGACCACCG GGCCAACGAG CATCTGGCTC  TGGCCGCCAT GCACACCCTG TGGTTCCGGG AACACAACAG GGTGGCCACG GAGCTGTCCG CCCTGAACCC CCACTGGGAG GGAAACACGG TTTACCAGGA AGCCAGGAAG ATCGTGGGCG  CGGAGCTGCA GCACATCACC TACAGCCACT GGCTGCCTAA GGTCCTGGGG GACCCTGGCA CTAGGATGCT GAGGGGTTAC CGAGGCTACA ACCCCAACGT GAATGCAGGC ATCATTAACT  CTTTTGCTAC TGCAGCCTTT AGATTTGGCC ACACATTAAT CAATCCTATT CTTTACCGAC TGAATGCCAC CTTAGGTGAA ATTTCCGAAG GCCACCTTCC GTTCCATAAA GCGCTCTTTT  CACCGTCCAG AATAATCAAG GAAGGTGGGA TAGACCCGGT TCTCCGGGGG CTGTTTGGCG TGGCTGCTAA ATGGCGGGCA CCCTCCTACC TTCTCAGTCC TGAGCTGACC CAGAGGCTCT  TCTCCGCGGC TTATTCTGCG GCCGTGGATT CGGCTGCCAC CATCATTCAA AGGGGTAGAG ACCACGGGAT CCCACCATAT GTTGACTTCA GAGTTTTCTG TAATTTGACT TCAGTTAAGA  ACTTTGAGGA TCTTCAAAAT GAAATTAAAG ATTCAGAGAT TAGACAAAAA CTGAGAAAGT TGTACGGCTC TCCAGGTGAC ATTGACCTCT GGCCCGCCCT TATGGTTGAA GACCTGATTC  CTGGTACAAG AGTGGGACCA ACACTTATGT GCCTGTTTGT TACCCAGTTT CAGCGGCTAA GAGATGGAGA TAGGTTCTGG TATGAAAACC CTGGAGTATT TACCCCGGCA CAACTCACTC  AGCTGAAGCA GGCGTCCCTG AGCCGGGTGC TTTGTGACAA TGGTGACAGC ATTCAGCAAG TGCAGGCTGA TGTCTTTGTA AAGGCAGAAT ACCCACAGGA TTACCTGAAC TGCAGCGAGA  TCCCGAAGGT GGACCTGCGA GTGTGGCAAG ACTGCTGTGC AGACTGTAGG AGTAGAGGAC AGTTCAGAGC AGTGACGCAA GAGTCTCAAA AGAAACGCTC AGCTCAATAC AGCTATCCTG  TTGATAAGGA TATGGAGTTA AGTCATCTAA GAAGTAGGCA ACAAGATAAA ATATATGTGG GTGAAGATGC TAGAAATGTG ACAGTTCTGG CAAAAACAAA GTTCTCCCAA GATTTCAGCA  CGTTTGCAGC GGAAATTCAG GAAACCATCA CAGCACTCAG AGAGCAGATA AACAAGCTGG AGGCACGCCT GAGGCAGGCA GGGTGTACAG ATGTTAGAGG GGTTCCAAGG AAGGCCGAGG  AGCGCTGGAT GAAAGAAGAC TGCACTCACT GCATTTGTGA GAGTGGCCAG GTCACCTGTG TGGTGGAGAT TTGTCCCCCG GCTCCCTGTC CCAGTCCTGA ATTGGTGAAA GGAACCTGCT  GTCCAGTTTG CAGAGACCGA GGAATGCCAA GTGATTCCCC AGAGAAGCGC TAATAAAAGT TTTGTGCTGT TGAGCCCCAA ATGGGAAATT TCTCAGGAAG AGACATTTAG GACTTCAGAA  CTTTTAACTT GTAGTCACAT TGTTGATATG GAAACCACTG ACTTAAGCAA CTTAGTTCAT CTAATCTTAC ATATACTTAC GATCTTTTAT TTTTTCATTT TCTAACATAC CTTGAAATAA  TTCAAAACTA AAAGCAATAA AGTGCATATG AAGTGTTTGA TCATAAGAAA TATTTCTTAC TGTAAGCTGT CAGTTTTATA TGCCACACCT GGAAATAAAA AGAATATCAT GGAATATTTA 
AAAAATAAAA AA 

Retrieve as FASTA