Entry information : CgDyPrx
Entry ID 13892
Creation 2016-10-07 (Marcel Zamocky)
Last sequence changes 2016-10-10 (Christophe Dunand)
Sequence status complete
Reviewer Marcel Zamocky
Last annotation changes 2016-10-21 (Marcel Zamocky)
Peroxidase information: CgDyPrx
Name CgDyPrx
Class DyP-type peroxidase B    [Orthogroup: DyPrxB001]
Taxonomy Eukaryota Fungi Ascomycota Sordariomycetes Chaetomiaceae Chaetomium
Organism Chaetomium globosum    [TaxId: 38033 ]
Cellular localisation N/D
Tissue type N/D
Inducer N/D
Repressor N/D
Best BLASTp hits
Perox score E-value CgDyPrx
start..stop
S start..stop
CcochDyPrx 2313 0 1..1229 1..1229
GfujiDyPrx02 1632 0 8..1188 3..1173
GfujiDyPrx01 1632 0 8..1188 3..1173
ACspDyPrx 87 1e-18 67..312 59..302
Gene structure Fichier Exons
ExonStart..EndSize ExonStart..EndSize ExonStart..EndSize ExonStart..EndSize
N° 1 1..3690 3690  
join(1..3690)


exon

Literature and cross-references CgDyPrx
Literature REFERENCE 1: Cuomo CA et al. (2015) Genome Announc. 3:e00021-00015.
REFERENCE 2: Zamocky M et al. (2016) BMC Genomics 17:763.
Protein ref. GenBank:   XP_001228851.1 UniProtKB:   Q2HBR9
DNA ref. GenBank:   CH408030 (669290..665601)
mRNA ref. GenBank:   XM_001228850.1
Protein sequence: CgDyPrx
Sequence Properties
first value : protein
second value (mature protein)
Length (aa):   %s   1229
PWM (Da):   %s   135819.46  
PI (pH):   %s   5.9
Sequence
Send to BLAST
Send to Peroxiscan
.........1.........2.........3.........4.........5.........6.........7.........8.........9.........0.........1.........2
MAAKTKRLDD ALLGAQRGLL MRAVFGQALT LYLKDKGQET CKTIVGIIAE ISKNIVDNYP GSGLVAAFSP ELWGTWHSRS IPISTKNIDR FKKFTLNQGD VLIFVKAPSH KIAEAIVNSV  HQRLHDLSTR MEEVKMGKRK DTRIMGGRYV DGITNPNDPI SLAEDILIDQ TDSRGGLTGS CFGFTQKFEF DWPGIATQAA DTQDEMIGRN PDGAALPQHA VHSHVHRAAI RNDNGDQLKL  LRQALPYGSD HEHAGREKGI MFVAFCNDQQ RFEDILQNLI GEVPERPVDK LMTVVHGVSG GYWYVPSADE LKVAAVTGPE DVYEDPHWEV TSPNNDYLFY NSQDYLHRMA EGRYKEGDPP  SRRLLSLMAR TFSHWRDSWM KKQVFPRLPH LSKLLSEDQK GTLATIPIAV RKGLANQKTL AELLSNPRSQ IAQENGLLRI EAKELIVGVI PDFTLGRGKE VVPYLSDEET MAAWLKGSLN  EWSAMGHIVP GYDLLVRDGL KKMITDIKDK LAKVSDPASA TASFYESCII SLEGVQGYLR NWAKIAQRAA IAAGMTAPDD VANMKDVEAR MNRLADDAPE SFQDAVQLIY SFHCCLHLVG  ELTPFGRLDQ ILYPYLSKGG GTTLEHAQEI IDCLWVKIGE NAFVNRAFIY DYVTYGTTAV CGLGGNFPQG GGINQWVQQI TVGGYKATDS ATPECGANAV TMLCLKAARR IPVNAPTLSL  RVHKDIPHEY LDEAAKGILS GGAQPILYND DKLCPALKDS ATANVVDLKW SRDYAADGCY EPMLAGASEF TFNNVAPLLA LEQTLNEGST YGEAGPEQLR GLKQTFRSKP AKEFKSFEDL  KDTFVKQLEW LVVQCYNTML DGYGNLANVC PSPLLSVLIQ GCVEKGRDLT NGGSKFHIMA PLCVGMSNTI DSLYAIQKLV FDDETARVTL QELVKCLICD WGHNMIEPYE NQLSGTADAS  ERGLRYSELR NAALALPKWG SGDEEVNKLG DWLVQTCVDL CVKAIRHPNA TIKAHLDNIK KTYGEDFEFI ICPGIGTFEG YVGDGIPCGA SADGRRSGMP IASDLSPVPA AQDLPASPAF  RNIYQAMEST KYNSIEHGLS NAAPVDMNIP ESFPLPELQK FVKKYAAGEV GSNLITLTCA DLDTYQKSVR DPEKYNLVRV RMGGWTEFYA TMFPAHQDQQ QRRQYFTPWE SGKKHADGKV 
VEVVWRDEHA REGAVPKPRV MLNELEVRS 

Retrieve as FASTA  
Remarks Complete sequence from genomic, no introns. Strain=CBS 148.51, DSM 1962, NRRL 1970. Hypothetical protein CHGG_02335.
DNA
Send to BLAST
.........1.........2.........3.........4.........5.........6.........7.........8.........9.........0.........1.........2
ATGGCGGCAA AGACCAAACG TCTCGATGAC GCCCTGCTGG GTGCTCAACG CGGTCTGCTC ATGCGGGCCG TGTTCGGGCA GGCCCTGACC CTCTACCTCA AGGACAAGGG GCAAGAGACC  TGCAAGACAA TCGTCGGTAT TATTGCCGAG ATTAGCAAAA ACATCGTCGA CAACTACCCT GGAAGCGGCC TCGTCGCGGC CTTCTCCCCT GAGCTATGGG GCACATGGCA CAGCCGGTCA  ATCCCCATCA GCACGAAGAA CATCGACCGG TTCAAGAAGT TCACCCTTAA CCAAGGAGAT GTCCTCATTT TCGTCAAGGC CCCTAGCCAC AAGATAGCGG AGGCCATTGT CAATTCTGTG  CACCAAAGGC TTCATGACCT GTCAACAAGG ATGGAAGAGG TCAAGATGGG CAAGCGTAAA GACACCAGGA TCATGGGTGG CCGCTATGTG GATGGCATCA CCAACCCCAA CGACCCCATC  AGCCTGGCCG AGGATATCCT TATCGACCAG ACGGATAGTC GGGGCGGACT CACCGGGTCG TGCTTCGGAT TCACCCAAAA GTTCGAGTTT GACTGGCCGG GCATCGCCAC CCAGGCCGCC  GACACGCAGG ACGAGATGAT CGGCCGCAAC CCGGACGGTG CCGCCCTGCC CCAGCATGCT GTTCACTCGC ACGTACACCG TGCAGCAATC CGTAACGACA ACGGCGACCA GCTCAAGCTC  CTCCGGCAAG CTCTGCCGTA CGGCTCGGAC CATGAACACG CCGGCCGGGA GAAGGGCATC ATGTTTGTCG CCTTTTGCAA CGACCAGCAG CGCTTCGAGG ACATCCTCCA GAACCTGATC  GGCGAGGTTC CCGAGAGGCC AGTCGACAAG CTCATGACGG TGGTGCACGG AGTATCAGGG GGTTACTGGT ACGTGCCATC CGCCGACGAG CTGAAGGTGG CGGCCGTCAC TGGGCCCGAG  GATGTCTACG AGGACCCCCA TTGGGAGGTA ACCAGTCCCA ACAACGACTA CCTCTTCTAC AACTCGCAAG ACTACCTCCA CAGGATGGCT GAGGGCCGGT ACAAGGAGGG GGACCCCCCC  AGCCGGCGCT TGCTCAGCTT GATGGCCCGG ACCTTCTCGC ACTGGCGCGA TTCCTGGATG AAGAAACAGG TCTTTCCGCG GCTGCCACAC CTAAGCAAAC TGTTGTCCGA AGACCAAAAG  GGCACACTGG CCACAATCCC GATCGCCGTG CGCAAGGGCC TGGCAAACCA AAAGACCCTA GCTGAGTTGC TCTCGAACCC AAGGAGTCAG ATCGCGCAAG AGAACGGTTT GCTCCGGATC  GAAGCCAAGG AACTCATCGT CGGCGTCATT CCAGACTTCA CGCTCGGACG CGGTAAAGAA GTGGTCCCCT ATCTTTCCGA CGAGGAGACC ATGGCTGCCT GGCTGAAGGG CTCGCTCAAC  GAGTGGTCCG CTATGGGGCA TATCGTGCCA GGCTACGACC TGCTCGTCCG GGATGGATTG AAGAAAATGA TTACGGACAT AAAGGACAAG CTGGCCAAGG TGTCTGACCC AGCAAGTGCC  ACAGCTAGCT TCTATGAGTC TTGCATCATC TCTCTCGAGG GCGTACAGGG CTACTTGCGA AACTGGGCCA AGATCGCGCA GCGGGCTGCC ATCGCCGCCG GAATGACAGC GCCGGATGAT  GTGGCTAACA TGAAAGACGT GGAGGCCAGA ATGAACCGCC TGGCCGACGA TGCGCCGGAG AGCTTCCAAG ACGCCGTCCA GCTCATCTAC TCATTTCACT GCTGTCTACA CCTGGTGGGT  GAGCTCACGC CGTTTGGACG TCTCGATCAA ATCCTATACC CCTACCTGTC CAAGGGAGGT GGCACGACGC TTGAACATGC ACAGGAGATC ATCGACTGCC TGTGGGTCAA GATTGGCGAG  AACGCCTTTG TCAACCGCGC CTTCATCTAC GACTACGTGA CGTACGGCAC CACGGCCGTC TGCGGCCTCG GTGGCAACTT CCCACAGGGC GGCGGCATCA ACCAGTGGGT GCAGCAGATC  ACCGTCGGGG GCTACAAGGC CACGGACAGC GCGACGCCAG AGTGCGGGGC GAACGCCGTG ACGATGCTCT GCTTGAAGGC GGCTCGGCGT ATCCCCGTCA ACGCGCCGAC CCTGTCCCTG  CGCGTACACA AGGACATTCC CCACGAGTAC CTTGACGAGG CAGCCAAGGG GATCTTGTCG GGCGGTGCCC AGCCAATCCT GTACAACGAC GACAAGCTCT GCCCTGCACT CAAGGACTCC  GCCACAGCCA ACGTGGTCGA CCTGAAGTGG TCGCGTGACT ACGCCGCGGA CGGCTGCTAC GAACCCATGC TGGCGGGTGC TTCCGAGTTC ACCTTCAACA ACGTGGCGCC GCTGCTGGCG  CTAGAGCAGA CCCTCAACGA GGGTTCCACC TACGGCGAGG CCGGGCCGGA GCAACTGCGC GGGCTGAAGC AGACGTTCCG GTCCAAGCCG GCTAAGGAGT TCAAGAGCTT TGAGGACTTG  AAGGACACGT TCGTGAAGCA GCTTGAGTGG CTCGTCGTGC AGTGCTACAA CACCATGCTC GACGGTTACG GCAACCTCGC CAACGTTTGC CCCTCGCCGC TCCTCTCGGT CCTGATCCAG  GGCTGCGTCG AGAAGGGCCG AGACCTGACG AACGGCGGAT CCAAGTTCCA CATCATGGCG CCGCTATGCG TGGGCATGTC CAACACGATC GACTCGCTGT ACGCCATCCA GAAGCTGGTC  TTTGACGACG AGACGGCGCG CGTCACACTC CAGGAGCTGG TCAAGTGTCT CATCTGCGAC TGGGGCCACA ACATGATCGA GCCGTACGAG AACCAGCTCT CGGGCACGGC CGACGCCTCG  GAGCGTGGGC TGCGCTACTC CGAGCTCCGC AACGCCGCCC TGGCACTGCC AAAGTGGGGG AGCGGCGACG AGGAGGTCAA CAAGCTCGGC GACTGGCTGG TTCAGACTTG CGTCGACCTC  TGCGTCAAGG CCATCCGCCA TCCCAACGCC ACCATCAAGG CGCACCTCGA CAACATCAAA AAGACGTACG GCGAGGACTT CGAATTCATC ATCTGCCCCG GCATCGGCAC CTTCGAAGGC  TACGTGGGCG ACGGCATCCC CTGCGGCGCC TCCGCCGACG GCCGACGCAG CGGCATGCCC ATCGCCTCGG ACCTCTCCCC CGTGCCAGCC GCGCAGGACC TCCCGGCCAG CCCGGCCTTC  CGCAACATCT ACCAAGCCAT GGAATCGACC AAGTACAACA GCATCGAGCA CGGCCTATCC AACGCGGCCC CCGTCGACAT GAACATCCCC GAGTCCTTCC CGCTTCCCGA ACTCCAGAAA  TTCGTCAAGA AATACGCAGC CGGTGAAGTC GGCAGCAACC TGATTACGCT GACGTGTGCG GACCTGGACA CGTACCAGAA GTCGGTGCGG GACCCGGAGA AGTACAACCT GGTGCGCGTG  CGCATGGGCG GCTGGACCGA GTTCTACGCG ACTATGTTCC CGGCCCACCA GGACCAGCAG CAGCGCAGGC AGTACTTTAC CCCGTGGGAG TCGGGCAAGA AGCACGCCGA TGGGAAGGTT 
GTGGAAGTGG TCTGGAGGGA TGAGCATGCG AGGGAGGGGG CCGTGCCGAA GCCGAGGGTG ATGCTGAATG AGTTGGAGGT CAGGAGCTGA 

Retrieve as FASTA  
CDS
Send to BLAST
.........1.........2.........3.........4.........5.........6.........7.........8.........9.........0.........1.........2
ATGGCGGCAA AGACCAAACG TCTCGATGAC GCCCTGCTGG GTGCTCAACG CGGTCTGCTC ATGCGGGCCG TGTTCGGGCA GGCCCTGACC CTCTACCTCA AGGACAAGGG GCAAGAGACC  TGCAAGACAA TCGTCGGTAT TATTGCCGAG ATTAGCAAAA ACATCGTCGA CAACTACCCT GGAAGCGGCC TCGTCGCGGC CTTCTCCCCT GAGCTATGGG GCACATGGCA CAGCCGGTCA  ATCCCCATCA GCACGAAGAA CATCGACCGG TTCAAGAAGT TCACCCTTAA CCAAGGAGAT GTCCTCATTT TCGTCAAGGC CCCTAGCCAC AAGATAGCGG AGGCCATTGT CAATTCTGTG  CACCAAAGGC TTCATGACCT GTCAACAAGG ATGGAAGAGG TCAAGATGGG CAAGCGTAAA GACACCAGGA TCATGGGTGG CCGCTATGTG GATGGCATCA CCAACCCCAA CGACCCCATC  AGCCTGGCCG AGGATATCCT TATCGACCAG ACGGATAGTC GGGGCGGACT CACCGGGTCG TGCTTCGGAT TCACCCAAAA GTTCGAGTTT GACTGGCCGG GCATCGCCAC CCAGGCCGCC  GACACGCAGG ACGAGATGAT CGGCCGCAAC CCGGACGGTG CCGCCCTGCC CCAGCATGCT GTTCACTCGC ACGTACACCG TGCAGCAATC CGTAACGACA ACGGCGACCA GCTCAAGCTC  CTCCGGCAAG CTCTGCCGTA CGGCTCGGAC CATGAACACG CCGGCCGGGA GAAGGGCATC ATGTTTGTCG CCTTTTGCAA CGACCAGCAG CGCTTCGAGG ACATCCTCCA GAACCTGATC  GGCGAGGTTC CCGAGAGGCC AGTCGACAAG CTCATGACGG TGGTGCACGG AGTATCAGGG GGTTACTGGT ACGTGCCATC CGCCGACGAG CTGAAGGTGG CGGCCGTCAC TGGGCCCGAG  GATGTCTACG AGGACCCCCA TTGGGAGGTA ACCAGTCCCA ACAACGACTA CCTCTTCTAC AACTCGCAAG ACTACCTCCA CAGGATGGCT GAGGGCCGGT ACAAGGAGGG GGACCCCCCC  AGCCGGCGCT TGCTCAGCTT GATGGCCCGG ACCTTCTCGC ACTGGCGCGA TTCCTGGATG AAGAAACAGG TCTTTCCGCG GCTGCCACAC CTAAGCAAAC TGTTGTCCGA AGACCAAAAG  GGCACACTGG CCACAATCCC GATCGCCGTG CGCAAGGGCC TGGCAAACCA AAAGACCCTA GCTGAGTTGC TCTCGAACCC AAGGAGTCAG ATCGCGCAAG AGAACGGTTT GCTCCGGATC  GAAGCCAAGG AACTCATCGT CGGCGTCATT CCAGACTTCA CGCTCGGACG CGGTAAAGAA GTGGTCCCCT ATCTTTCCGA CGAGGAGACC ATGGCTGCCT GGCTGAAGGG CTCGCTCAAC  GAGTGGTCCG CTATGGGGCA TATCGTGCCA GGCTACGACC TGCTCGTCCG GGATGGATTG AAGAAAATGA TTACGGACAT AAAGGACAAG CTGGCCAAGG TGTCTGACCC AGCAAGTGCC  ACAGCTAGCT TCTATGAGTC TTGCATCATC TCTCTCGAGG GCGTACAGGG CTACTTGCGA AACTGGGCCA AGATCGCGCA GCGGGCTGCC ATCGCCGCCG GAATGACAGC GCCGGATGAT  GTGGCTAACA TGAAAGACGT GGAGGCCAGA ATGAACCGCC TGGCCGACGA TGCGCCGGAG AGCTTCCAAG ACGCCGTCCA GCTCATCTAC TCATTTCACT GCTGTCTACA CCTGGTGGGT  GAGCTCACGC CGTTTGGACG TCTCGATCAA ATCCTATACC CCTACCTGTC CAAGGGAGGT GGCACGACGC TTGAACATGC ACAGGAGATC ATCGACTGCC TGTGGGTCAA GATTGGCGAG  AACGCCTTTG TCAACCGCGC CTTCATCTAC GACTACGTGA CGTACGGCAC CACGGCCGTC TGCGGCCTCG GTGGCAACTT CCCACAGGGC GGCGGCATCA ACCAGTGGGT GCAGCAGATC  ACCGTCGGGG GCTACAAGGC CACGGACAGC GCGACGCCAG AGTGCGGGGC GAACGCCGTG ACGATGCTCT GCTTGAAGGC GGCTCGGCGT ATCCCCGTCA ACGCGCCGAC CCTGTCCCTG  CGCGTACACA AGGACATTCC CCACGAGTAC CTTGACGAGG CAGCCAAGGG GATCTTGTCG GGCGGTGCCC AGCCAATCCT GTACAACGAC GACAAGCTCT GCCCTGCACT CAAGGACTCC  GCCACAGCCA ACGTGGTCGA CCTGAAGTGG TCGCGTGACT ACGCCGCGGA CGGCTGCTAC GAACCCATGC TGGCGGGTGC TTCCGAGTTC ACCTTCAACA ACGTGGCGCC GCTGCTGGCG  CTAGAGCAGA CCCTCAACGA GGGTTCCACC TACGGCGAGG CCGGGCCGGA GCAACTGCGC GGGCTGAAGC AGACGTTCCG GTCCAAGCCG GCTAAGGAGT TCAAGAGCTT TGAGGACTTG  AAGGACACGT TCGTGAAGCA GCTTGAGTGG CTCGTCGTGC AGTGCTACAA CACCATGCTC GACGGTTACG GCAACCTCGC CAACGTTTGC CCCTCGCCGC TCCTCTCGGT CCTGATCCAG  GGCTGCGTCG AGAAGGGCCG AGACCTGACG AACGGCGGAT CCAAGTTCCA CATCATGGCG CCGCTATGCG TGGGCATGTC CAACACGATC GACTCGCTGT ACGCCATCCA GAAGCTGGTC  TTTGACGACG AGACGGCGCG CGTCACACTC CAGGAGCTGG TCAAGTGTCT CATCTGCGAC TGGGGCCACA ACATGATCGA GCCGTACGAG AACCAGCTCT CGGGCACGGC CGACGCCTCG  GAGCGTGGGC TGCGCTACTC CGAGCTCCGC AACGCCGCCC TGGCACTGCC AAAGTGGGGG AGCGGCGACG AGGAGGTCAA CAAGCTCGGC GACTGGCTGG TTCAGACTTG CGTCGACCTC  TGCGTCAAGG CCATCCGCCA TCCCAACGCC ACCATCAAGG CGCACCTCGA CAACATCAAA AAGACGTACG GCGAGGACTT CGAATTCATC ATCTGCCCCG GCATCGGCAC CTTCGAAGGC  TACGTGGGCG ACGGCATCCC CTGCGGCGCC TCCGCCGACG GCCGACGCAG CGGCATGCCC ATCGCCTCGG ACCTCTCCCC CGTGCCAGCC GCGCAGGACC TCCCGGCCAG CCCGGCCTTC  CGCAACATCT ACCAAGCCAT GGAATCGACC AAGTACAACA GCATCGAGCA CGGCCTATCC AACGCGGCCC CCGTCGACAT GAACATCCCC GAGTCCTTCC CGCTTCCCGA ACTCCAGAAA  TTCGTCAAGA AATACGCAGC CGGTGAAGTC GGCAGCAACC TGATTACGCT GACGTGTGCG GACCTGGACA CGTACCAGAA GTCGGTGCGG GACCCGGAGA AGTACAACCT GGTGCGCGTG  CGCATGGGCG GCTGGACCGA GTTCTACGCG ACTATGTTCC CGGCCCACCA GGACCAGCAG CAGCGCAGGC AGTACTTTAC CCCGTGGGAG TCGGGCAAGA AGCACGCCGA TGGGAAGGTT 
GTGGAAGTGG TCTGGAGGGA TGAGCATGCG AGGGAGGGGG CCGTGCCGAA GCCGAGGGTG ATGCTGAATG AGTTGGAGGT CAGGAGCTGA 

Retrieve as FASTA