Entry information : HaDiOx05 (HanXRQChr14g0450041)
Entry ID 13774
Creation 2016-06-01 (Christophe Dunand)
Last sequence changes 2016-06-01 (Christophe Dunand)
Sequence status complete
Reviewer Not yet reviewed
Last annotation changes 2017-11-23 (Catherine Mathe (Scipio))
Peroxidase information: HaDiOx05 (HanXRQChr14g0450041)
Name (synonym) HaDiOx05 (HanXRQChr14g0450041)
Class Alpha-dioxygenase    [Orthogroup: DiOx001]
Taxonomy Eukaryota Viridiplantae Streptophyta Asteraceae Helianthus
Organism Helianthus annuus (Sunflower)    [TaxId: 4232 ]
Cellular localisation N/D
Tissue type N/D
Inducer N/D
Repressor N/D
Best BLASTp hits
Perox score E-value HaDiOx05
start..stop
S start..stop
HaDiOx06 1256 0 1..629 1..643
HaDiOx04 1245 0 1..629 1..643
HaDiOx07 1076 0 1..629 1..626
HaDiOx02 980 0 15..628 15..642
Gene structure Fichier Exons
ExonStart..EndSize ExonStart..EndSize ExonStart..EndSize ExonStart..EndSize
N° 1 140455826..140455945 120 N° 2 140456034..140456300 267 N° 3 140457840..140457989 150 N° 4 140458090..140458220 131
N° 5 140458374..140458587 214 N° 6 140458673..140458795 123 N° 7 140458854..140459065 212 N° 8 140459181..140459383 203
N° 9 140459466..140459709 244 N° 10 140459807..140460032 226  
join(140455826..140455945,140456034..140456300,140457840..140457989,140458090..1 40458220,140458374..140458587,140458673..140458795,140458854..140459065,14045918 1..140459383,140459466..140459709,140459807..140460032)


exon

Literature and cross-references HaDiOx05 (HanXRQChr14g0450041)
DNA ref. HanXRQ genome:   HanXRQChr14 (140455826..140460032)
Cluster/Prediction ref. HanXRQ:   HanXRQChr14g0450041
Protein sequence: HaDiOx05 (HanXRQChr14g0450041)
Sequence Properties
first value : protein
second value (mature protein)
Length (aa):   %s   629
PWM (Da):   %s   71760.8  
PI (pH):   %s   6.37
Sequence
Send to BLAST
Send to Peroxiscan
.........1.........2.........3.........4.........5.........6.........7.........8.........9.........0.........1.........2
MKTFMSFAKQQLLSPFKHFIHADFHELFERMTLIDKFLFLIIHGVDKSGIGWHRFPVFLGLTYLAIRRILHDKYNLLSVGKTRVGVRFDTDDVDFRTTNGKFNDPFNESAGSEGTFIGRNMPPVDQKEKLLKPDPMLVATKLLARKQLIDTGKQFNMIAASWIQFMIHDWIDHLEETNQIELRAPAEVASECPLKSFKFFETKEIDTGLSDIKKGHRNIRTPWDGSVVYGSNSKAGRHVRTFIDGKLKIAEDGLLQHDNDGLPIAGDVRNSWIGVSTLQALFIHEHNAVCDALKEYPYLDDEDLYRHARLVTSAVIAKVHTIDWTIELLKTDMLSYVLITFGHVGGSILGGLVGLKKPENHGVPYSLTEEFTSVYRMHSLLPDQLVIRDVNSTPGPNKSPKITKEIDMINLIGKNGEKELSKIGFTTQMVSMGHQACGALELFNYPVWLRDIVPQNVDGTDRPDHIDLASLIYRDRERKVARYNEFRRSLFLIPISKWEDLTEDKEAIATLREVYGDDVEELDLLIGMMAEKKINGFAISETAFVIFLAMASRRLQADRFFTSDFNEDVYTKKGFEWVNTTESLKDVLDRHYPEMTDRWMNSTSAFSVWDAAPEPHNPVPIYFRLPK

Retrieve as FASTA  
Remarks Part of the sequence is missing but not detected in the DNA: pseudogene or mising DNA?
DNA
Send to BLAST
.........1.........2.........3.........4.........5.........6.........7.........8.........9.........0.........1.........2
ATGAAAACATTCATGTCTTTTGCAAAACAACAACTTCTTTCACCCTTCAAACACTTCATCCATGCCGACTTTCATGAACTCTTTGAAAGGATGACACTCATCGACAAGTTTCTCTTCTTG
GTACGTTAATGCTGCATGCATGTAATTAAACAATTAATTAAACTTTTAATTTACTATAGCTCATTTTGAGATTATAATACTTTGGCAGATCATTCATGGTGTCGATAAATCCGGGATAGG
ATGGCACCGTTTTCCTGTGTTCTTAGGTCTTACTTACTTGGCCATTCGCCGGATTCTTCATGATAAGTATAATCTGCTCAGTGTTGGGAAAACTCGGGTTGGGGTTCGGTTTGATACCGA
TGACGTTGATTTCAGGACCACCAATGGAAAGTTTAACGATCCTTTCAATGAAAGTGCCGGCAGTGAAGGAACTTTCATTGGCCGTAACATGCCCCCTGTTGATCAGAAAGAGAAG
GTATA
TATATTAATCGATCAACTTCAAATTAACACATATTGGCATATATATCACTAGCTAGTTATCTTTTCTAACTATTGTTCTAAAATTGCATTGATGTTGAACTGGTCATTTTTTATAACGTT
GACTGGTTACTCAGGGTTTCTTTTAGCTTTTGATTGACAAAGAGCAAAAGAGAAATTTTATATCCTTTTACTAAATATTTTTTTTTATCAGTTAGTCTTAATAGAGACAGGATATAAAAA
AGCAACCACGACGTCTTTGTTTTAATTTTCAAGCTTTTTATAAGACATGAACTTTTCCCAAAGTTCTGTTTGTAAGATGTTTAGGATGATATTTAAAAAAGATAATACATGTTTTTTTTT
AATCAAAGCACAAATCTATAGATATATCCTTAAATTTACGTAACATGTTTTGCAAAATAAATTAGTGATAGTTTGATAGTCATTTGGGTGATTTCCGTGTATTTATGTAAGCATTATTAG
GTCTACATGAGGGGAGTATGTTAGAGATCATCAATTGTCTCAACCAAACTTATAATATTTAGAGCTTTGTATATCTATATATTTTAGGTTTTTTCATACTAATTAATCCAACTTCATAAT
TAGAGGCTTAGAGCTTTGTATATCGATATTCATACTAATTAATTCTAAATATAAATCTCAAGGTCAGATAAACTTGACACACGTGATTATCTAAAATTTTAATAATCATCAAGAGAATTC
TGTCCATCTTTAAAGTTAGATTAAAAATTAGATGTTTATTACTCTTGTAGATAATACAAAAGTCATATATAAATATACCGATCGGTTCACTGTCATTGTTCATGATTTGTTATTCTTTCT
TTCGTGTTTTCATTTGTAATGTAGTTATTGGCAGTACTAGATACTCCGATATATCCCATTAAAACATCACGTAAGGTCCACACCAACATTTATAAAATAAGATTAAAACTTTTTTAGTCT
AAATACTTTTCTTTTTATATAATATGTGACAATGACCTGACTTCCTTTCGTTAGATGGTAATAGCAATTTTATCCGACATAATTATCAAAGAGATTAAAGTGAGATATGATATACACGAA
ACCCACTTTTTAACAAGAATTTTTTACACATAAATATCATCCAACTTTTCACTTACAAAGATTTAAATTCATTTTCTATGAGAAAAAAAAAACACCATCCTACTAGACCATTAGATCATG
AGTACATATCCAGTTTATTAATCACACGTTTGTCTAATCAGTAAAAATTAAACAAGCAGGTCTCGAAGATTTCATTCTTATTATACCTTATAAATTTTATAATCATTTTTATACAAGTGT
CATCCTTTGCTTGTGTTCTTGTCTGAAGCTGATATTACTATCAAATTTAAAGCAAGTAAATAACTTCTAGATAAAAATGCAACATGCAAAAAAGTTCGTTCATCTAATAGTAGTTATTCA
ATGCAACTCACAATAAACCTAAGAAATTTGAAATGGTAGTCGAGCTTTGAATGTAGGGTGAGACAATTGTACTAAAACGTATTTCTGTGTGCAGCTATTGAAGCCGGATCCGATGTTGGT
AGCAACAAAGCTTCTAGCACGTAAACAACTTATAGACACCGGAAAGCAGTTCAACATGATTGCTGCTTCATGGATTCAGTTCATGATTCATGATTGGATTGATCACCTTGAAGAAACAAA
TCAG
GTTCGATTAATCAAGATATTATATAATCTCGTGACATAAGAAGGAAGAACTTTGTACTAACACATATATAATATGTTACCATGGATTATTATGATAACAGATTGAGCTTAGGGCGC
CAGCAGAAGTAGCAAGTGAATGCCCTCTCAAATCCTTCAAGTTCTTCGAGACTAAAGAAATCGATACTGGTCTTTCTGACATTAAGAAAGGTCATCGTAACATCAGAACTCCTTG
GTAGT
ATGATTTCTATAATTTAATTAATCATATTTTATAACCTCGCATTGTTAAAAACTCTCAAAGTTATAATAAAAGAATTGAGAAAGACAATCATTGTATATACAAATAAATAGTACGAAGTT
AAGAGTGGGATATATATGACATGTACAGGGATGGGAGTGTGGTATATGGAAGCAACTCAAAGGCTGGACGTCACGTAAGAACGTTCATTGACGGAAAGCTCAAGATTGCAGAAGATGGTC
TCCTTCAACATGACAACGATGGATTGCCTATAGCGGGAGACGTTCGTAATAGTTGGATTGGGGTGTCAACTTTGCAAGCCCTCTTTATCCACGAGCACAATGCGGTTTGTGACGCCTTAA
AG
GTATATGTGTATATGATAAACATGTAGCTAGTTATTTTTAGTTTATTAGCTAGCTAGTGGCTTACAATATACTTATGTCAATCAGAAAGAATATCCTTATTTGGACGATGAAGATCTG
TATCGCCACGCAAGACTAGTAACTTCTGCGGTGATCGCAAAGGTGCACACCATTGATTGGACCATTGAGCTTCTCAAAACTGACATGCTT
GTTGCTGGAATGAGAGCTAACTGGTAATTA
CTTACTTTAAAATAAATAATTAATCTAGTCTTATGTGTTAATTACATTTGGGCATGTTGGAGGATCTATTTTGGGAGGACTAGTAGGGCTAAAGAAACCCGAAAACCACGGGGTACCCTA
CTCGCTAACAGAAGAGTTTACAAGTGTTTATCGAATGCATTCTCTCTTACCTGATCAACTTGTCATAAGGGATGTTAATTCCACACCAGGACCTAACAAGTCTCCAAAGATTACCAAGGA
GTACGTAAATCGCACCTAAGTTATTTTCTCTTAATTTGAATAACAATTTACTTCTTTGTATCTTCATGTAATAACCAACAAATAAGTATGCTCATAGTTATTAATTTATATTCAGGATTG
ACATGATCAATTTGATTGGAAAGAATGGAGAAAAGGAATTATCAAAAATTGGATTTACCACACAAATGGTATCCATGGGACATCAAGCCTGTGGGGCGCTTGAGCTATTTAACTATCCAG
TCTGGCTTAGGGACATTGTGCCTCAAAACGTGGATGGGACTGATCGCCCCGACCACATTGATTTAGCATCACTTGAGA
GTAAGCTATTTTTGTCTTTCAATAAAGAATGTGTATATACAT
GATTAATTTTGATCCTAATATATGATCATGATGCGTGCAGTTTATAGGGATAGGGAGAGGAAAGTAGCAAGATACAATGAGTTCCGTAGATCACTTTTCTTGATCCCAATCTCCAAATGG
GAAGATCTAACAGAGGACAAAGAAGCTATTGCCACATTGCGTGAAGTGTACGGTGATGATGTCGAAGAGCTTGATCTGTTGATAGGAATGATGGCCGAGAAAAAGATCAATGGGTTCGCC
ATTAGCGAAACAGCTTTTGTAATCTTTCTAGCCATGGCCTCAAG
GTATATATACAAATCACCAAAATAAGTGAATCAAAACTGTAAATAAACAAACTAATGGATAAATTTTTATACAAAC
TAAATATTGGTTCATGTGCAGGCGACTCCAAGCGGATAGATTCTTCACTAGCGATTTTAACGAAGATGTGTACACAAAAAAAGGGTTCGAATGGGTGAACACAACAGAGAGTCTGAAAGA
TGTGTTGGACCGACACTATCCAGAGATGACCGATAGATGGATGAACTCAACAAGTGCTTTCTCGGTGTGGGATGCTGCCCCTGAGCCTCATAATCCCGTACCAATTTATTTCCGTCTCCC
CAAGTGA

Retrieve as FASTA  
CDS
Send to BLAST
.........1.........2.........3.........4.........5.........6.........7.........8.........9.........0.........1.........2
ATGAAAACATTCATGTCTTTTGCAAAACAACAACTTCTTTCACCCTTCAAACACTTCATCCATGCCGACTTTCATGAACTCTTTGAAAGGATGACACTCATCGACAAGTTTCTCTTCTTG
ATCATTCATGGTGTCGATAAATCCGGGATAGGATGGCACCGTTTTCCTGTGTTCTTAGGTCTTACTTACTTGGCCATTCGCCGGATTCTTCATGATAAGTATAATCTGCTCAGTGTTGGG
AAAACTCGGGTTGGGGTTCGGTTTGATACCGATGACGTTGATTTCAGGACCACCAATGGAAAGTTTAACGATCCTTTCAATGAAAGTGCCGGCAGTGAAGGAACTTTCATTGGCCGTAAC
ATGCCCCCTGTTGATCAGAAAGAGAAG
CTATTGAAGCCGGATCCGATGTTGGTAGCAACAAAGCTTCTAGCACGTAAACAACTTATAGACACCGGAAAGCAGTTCAACATGATTGCTGCT
TCATGGATTCAGTTCATGATTCATGATTGGATTGATCACCTTGAAGAAACAAATCAG
ATTGAGCTTAGGGCGCCAGCAGAAGTAGCAAGTGAATGCCCTCTCAAATCCTTCAAGTTCTTC
GAGACTAAAGAAATCGATACTGGTCTTTCTGACATTAAGAAAGGTCATCGTAACATCAGAACTCCTTG
GGATGGGAGTGTGGTATATGGAAGCAACTCAAAGGCTGGACGTCACGTAAGA
ACGTTCATTGACGGAAAGCTCAAGATTGCAGAAGATGGTCTCCTTCAACATGACAACGATGGATTGCCTATAGCGGGAGACGTTCGTAATAGTTGGATTGGGGTGTCAACTTTGCAAGCC
CTCTTTATCCACGAGCACAATGCGGTTTGTGACGCCTTAAAG
AAAGAATATCCTTATTTGGACGATGAAGATCTGTATCGCCACGCAAGACTAGTAACTTCTGCGGTGATCGCAAAGGTG
CACACCATTGATTGGACCATTGAGCTTCTCAAAACTGACATGCTT
TCTTATGTGTTAATTACATTTGGGCATGTTGGAGGATCTATTTTGGGAGGACTAGTAGGGCTAAAGAAACCCGAA
AACCACGGGGTACCCTACTCGCTAACAGAAGAGTTTACAAGTGTTTATCGAATGCATTCTCTCTTACCTGATCAACTTGTCATAAGGGATGTTAATTCCACACCAGGACCTAACAAGTCT
CCAAAGATTACCAAGGA
GATTGACATGATCAATTTGATTGGAAAGAATGGAGAAAAGGAATTATCAAAAATTGGATTTACCACACAAATGGTATCCATGGGACATCAAGCCTGTGGGGCG
CTTGAGCTATTTAACTATCCAGTCTGGCTTAGGGACATTGTGCCTCAAAACGTGGATGGGACTGATCGCCCCGACCACATTGATTTAGCATCACTTGAGA
TTTATAGGGATAGGGAGAGG
AAAGTAGCAAGATACAATGAGTTCCGTAGATCACTTTTCTTGATCCCAATCTCCAAATGGGAAGATCTAACAGAGGACAAAGAAGCTATTGCCACATTGCGTGAAGTGTACGGTGATGAT
GTCGAAGAGCTTGATCTGTTGATAGGAATGATGGCCGAGAAAAAGATCAATGGGTTCGCCATTAGCGAAACAGCTTTTGTAATCTTTCTAGCCATGGCCTCAAG
GCGACTCCAAGCGGAT
AGATTCTTCACTAGCGATTTTAACGAAGATGTGTACACAAAAAAAGGGTTCGAATGGGTGAACACAACAGAGAGTCTGAAAGATGTGTTGGACCGACACTATCCAGAGATGACCGATAGA
TGGATGAACTCAACAAGTGCTTTCTCGGTGTGGGATGCTGCCCCTGAGCCTCATAATCCCGTACCAATTTATTTCCGTCTCCCCAAGTGA

Retrieve as FASTA  
cDNA
Send to BLAST
.........1.........2.........3.........4.........5.........6.........7.........8.........9.........0.........1.........2
TCAATACCCA AAATGAAAAC ATTCATGTCT TTTGCAAAAC AACAACTTCT TTCACCCTTC AAACACTTCA TCCATGCCGA CTTTCATGAA CTCTTTGAAA GGATGACACT CATCGACAAG  TTTCTCTTCT TGATCATTCA TGGTGTCGAT AAATCCGGGA TAGGATGGCA CCGTTTTCCT GTGTTCTTAG GTCTTACTTA CTTGGCCATT CGCCGGATTC TTCATGATAA GTATAATCTG  CTCAGTGTTG GGAAAACTCG GGTTGGGGTT CGGTTTGATA CCGATGACGT TGATTTCAGG ACCACCAATG GAAAGTTTAA CGATCCTTTC AATGAAAGTG CCGGCAGTGA AGGAACTTTC  ATTGGCCGTA ACATGCCCCC TGTTGATCAG AAAGAGAAGC TATTGAAGCC GGATCCGATG TTGGTAGCAA CAAAGCTTCT AGCACGTAAA CAACTTATAG ACACCGGAAA GCAGTTCAAC  ATGATTGCTG CTTCATGGAT TCAGTTCATG ATTCATGATT GGATTGATCA CCTTGAAGAA ACAAATCAGA TTGAGCTTAG GGCGCCAGCA GAAGTAGCAA GTGAATGCCC TCTCAAATCC  TTCAAGTTCT TCGAGACTAA AGAAATCGAT ACTGGTCTTT CTGACATTAA GAAAGGTCAT CGTAACATCA GAACTCCTTG GGATGGGAGT GTGGTATATG GAAGCAACTC AAAGGCTGGA  CGTCACGTAA GAACGTTCAT TGACGGAAAG CTCAAGATTG CAGAAGATGG TCTCCTTCAA CATGACAACG ATGGATTGCC TATAGCGGGA GACGTTCGTA ATAGTTGGAT TGGGGTGTCA  ACTTTGCAAG CCCTCTTTAT CCACGAGCAC AATGCGGTTT GTGACGCCTT AAAGAAAGAA TATCCTTATT TGGACGATGA AGATCTGTAT CGCCACGCAA GACTAGTAAC TTCTGCGGTG  ATCGCAAAGG TGCACACCAT TGATTGGACC ATTGAGCTTC TCAAAACTGA CATGCTTTCT TATGTGTTAA TTACATTTGG GCATGTTGGA GGATCTATTT TGGGAGGACT AGTAGGGCTA  AAGAAACCCG AAAACCACGG GGTACCCTAC TCGCTAACAG AAGAGTTTAC AAGTGTTTAT CGAATGCATT CTCTCTTACC TGATCAACTT GTCATAAGGG ATGTTAATTC CACACCAGGA  CCTAACAAGT CTCCAAAGAT TACCAAGGAG ATTGACATGA TCAATTTGAT TGGAAAGAAT GGAGAAAAGG AATTATCAAA AATTGGATTT ACCACACAAA TGGTATCCAT GGGACATCAA  GCCTGTGGGG CGCTTGAGCT ATTTAACTAT CCAGTCTGGC TTAGGGACAT TGTGCCTCAA AACGTGGATG GGACTGATCG CCCCGACCAC ATTGATTTAG CATCACTTGA GATTTATAGG  GATAGGGAGA GGAAAGTAGC AAGATACAAT GAGTTCCGTA GATCACTTTT CTTGATCCCA ATCTCCAAAT GGGAAGATCT AACAGAGGAC AAAGAAGCTA TTGCCACATT GCGTGAAGTG  TACGGTGATG ATGTCGAAGA GCTTGATCTG TTGATAGGAA TGATGGCCGA GAAAAAGATC AATGGGTTCG CCATTAGCGA AACAGCTTTT GTAATCTTTC TAGCCATGGC CTCAAGGCGA  CTCCAAGCGG ATAGATTCTT CACTAGCGAT TTTAACGAAG ATGTGTACAC AAAAAAAGGG TTCGAATGGG TGAACACAAC AGAGAGTCTG AAAGATGTGT TGGACCGACA CTATCCAGAG  ATGACCGATA GATGGATGAA CTCAACAAGT GCTTTCTCGG TGTGGGATGC TGCCCCTGAG CCTCATAATC CCGTACCAAT TTATTTCCGT CTCCCCAAGT GATAATGCTT TGATGGAAAA  GAATATGTTA CATGTTTGGT ATACATATAT GTATAGGTAT TGCATCTGTT GGGGTGCCTT ATTCAATATT TATTTGCTTA GTATATATGC GTTATTTAAT TTTCTTATGG AATAAAAGAA 
TAAGTGATGT ATATTGTATG TATCTTAATG AAATAAAAGG CAATTGGATT ATTATGTTGT TAACGAGAGG 

Retrieve as FASTA