Gen se nalazi na kratkom kraku hromosoma 2 (2p13.2) na plus (Watson) lancu. Dužine je 224.161 baza organizovan u 23 egzona. Kodirani protein ima 4.167 aminokiselina i molekulsku težinu od 460.937 Da. Poznata su tri izoforme, odnosno varijante transkripta. Sam protein ima veliki tandemski domen sa ponavljanjem koji se sastoji od 34 nesavršena ponavljanja od po 47 aminokiselina. Mutacije povezane s bolešću obično se nalaze u egzonima 8, 10 i 16.
Poznato je više mutacija: 2007. ukupno je 79. To uključuje i nonsens mutacije i mutacije sa pomakom okvira. Većina mutacija je pronađena u egzonima 8,10 i 16.