ลำดับดีเอ็นเอ

จากวิกิพีเดีย สารานุกรมเสรี
ข้อมูลพิมพ์จากอิเล็กโทรฟีโรแกรม (Electropherogram) จากเครื่องลำดับดีเอ็นเออัตโนมัติ แสดงส่วนของลำดับดีเอ็นเอ

ลำดับดีเอ็นเอ หรือ ลำดับพันธุกรรม (DNA sequence or genetic sequence) เป็นชุดของอักษรที่แทนโครงสร้างปฐมภูมิ (primary structure) ของโมเลกุลหรือสายดีเอ็นเอซึ่งมีความสามารถที่จะขนส่งข้อมูลทางพันธุกรรม

อักษรที่ใช้ในลำดับดีเอ็นเอได้แก่ A, C, G, และ T ซึ่งแทนหน่วยย่อยนิวคลีโอไทด์ (nucleotide) ของสายดีเอ็นเอได้แก่เบสอะดีนีน (adenine) , ไซโตซีน (cytosine) , กัวนีน (guanine) และ ไทมีน (thymine) ตามลำดับซึ่งต่อกันด้วยพันธะโคเวเลนท์กับแกนหลักฟอสเฟต (phospho-backbone) โดยทั่วไปแล้วลำดับจะถูกพิมพ์ชิดกับอักษรตัวต่อไปโดยไม่มีช่องวรรคจากด้าน 5' ไป 3' จากซ้ายไปขวา เช่นในลำดับ AAAGTCTGAC ชุดของนิวคลีโอไทด์ที่มีลำดับเบสมากกว่า 4 ตัวจะเรียกว่า ลำดับดีเอ็นเอ

การทำงานทางชีวภาพของลำดับดีเอ็นเอจะขึ้นกับข้อมูลที่อยู่ในลำดับดีเอ็นเอ ลำดับนี้อาจ sense (มีนัย) หรือ anti-sense (ไม่มีนัย) หรืออาจเป็นส่วนที่ถอดรหัสพันธุกรรม (coding) หรือไม่ถอดเป็นรหัสพันธุกรรม (noncoding) ลำดับดีเอ็นเอนั้นอาจบรรจุข้อมูล ดีเอ็นเอขยะ (junk DNA)

ลำดับดีเอ็นเออาจถอดมาได้จากวัตถุดิบทางชีวภาพผ่านกระบวนการที่เรียกว่า การลำดับดีเอ็นเอ (DNA sequencing)

ในบางครั้ง อาจมีอักษรอื่นๆ นอกเหนือจาก A, T, C, และ G ปรากฏในลำดับดีเอ็นเอ ซึ่งแสดงถึงความกำกวม (ambiguity) ในโมเลกุลดีเอ็นเอตัวอย่างทั้งหมดอาจมีนิวคลีโอไทด์มากกว่า 1 ชนิดที่อยู่ในตำแหน่งนั้น ระบบการเรียกชื่อสารเคมีของ IUPACได้กำหนดกฎมาเป็นดังนี้

       A = adenine           
       C = cytosine            
       G = guanine             
       T = thymine           
       R = G A (purine)        
       Y = T C (pyrimidine)    
       K = G T (keto)    
       M = A C (amino)
       S = G C (strong bonds)
       W = A T (weak bonds)
       B = G T C (all but A)
       D = G A T (all but C)
       H = A C T (all but G)
       V = G C A (all but T)
       N = A G C T (any)     

ดูเพิ่ม[แก้]

แหล่งข้อมูลอื่น[แก้]