DNA ба бидний амьдрал 2

2 жил гарангийн өмнө блог дээрээ DNA ба бидний амьдрал гэдэг post бичиж байсан юм. Тэрнийхээ үргэлжлэлийг бичье гэж бодлоо.

Яагаад computer science-ээр төгсчихөөд DNA сонирхоод байгаагаа эхлээд жаахан тайлбарлая. Миний бодлоор эрүүл мэндийн шинжлэх ухаан нь, бусад шинжлэх ухаануудаас хоцролттой явагдаж байгаа юм шиг санагддаг. Бидэнд одоо болтол эдгээж чадахгүй өвчнүүд, шалтгааныг нь олоогүй шинж тэмдэгүүд(symptoms) байна. Харин сүүлийн жилүүдэд, хүний DNA-г хямд зардлаар бүгдийг нь тайлж унших боломжтой болж, мөн судалгаа хийхэд хангалттай их хэмжээний сан үүсгэгдэж байна. Компьютерийн шинжлэх ухааны хүмүүс ихэнхдээ тоон өгөгдөл дээр ажилладаг. Харин биологичид маань, хүний эсийг тоон хэлбэрт шилжүүлж чадсанаар, бид нарт ч гэсэн түүн дээр ажиллах боломж үүсч байгаа юм. Мөн, компьютерийн шинжлэх ухааны хиймэл оюун гэх мэт ухагдхуунуудыг ашиглавал, DNA судалгааг хүчтэй түрж өгөх юм шиг санагдаад байгаа юм. Миний хувьд учиргүй хувь нэмрээ оруулдаггүй юмаа гэхэд, ядаж хүний хийсэн судалгааны ажлыг уншиж ойлгоод, тэрэнд нь таарсан алгоритм бичих чадвартай болохыг зорьж байгаа болно.

Би мэргэжлийн хүн биш тул, миний бичсэн зүйлүүдэд алдаа байхыг үгүйсгэхгүй. Тиймээс ямар нэгэн зүйлийн эх сурвалж болгож битгий ашиглаарай.
Мөн, алдаатай хэсгийг залруулж өгвөл баярлана.

За гол зүйлдээ оръё. Тэгэхээр DNA-ын талаар бүх хүмүүс бага зэрэг мэдлэгтэй байх. Хүн 23 хос chromosome-той ба, эдгээрийн 22 нь autosomal буюу хүйсээс үл хамааран бүх хүнд байна.
Харин үлдсэн 1 хос нь X болон Y chromosome-оос бүрдэх ба, эмэгтэй хүнд XX, харин эрэгтэй хүнд XY гэж хослон байна. Эдгээр chromosome-ууд нь олон хэмжээний gene агуулна. Gene гэдэг нь, DNA-ын бяцхан хэсэг буюу, олон хэмжээний base pair-үүдийн цуглуулга юм.
Chromosome тус бүрийн gene, болон base pair-ийн тоог эндээс харж болно.

SNP(Single Nucleotide Polymorphism)
Хэрвээ тодорхой байрлалд хүн амын 1-ээс дээш хувь нь ижил утгатай биш байх юм бол, тэдгээрийн утгуудын олонлогийг SNP гэнэ.
Жишээ нь: 1000 хүний мэдээлэлтэй сан байлаа гэж үзье. 900 хүний, 1 дугаарын chromosome-ын 6546 гэсэн байрлалд A гэсэн утга, харин үлдсэн хүмүүсийнх нь G гэсэн утга байвал, энэ нь SNP болно. Харин 999 хүн нь A, үлдсэн нэг нь л G байх юм бол, SNP биш гэсэн үг.
SNP нь эрүүл мэндтэй холбоотой судалгаа шинжилгээ хийхэд маш хэрэгтэй зүйл юм. Харин нэг анхаарах ёстой зүйл бол 1% гэсэн шалгуур байгаа эсэхийг мартаж болохгүй. Тиймээс нэн ховор генетикийн өөрчлөлтүүд дээр SNP ашиглан судалгаа хийх боломжгүй гэсэн үг юм.
Яагаад SNP ашиглах шаардлагатай гэж? бодож магад. Миний ойлгосноор, бүтэн DNA нь хэт том хэмжээтэй тул, тэр их өгөгдлийг тодорхой хэмжээнд багасгахыг зорьсон. Мөн, хүний бүтэн DNA-г гаргаж авсанаас, SNP microarray ашиглан зөвхөн SNP байгаа байрлалуудын утгыг гаргаж авах нь зардлын хувьд хамаагүй хямд юм. Бүтэн DNA гаргаж авахыг DNA sequencing, харин тодорхой байрлал руу чиглэсэн тандалтыг DNA genotyping гэнэ.

MAF(Minor Allele Frequency) болон minor allele
Ихэнх SNP-үүд нь biallelic буюу, 2-хон төрлийн утга авна. Өөрөөр хэлбэл, A, T, C, G-ын аль нэг 2 нь гэсэн үг. Мэдээж энэ нь одоог хүртэл бүрдүүлсэн сан дээр үндэслэж байгаа тул, ирээдүйд triallelic-ууд олноор гарч ирэхийг үгүйсгэхгүй.
Minor allele(эсвэл risk allele) нь, 2 утгын аль бага давтамжтай нь юм. Өөрөөр хэлбэл, зөвхөн A болон G гэсэн утга авдаг SNP байлаа гэж үзье. 100 хүний 90 нь A, 10 нь G бол, G нь minor allele болно. Зарим тохиолдолд minor allele байсан ч эсрдэлтэй байх албагүй юм. Эсрэгээрээ сайн байх тохиолдлууд мөн байна.
Мөн MAF нь, хүний race болон, гарал угсаанаас хамааран бүлэг тус бүрт өөр байх боломжтой болно.

dbSNP
dbSNP нь NCBI(National Center for Biotechnology Information) гээд АНУ-ын биотехнологийн хүрээлэнгийн сан юм. Эндээс хүссэн SNP-ын мэдээллийг авах боломжтой. Жишээ нь rs16942 буюу хөхний хорт хавдар үүсгэдэг BRCA1 гэдэг gene-ы нэг SNP-ыг харвал доорх байдлаар харагдана.
rs16942
RefSNP Alleles гэдэг хэсгийг харвал A болон G гэдэг утга агуулдаг, өөрөөр хэлбэл biallelic гэдгийг харж болно. MAF гэдэг хэсгийг харвал, G-нь minor allele(хүн амын 35% нь G) гэдгийг мэдэж болно. Мөн Ancestral Allele гэдгийг харвал, хүн болж хувьсан өөрчлөгдхөөс өмнө ямар байсныг харж болно. Ancestral Allele нь chimpanzee-ын DNA дээр үндсэлсэн байдаг.

Raw DNA Data
23andme болон AncestryDNA гэх мэт компаниуд нь DNA genotyping аргаар, боломжийн үнээр таны SNP-г тодорхойлж өгдөг юм. Таны DNA өгөгдөл дараа байдлаар харагдах болно.

rsID         chromosome    position    allele1      allele2
rs4477212             1       72017          A            A
rs3094315             1      742429          A            A
rs3131972             1      742584          G            G
rs12124819            1      766409          G            G

Эхний багана нь SNP-ын дугаар, 2 дахь нь chromosome-ын дугаар, 3 дахь нь байрлал, харин 4 болон 5 дахь таны 2 хос chromosome дахь 2 allele болно.

Өнөөдрийн хувьд, энэ хүртэл бичье. Дараа завтай болхоороо үргэлжлүүлнэ ээ.