인간의 DNA는 약 30억 개의 염기(base - A, G, C, T의 조합)로 구성되어 있고, 서로 다른 인간의 DNA는 99.7가 동일하다. 이를 다른 말로 하면 약 0.3%, 즉 천 만개의 염기가 서로 다르게 되어 있는데 이 차이가 모든 인간의 다양한 형질(phenotype)로 나타난다. 평균 300개의 염기에 하나씩 나타나는 염기의 변이 variant가 그 인구 사회의 1% 이상에서 일어나는 흔한 변이를 가리켜 단일염기 다형성이라 한다.
단일 염기 다형성 (Single Nucleotide Polymorphism) 정의
DNA 특정 위치에 있는 염기 하나가 바뀌어 있는 것을 말합니다. 어떤 사람은 G를 가진 반면에, 다른 사람은 A를 가지고 있기도 합니다. 다시 말해, DNA 염기 서열에서 하나의 염기서열(A,T,G,C)의 차이를 보이는 유전적 변화 또는 변이를 의미합니다.
SNP는 유전체에서 1,000개의 염기 서열마다 1개 꼴로 나타나며, 이로 인해 개인적인 '유전적 다양성'이 나타난다고 볼 수 있습니다. 이러한 미세한 차이에 의해 각 유전자의 기능이 달라질 수 있고, 이런 것들이 상호작용하여 서로 다른 모양의 사람을 만들고 서로 다른 질병에 대한 감수성의 차이를 만들어 냅니다.
주요 특징
- 발생빈도
SNP는 모든 사람의 유전자에서 발견될 수 있으며, 약 300~1000개의 염기쌍마다 하나씩 존재합니다. 인구 집단 중에서 보통 1% 이상의 빈도가 발생될 때 인정됩니다. Genome 안에서 SNP는 개수가 아주 많기 때문에 마커로 적합합니다.
- 유전자와의 관계
- 비암호화 영역에서의 SNP: 단백질을 암호화하지 않는 영역에 존재하며, 질병에 대한 민감성, 약물 반응성 등의 유전적 차이를 야기할 수 있습니다.
- 암호화 영역에서의 SNP: 단백잴을 암호화하는 영역에 위치한 경우, 단백질의 기능 변화시킬 수 있으며, 이는 특정 질병의 발병이나 약물의 반응성에 직접적인 영향을 미칠 수 있습니다.
- 유전적 다양성
SNP는 인간 유전자 풀의 다양성을 유지하는 중요한 역할을 하며, 사람마다 각기 다른 SNP 패턴을 가지고 있습니다. 이 패턴은 개개인의 유전적 특성과 밀접한 관련이 있습니다.
SNP의 종류
유전자 영역을 중심으로 4가지로 분류됩니다.
. cSNP : Coding SNP로 불리며, 단백질 코딩영역에서 염기 변이를 일으켜 아미노산 변화를 야기시키는 것.
. iSNP : Intron SNP로 불리며, 단백질 형성에 중요한 역할은 하지 않지만 Exon 가까이에서 중요한 역할을 함.
. rSNP : Regulatory SNP로 불리며, 전사 조절인자 영역에서 발견되며, 유전자가 mRNA로 발현되는데 중요한 역할을 함.
. sSNP : Synonymous SNP로 불리며, 단백질 코딩영역에서 발견은 되나 아미노산 변화에 영향을 미치지는 않음.
SNP 발견(디스커버리)과 SNP해석(타이핑)
. SNP 발견(디스커버리)
: 기본적으로 복수의 인간 genome을 재시퀀싱하여 1 염기의 차이를 동정하는 작업을 말합니다. 이것은 많은 시퀀서를 늘어놓고 작동시켜 대량의 서열데이터를 얻는 큰 작업이 됩니다. 유용한 SNP 데이터베이스가 되기 위해서는 충분한 양의 SNP가 필요할 뿐 아니라 SNP의 염색체 상의 위치, 유전자 내의 위치, 기능 등의 SNP의 annotation이 충분히 필요합니다.
. SNP 해석(타이핑)
: 발견된 SNP를 이용해 특정 가계나 집단에서 SNP를 해석하여 유전자형을 결정하는 작업입니다. 이 해석(타이핑) 결과와 데이터 질환의 유무 등을 해석하여 전체 SNP 에서 목적하는 SNP를 추출하게 됩니다. 현재 시퀀스의 자동화, 고속화 기술은 확립되었지만, SNP 타이핑의 자동화, 고속화 기술은 아직 개발 단계이므로 발견된 SNP 수는 많아도 타이핑된 SNP 수는 한정되어 있습니다.
한 군데의 SNP에는 3 종류의 유전자형이 존재한다.
예) A (아데닌) 또는 G(구아닌)
A/A homo, G/G homo, A/G hetero
Three Genotypes
. Homozygous wild type: GG (동종접합 야행성, 양쪽 모두 정상인 경우)
. Heterozygous mutant type: GA (이형접합 돌연변이형, 한 쪽에만 변이가 있는 경우)
. Homozygous mutant type: AA (동종 접합 돌연변이형, 양쪽 모두 변이가 있는 경우)
세 가지 유전적 차이를 갖는 그룹을 유전자형(Genotype)이라 한다. 이렇게 세 그룹 또는 두 그룹의 유전자형과 질병, 즉 표현형(phenotype)의 연관성을 보는 연구가 '연관성 연구'이다.
특정 인구 집단을 조사하면 이듀 유전자형의 출현 빈도를 구할 수 있다. 나아가 그 집단의 어떤 질환을 가진 사람과 그렇지 않은 사람. 두 그룹을 나눠 각각의 유전자형 빈도를 계산해 그것이 통계적으로 유의하게 다른지를 조사할 수 있습니다. 단일 SNP으로 유의차가 나올 수도 있고, 복수의 SNP의 조합으로 유의차가 나올 수도 있을 것입니다. 따라서 SNP는 유전 마커로 이용할 수 있을 뿐만 아니라 그 자체가 기능 변이를 일으키는 경우가 있습니다. 단백질 코드 영역에 있으면서 아미노산 변화를 일으키는 SNP도 빈도는 낮지만 전체 SNP의 0.1% 많은 수가 알려져 있습니다.
SNP의 활용
NGS와 SNP
차세대 시퀀싱 기술인 NGS의 등장으로 데이터 량이 늘어나면서 다양한 SNP발굴이 이루어 지고 있다.
- 의료 및 약물 개발
특정 SNP는 질병의 발병 위험을 예측하거나 약물 반응서응ㄹ 예측하는 데 사용됩니다.
- 유전자 지도 작성
인류의 유전자 구조와 진화 과정을 연구하는데 중요한 자료가 됩니다.
- 유전자 맞춤 치료
개인의 SNP 패턴에 따라 약물 치료 방법을 조정하여 효능을 극대화하고 부작용을 최소화할 수 있습니다.
예시)
암 관련 SNP
특정 SNP는 암 발생 위험을 높일 수 있습니다. 예를 들어, BRCA1 및 BRCA2 유전자에서의 특정 SNP는 유방암 발병 위험을 증가시킬 수 있습니다.
'의료관련 리뷰' 카테고리의 다른 글
snRNA-sequencing, scRNA-sequencing 란? (0) | 2024.04.30 |
---|---|
Genotype과 Phenotype에 대해서 알아보자. (0) | 2024.04.30 |
알츠하이머의 정의 및 원인이 무엇인가? 아밀로이드 베타 & 타우 단백질 (1) | 2024.04.29 |
폐암_EGFR(Epidermal Growth Factor Receptor) 변이와 표적항암제 (0) | 2024.04.17 |
항암제 역사를 알아보자_화학 요법_표적 항암_면역 항암제 (2) | 2024.04.16 |
댓글