본문 바로가기
생물정보학

g:Profiler - gene 데이터 변환 및 기능 분석

by S-Pang 2024. 7. 30.
728x90
반응형

 

gene의 type을 원하는 형태로 변환할 수 있는 사이트를 찾다가, 유용한 사이트를 알게되어서 간단하게 정리해보았습니다.

 

 

 

g:Profiler은 유전자 기능 분석 및 데이터 변환을 위한 강력한 도구입니다. 유전자 기능 분석 및 데이터 변환을 위한 다양한 도구들이 존재하지만, 그 중에서도 g:Profiler은 강력하고 다재다능한 도구 세트를 제공합니다.

 

 

 

다음은 사이트 주소입니다.

https://biit.cs.ut.ee/gprofiler/gost

 

g:Profiler – a web server for functional enrichment analysis and conversions of gene lists

 

biit.cs.ut.ee

 

 

 

g:Profiler에는 아래와 같이 크게 4가지의 기능이 있습니다.

 


<g:GOSt: 기능적 풍부성 분석 (ORA 및 유전자 집합 풍부성 분석)>

 

g:GOSt는 입력된 유전자 목록에 대해 기능적 풍부성 분석을 수행하는 도구입니다. 이는 유전자들을 알려진 기능적 정보 소스에 매핑하고, 통계적으로 유의미하게 풍부한 용어를 감지합니다. Ensembl 데이터베이스와 곰팡이, 식물, 동물 특정 버전의 Ensembl Genomes, 그리고 기생충 특정 데이터는 WormBase ParaSite에서 정기적으로 데이터를 가져옵니다. Gene Ontology 외에도 KEGG, Reactome, WikiPathways의 경로; miRTarBase의 miRNA 표적; TRANSFAC의 조절 모티프 매치; Human Protein Atlas의 조직 특이성; CORUM의 단백질 복합체 및 Human Phenotype Ontology의 인간 질병 표현형을 포함합니다. g:GOSt는 거의 500종의 생물을 지원하며, 수백 가지의 식별자 유형을 받아들입니다.

 


<g:Convert: 다양한 유전자 및 단백질 식별자 간 변환>

 

g:Convert는 다양한 유전자, 단백질, 마이크로어레이 프로브 및 기타 여러 유형의 네임스페이스 간 변환을 가능하게 합니다. 60종 이상의 생물에 대해 최소 40종의 ID를 제공하며, 인간의 경우 98가지의 네임스페이스를 지원합니다. 여기에는 Ensembl, Refseq, Illumina, Entrezgene, Uniprot 식별자가 포함됩니다. 모든 네임스페이스는 Ensembl 유전자 식별자를 참조하여 매칭됩니다.

 


<g:Orth: 유전자 식별자 간 번역>

 

g:Orth는 생물 간 유전자 식별자를 번역하는 도구입니다. Ensembl 데이터베이스에서 가져온 정보를 기반으로 상동 유전자 매핑을 제공합니다.

 


<g:SNPense: 인간 SNP rs-코드 매핑>

 

g:SNPense는 인간 SNP rs-코드 목록을 유전자 이름으로 매핑하고, 염색체 좌표 및 예측된 변이 효과를 수신합니다. 매핑은 적어도 하나의 단백질 코딩 Ensembl 유전자와 겹치는 변이에 대해서만 활성화됩니다. 모든 기본 데이터는 Ensembl Variation 데이터에서 가져옵니다.

 

반응형

 

 

 

 

 

그 중에서, gene의 type을 원하는 형태로 변환할 수 있는 g:Convert에 대해서 간단히 정리해보겠습니다.

 

 

사이트에 들어가게 되면, 다음과 같은 화면을 볼 수 있습니다.

 

 

'Query' 부분에 본인이 원하는, 변환하고 싶은 gene type 리스트를 적습니다. 이때, 제가 알기로는 아래와 같이 enter를 쳐서 병렬식으로 기입을 해야합니다.

'Organism'에는 대상 gene이 해당되는 생물 종류를 적어야 합니다. "Target namespace"는 변환하고자 하는 ID가 변환 될 최종 목적지 데이터베이스를 의미하고, "Numeric IDs treated as"는 숫자로 구성된 ID가 특정 데이터베이스 네임스페이스로 해석되는 방식을 의미하는 것으로 이해했습니다.

 

 

만약, 저처럼 gene type을 단순히 symbol 등으로 바꾸고 싶은 것이라면, "Target namespace" 또는 "Numeric IDs treated as"과 크게 상관 없이 아래와 같이 원하는 정보를 얻을 수 있을 것 입니다.

또한, CSV파일로 받을 수 있기 때문에 활용에 용이합니다.

 

 

 

728x90
반응형