genome data analysis
-
Local BLAST - makeblastdb 이용 nhr, nin, nsq 파일 만들기genome data analysis/Genome analysis 2020. 4. 15. 15:27
Genome 분석 시 fasta(fna 파일 포함) 파일 이외에도. nhr, nin 파일이 필요한 경우가 있습니다. 이 때는 Local BLAST를 설치해 makeblast 명령어를 사용해 fasta 파일로부터. nhr, nin 파일을 생성할 수 있습니다. 윈도우 환경에서도 생성할 수 있습니다. nhr, nin 파일은 간단하게 다음 순서대로 진행됩니다. 1. Local BLAST 다운로드 2. Local BLAST path 설정(exe 형태로 받을 경우 자동 설정되기도 함) 3. 명령프롬프트에서 " 명령어 치기" 이렇게 하면 nhr, nin 파일이 생성됩니다. 1. Local BLAST 다운로드 Local BLAST는 아래 사이트에서 각 PC 환경에 맞는 파일을 받으면 됩니다. 그런데 최신 버전은 nhr..
-
gbk 파일 변환하기genome data analysis/Genome analysis 2020. 4. 11. 17:04
Genome 데이터 분석할 때 gbk 파일이 필요한 경우가 있습니다.간단하게 DNA sequence만 필요한 경우 아래와 같이 진행하면 됩니다.아래는 gene runner 프로그램을 이용해 gbk 파일을 만들었습니다. 전체적인 과정은 간단합니다.1. Gene Runner를 연다.2. File > Open > 변환할 fasta (fna) 파일 선택 또는 File > New > Nucleic acid sequence 클릭 후 변환할 염기서열 ctrl C + ctrl V3. Save as > 파일이름.gbk > 저장이렇습니다.1. 먼저, Gene Runner 는 아래 사이트에서 다운로드 합니다.http://www.generunner.net/ Gene Runner www.generunner.net(32비트인지 ..
-
Fastq to consensus sequencesgenome data analysis/Genome analysis 2020. 4. 4. 17:53
Bacteria genome sequencing을 Pacbio로 했다면 필요없는 과정이겠지만, Miseq이나 Hiseq으로 데이터를 만들었고 이걸 하나의 sequence로 합치고자 한다면 아래와 같은 과정이 필요합니다. Denovo sequencing을 하려는 경우는 해당되지 않아요. Reference 에 mapping하고 하나의 sequence를 만드는 과정입니다. Sample이 하나의 chromosome으로 되어있지않고 Plasmid가 하나 또는 여러개가 더 있을 경우 아래 있는 방법으로 하면 plasmid sequence는 놓칠 수 있어요. - SAMtools와 BCFtools는 버젼을 같은 것으로 하는게 좋습니다. 둘 다 한꺼번에 새버젼으로 새로 설치를 하는게 좋습니다. 버젼이 다르면 오류가 생길..
-
Genome circular map 그리기genome data analysis/Genome analysis 2020. 4. 1. 14:15
Circular map 그리기 저는 사람 유전체 분석 쪽을 주로 진행했었는데 어느 날... 세균 circular genome map을 그려달라는 부탁을 받았습니다. 그러고 나서 여러 프로그램들을 찾아봤는데 어떻게 사용하는 건지 잘 이해가 안 갔습니다. 아마 2주쯤? 시간을 투자하면 매뉴얼을 읽고 차츰차츰 터득해나갈 수 있었겠지만 이거 그리는데 2주를 다 쓸 수는 없는 상황이었습니다.... 그러고 보니 결국 한 달 정도를 circular map 그리는데 쓴 거 같긴 하네요.. Circular map을 그리는데 BRIG이라는 프로그램을 사용했습니다. 이게 얼마나 사용되고, 얼마나 좋은 프로그램인지는 모르겠습니다만.. 제가 유일하게 사용할 수 있는 circular map 그리는 프로그램입니다. 제가 매뉴얼을 ..