Book trip advisor

책을 읽은 내용, 여행을 다녀온 기록 등 일상의 다양한 경험에 대한 기록을 공유합니다.

python

fasta file 2개에서 겹치는 서열을 제거한 파일 만들기

2개 fastq 파일에서 중복되는 염기서열을 제거해야 하는 상황에 활용할 수 있다. python을 돌린 후에도 fastq등의 화일로 저장이 되므로 이후의 clustering 이나, ranking을 정할 때에 유용하다.

  1. python 실행 파일인 fasta_remove.py 를 만든다.
fasta_remove.py
fasta_remove.py 작성
  1. terminal 에서 python fasta_remove.py (예 : fasta_remove.py <input_fasta> <remove_file> <output_fasta>)
  2. 실제로 파일은 fastq, txt 모두 작동한다.
  3. 이 작업을 하기에 앞서서 Seq_filter.pl (예: Perl /usr/local/bin/Seq_filter.pl -i cut5and3count1.txt -min 9 -max 120 -1)
    을 활용해서 너무 짧거나 긴 서열을 제거한 후에 사용하면 좋다.

이걸 알아내자고 정보의 바다에서 6시간동안 익사하는 줄 알았다.

LEAVE A RESPONSE

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다