Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.fbb.msu.ru/FBB/year_07/term3/fasta.html
Дата изменения: Tue Oct 28 18:11:12 2008 Дата индексирования: Tue Oct 2 06:37:14 2012 Кодировка: Windows-1251 |
fasta35 query.fasta db.fasta 6где query.fasta - файл с пробной последовательностью, db.fasta - файл с банком последовательностей, 6 - параметр (для нуклеотидных последовательностей вместо 6 можно ставить 3, 4 или 5; для белковых последовательностей вместо 6 необходимо ставить 1 или 2).
Программа fasta задумана как интерактивная. Это значит, что в процессе работы она задает вопросы и ждет от пользователя ответов. Чтобы запускать такую программу из скрипта, надо заранее продумать ответы на все вопросы, записать ответы в файл (по строке на ответ) и подать этот файл программе в качестве stdin (это можно сделать двумя способами: конвейером из программы cat и посредством знака <; последний в командной строке надо ставить после самой команды).
Интересно не столько общее число находок, сколько число находок с достаточно низким E-value. К сожалению, последняя версия программы fasta почему-то не понимает порога на E-value, который, по идее, должно быть возможно прописать в командной строке... Значит, надо придумать такую комбинацию grep и средств Excel, которая все же позволила бы достаточно быстро получить нужные числа.
Стоит добавить, что fasta под Windows и Linux доступна с адреса http://fasta.bioch.virginia.edu/fasta_www2/fasta_down.shtml