バイオインフォマティクス初心者の日常

バイオインフォマティクス関連の研究・勉強などなど

Ubuntu14.04(16.04)へのOrthoMCL2.0.9のインストール方法

OrthoMCLは複数生物種のタンパク質FASTAファイルを読み込み、配列の類似性をもとにオーソログのクラスタリングを実行するプログラム
Ubuntu14.04(16.04)へのOrthoMCL ver2.0.9のインストールに少し手間取ったので、そのインストールをしたときのメモ書き

  1. 必要なプログラムのインストール
  2. $ sudo apt-get install blast2 mcl cpanminus mysql-server git 

    mysql-serverのインストール時にデータベースへアクセスするためのパスワードの入力を求められます。この後の設定に使うので、入力パスワードを覚えておいてください。

  3. 必要なPerlモジュールパッケージのインストール
  4. $ cpanm BioPerl DBD::mysql DBI Parallel::ForkManager YAML::Tiny Set::Scalar Text::Table Exception::Class Test::Most Test::Warn Test::Exception Test::Deep Moose SVG Algorithm::Combinatorics --sudo 

    Perlモジュールパッケージのインストールに便利なcpanmを利用

  5. OrthoMCLダウンロードディレクトリ作成と実行スクリプトインストール
  6. # Make orthomcl install directory
    [ ! -d ~/bin ]          && mkdir ~/bin
    [ ! -d ~/bin/orthomcl ] && mkdir ~/bin/orthomcl
    cd ~/bin/orthomcl
    
    # Clone orthomcl-pipeline programs from Github
    git clone https://github.com/apetkau/orthomclsoftware-custom.git 
    git clone https://github.com/apetkau/orthomcl-pipeline.git

    上記のコマンドを実行すると、ホームディレクトリ以下の ~/bin/orthomcl にOrthoMCLの実行スクリプトGitHubよりインストールします。

  7. OrthoMCLの実行に必要なプログラムのインストール状態確認
  8. $ perl ./orthomcl-pipeline/scripts/orthomcl-pipeline-setup.pl 

    全てOKが出ていれば、必要なプログラムのインストールができています。

  9. OrthoMCL実行プログラムへのパス通し
    OrthoMCL実行プログラムのPATHを通すために、~/.bashrc に以下の情報を書き込む。
    PATH=$PATH:~/bin/orthomcl/orthomclsoftware-custom/bin
    PATH=$PATH:~/bin/orthomcl/orthomcl-pipeline/bin
    その後、下記コマンドを実行して、一時的にPATHを通す。

    $ source ~/.bashrc  

  10. MySQLデータベースアクセスのための設定ファイル作成(orthomcl.conf)
  11. $ perl ./orthomcl-pipeline/scripts/orthomcl-setup-database.pl --user root --password [passward] --host localhost --database orthomcl --outfile orthomcl.conf 

    [password]の部分を、mysql-serverインストール時に設定したパスワードに書き換えて、上記コマンドを実行すると、OrthoMCLの実行に必要な設定ファイル'orthomcl.conf'がカレントディレクトリに作成される。

  12. OrthoMCLのテスト実行
  13. $ perl ./orthomcl-pipeline/t/test_pipeline.pl -m orthomcl.conf -s fork -t /tmp 

    テスト実行が全てOKであれば、再ログインしてPATHを通してください。

  14. OrthoMCLの実行
  15. $ orthomcl-pipeline -i [fasta_dir] -o [outdir] -s [processor] -m ./orthomcl.conf --nocompliant --yes 

    OrthoMCLは上記のようなコマンドで実行が可能です。
    -i: 各生物のタンパク質FASTAファイルの入ったディレクトリ(拡張子は '.faa' or '.fasta')
    -o: 出力先ディレクト
    -s: 使用プロセッサー数
    その他オプションの詳細はヘルプコマンドで確認してください。

    参考サイト
    orthomcl-pipeline/INSTALL.md at master · apetkau/orthomcl-pipeline · GitHub