バイオインフォマティクス初心者の日常

バイオインフォマティクス関連の研究・勉強などなど

プログラミング

NCBIの遺伝子IDであるGI numberが2016年9月より段階的に廃止

参考記事: NCBI is phasing out sequence GIs - use Accession.Version instead!タイトル通りNCBIの遺伝子IDとして長く利用されてきたGI numberが2016年9月より段階的に廃止されていくらしい。今後は以前よりGI numberと混在していたAccession numberがNCBI…

Bio::Perlを利用したAccession NumberからのGenbankファイルのダウンロードとGenbankからタンパク質FASTAへの変換方法

目的の生物種全ゲノムのGenbankファイルとそれに対応する全タンパク質FASTAファイルを手動でダウンロードするのが面倒だったので、Perlで自動化してみた。 Bio::Perlを利用したAccession NumberからのGenbankファイルのダウンロード及びGenbankファイルから…

バイオインフォマティクス初心者の選ぶプログラミング言語

バイオインフォマティクスでデータ解析を始めるにはプログラミング言語の習得が必要不可欠ですが、"どの言語を勉強すればいいのか!?" という疑問が初めに出るんじゃないかなと思います。 C, C++, Java, Perl, Ruby, Python, R、などの言語がバイオインフォ…

cpanmを利用したperlモジュールインストール

perlのモジュールインストールに関するメモperlでは非常に多くのモジュール(プログラムの部品)が作られてきており、それらはCPANからダウンロードすることができます。 ※CPAN : Comprehensive Perl Archive Networkただし、他人が作ったプログラムを使うには…

bioperlを利用した配列アライメントファイルのフォーマット変換方法(Bio::AlignIO)

バイオインフォマティクスの研究を進めていると、ある配列保存フォーマットから別のフォーマットに変換したい時がある。そんなときに有用な、bioperlを利用した配列アライメントファイルのフォーマット変換方法のメモ

perlの "autodie" を使ってみた

perlではファイルを開くときに、 open(FILE,"open_file") or die "Can't open file!!"; こんな書き方をすることが多かったのですが、"or die" だとエラーが発生しても、"Can't open file!!" という自分が書き込んだ情報しか得られず、デバッグが非常にやりづ…

Config::Simpleを使った設定ファイルの利用方法

perlによるデータ解析のための設定ファイルの作成方法と設定ファイル読み込みのためのモジュール "Config::Simple" に関するメモ

Linux環境上のperlプログラムでCPU数を確認する方法

perlで自作の研究用プログラムを使っていて、プログラム実行の度に毎回CPU数の設定をするのは少し面倒くさかったので、perlで自動的にCPU数を確認する方法を調べてみた。

NCBIの "E-utilities" が結構便利な件

NCBIの一意的な遺伝子IDであるGI numberをもとにして、FASTA配列とかGenbank形式ファイルをプログラムで自動的に取ってこれないかな~ と思っていたところ "E-utilities" という便利なサービスを発見したので、そのサービス内容(一部)と提供サービスを組み込…