バイオインフォマティクス初心者の日常

バイオインフォマティクス関連の研究・勉強などなど

バイオインフォマティクス

NCBIの遺伝子IDであるGI numberが2016年9月より段階的に廃止

参考記事: NCBI is phasing out sequence GIs - use Accession.Version instead!タイトル通りNCBIの遺伝子IDとして長く利用されてきたGI numberが2016年9月より段階的に廃止されていくらしい。今後は以前よりGI numberと混在していたAccession numberがNCBI…

Ubuntu14.04(16.04)へのOrthoMCL2.0.9のインストール方法

OrthoMCLは複数生物種のタンパク質FASTAファイルを読み込み、配列の類似性をもとにオーソログのクラスタリングを実行するプログラム Ubuntu14.04(16.04)へのOrthoMCL ver2.0.9のインストールに少し手間取ったので、そのインストールをしたときのメモ書き

Bio::Perlを利用したAccession NumberからのGenbankファイルのダウンロードとGenbankからタンパク質FASTAへの変換方法

目的の生物種全ゲノムのGenbankファイルとそれに対応する全タンパク質FASTAファイルを手動でダウンロードするのが面倒だったので、Perlで自動化してみた。 Bio::Perlを利用したAccession NumberからのGenbankファイルのダウンロード及びGenbankファイルから…

バイオインフォマティクス初心者の選ぶプログラミング言語

バイオインフォマティクスでデータ解析を始めるにはプログラミング言語の習得が必要不可欠ですが、"どの言語を勉強すればいいのか!?" という疑問が初めに出るんじゃないかなと思います。 C, C++, Java, Perl, Ruby, Python, R、などの言語がバイオインフォ…

wgetコマンドを利用したデータベースからの配列データ自動取得の流れ

各種データベースの管理するFTP(File Transfer Protocol)サイトからデータを自動取得する方法についてのメモデータベースから配列データを取得することは研究の中で日常的に行うことなので、コマンドによるデータの取得がよく利用され、こうしたコマンドをプ…

バイオインフォマティクス勉強用サイトリンク集

個人的なバイオインフォマティクスのための勉強用サイトリンク集

clustalwを利用した系統樹の作成方法

近隣結合法による系統樹作成が可能な "clustalw" の使い方メモ

bioperlを利用した配列アライメントファイルのフォーマット変換方法(Bio::AlignIO)

バイオインフォマティクスの研究を進めていると、ある配列保存フォーマットから別のフォーマットに変換したい時がある。そんなときに有用な、bioperlを利用した配列アライメントファイルのフォーマット変換方法のメモ

配列クラスタリングプログラムCD-HITの使い方

配列データベースの冗長性を排除するために、配列類似性に基づいてクラスタリングを行うプログラムCD-HIT(Cluster Database at High Identity with Torelance)の使い方メモ

NCBIから特定のGI numberリストを取得する方法

NCBIのWebサービスを利用して、特定のGI numberリストを取得する方法のメモ研究の中でNCBIデータベース上にあるウイルス全タンパク質のGI numberリストが必要になったので、その方法を探してみました。すると、NCBIの検索機能である "Entrez" を利用すること…

配列保存領域の抽出プログラムGblocksの使い方

マルチプルアライメントされた配列においてオプション設定閾値にしたがって、保存されていると判定された領域のみを取り出すプログラム "Gblocks" の使い方とオプション設定に関するメモ

配列類似性検索プログラムBLASTの使い方

分子生物学でよく使われるBLASTプログラムについての使い方まとめ

NCBIの "E-utilities" が結構便利な件

NCBIの一意的な遺伝子IDであるGI numberをもとにして、FASTA配列とかGenbank形式ファイルをプログラムで自動的に取ってこれないかな~ と思っていたところ "E-utilities" という便利なサービスを発見したので、そのサービス内容(一部)と提供サービスを組み込…

HMMERを使ったPfamデータベースへのドメイン検索

タンパク質ドメイン検索に基づいた機能推定のためのプログラムのお話機能未知のタンパク質の機能を推定する際には、タンパク質の最小機能単位であるドメインの構成を調べることで、既知ドメイン情報が検出された場合に、機能推定が可能になります。

初心者が学ぶバイオインフォティクス

大学3年生になって、研究室配属されてから早2年 学部時代の勉強内容とはかけ離れたバイオインフォマティクスという分野での研究にようやく慣れてきたかな?という今日この頃 10月から研究室に新入生が例年より多く配属され、後輩に教えなければならない立場…