バイオインフォマティクス
参考記事: NCBI is phasing out sequence GIs - use Accession.Version instead!タイトル通りNCBIの遺伝子IDとして長く利用されてきたGI numberが2016年9月より段階的に廃止されていくらしい。今後は以前よりGI numberと混在していたAccession numberがNCBI…
OrthoMCLは複数生物種のタンパク質FASTAファイルを読み込み、配列の類似性をもとにオーソログのクラスタリングを実行するプログラム Ubuntu14.04(16.04)へのOrthoMCL ver2.0.9のインストールに少し手間取ったので、そのインストールをしたときのメモ書き
目的の生物種全ゲノムのGenbankファイルとそれに対応する全タンパク質FASTAファイルを手動でダウンロードするのが面倒だったので、Perlで自動化してみた。 Bio::Perlを利用したAccession NumberからのGenbankファイルのダウンロード及びGenbankファイルから…
バイオインフォマティクスでデータ解析を始めるにはプログラミング言語の習得が必要不可欠ですが、"どの言語を勉強すればいいのか!?" という疑問が初めに出るんじゃないかなと思います。 C, C++, Java, Perl, Ruby, Python, R、などの言語がバイオインフォ…
各種データベースの管理するFTP(File Transfer Protocol)サイトからデータを自動取得する方法についてのメモデータベースから配列データを取得することは研究の中で日常的に行うことなので、コマンドによるデータの取得がよく利用され、こうしたコマンドをプ…
個人的なバイオインフォマティクスのための勉強用サイトリンク集
近隣結合法による系統樹作成が可能な "clustalw" の使い方メモ
バイオインフォマティクスの研究を進めていると、ある配列保存フォーマットから別のフォーマットに変換したい時がある。そんなときに有用な、bioperlを利用した配列アライメントファイルのフォーマット変換方法のメモ
配列データベースの冗長性を排除するために、配列類似性に基づいてクラスタリングを行うプログラムCD-HIT(Cluster Database at High Identity with Torelance)の使い方メモ
NCBIのWebサービスを利用して、特定のGI numberリストを取得する方法のメモ研究の中でNCBIデータベース上にあるウイルス全タンパク質のGI numberリストが必要になったので、その方法を探してみました。すると、NCBIの検索機能である "Entrez" を利用すること…
マルチプルアライメントされた配列においてオプション設定閾値にしたがって、保存されていると判定された領域のみを取り出すプログラム "Gblocks" の使い方とオプション設定に関するメモ
分子生物学でよく使われるBLASTプログラムについての使い方まとめ
NCBIの一意的な遺伝子IDであるGI numberをもとにして、FASTA配列とかGenbank形式ファイルをプログラムで自動的に取ってこれないかな~ と思っていたところ "E-utilities" という便利なサービスを発見したので、そのサービス内容(一部)と提供サービスを組み込…
タンパク質ドメイン検索に基づいた機能推定のためのプログラムのお話機能未知のタンパク質の機能を推定する際には、タンパク質の最小機能単位であるドメインの構成を調べることで、既知ドメイン情報が検出された場合に、機能推定が可能になります。
大学3年生になって、研究室配属されてから早2年 学部時代の勉強内容とはかけ離れたバイオインフォマティクスという分野での研究にようやく慣れてきたかな?という今日この頃 10月から研究室に新入生が例年より多く配属され、後輩に教えなければならない立場…