【アプリケーション】AlphaFold 導入のお知らせ

タンパク質の構造予測を行うソフトウェアAlphaFoldをType IIサブシステム上で簡単に利用できるように整備しました。 お試しください。

なお、利用しているデータの都合上、アカデミックユーザしか利用できません。

AlphaFold (v2.1.1)利用方法

AlphaFold v2.1.1を /center/local/app/x86/AlphaFold-v2.1.1/alphafold にインストールしました。 実行時に必要となるデータベースも以下に置きました。 (継続的に更新したいと考えていますが、最速で追従できる保証はありません。ご了承ください。)

  • /data/group1/a49979a/share/alphafold_data/db-v2.1
  • /beegfs/a49979a/alphafold/db-v2.1

各ディレクトリに同じデータが置いてあります。 後者はNVMESHに置いてあり、前者と比べてずっと高速に処理が行えるため、特に理由がない限りはこちらの利用を推奨します。 1例としては、10時間以上かかるHHblits処理が10分に短縮される例が確認できています。 利用にあたって特に申請等は必要ありません。cxgfs-系のリソースグループを使わないと参照できない点にだけ注意してください。

NVMESH:Type IIサブシステムの計算ノードに搭載されたSSDを束ねて構築した共有ストレージ。 ジョブにオプションを加えるだけですぐに利用できるBeeONDと異なり利用には申請が必要だが、 BeeONDと異なりジョブの開始終了時に消去されないため、今回のように大容量のデータを継続的に利用するのに適している。 なおBeeONDと同様にローカルSSDとしての利用はできなくなる。

ジョブスクリプトの例も以下に置いてあります。 ファイルをコピーし、ジョブの最長実行時間であるelapseや、 入出力先を指定しているFASTAFILEやOUTPUTDIRなどを調整してご利用ください。 NVMESHを使う場合はcxgfs-で始まるリソースグループを使わねばならない点に注意してください。

  • /center/local/app/x86/AlphaFold-v2.1.1/samples/run_alphafold_nvmesh.sh NVMESHを使う場合用
  • /center/local/app/x86/AlphaFold-v2.1.1/samples/run_alphafold.sh NVMESHを使わない場合用

各ジョブスクリプトは内部で以下のスクリプトを呼び出しています。実行時オプションの精査などの参考にしてください。

  • /center/local/app/x86/AlphaFold-v2.1.1/alphafold/bin/alphafold_nvmesh NVMESHを使う場合用
  • /center/local/app/x86/AlphaFold-v2.1.1/alphafold/bin/alphafold NVMESHを使わない場合用

alphafoldまたはalphafold_nvmeshを修正して使いたい場合は、ファイルを手元にコピーして修正し、 run_alphafold_nvmesh.shまたはrun_alphafold.shも手元にコピーして最後のalphafoldまたはalphafold_nvmesh呼び出し部分で 修正した版が呼び出されるように書き換えてください。

もちろん、自分でインストールしたAlphaFoldからNVMesh上のデータを参照して利用していただいても構いません。