ChEMBL、統合TV完成(未アップロード)

ChEMBLの統合TV製作にケリをつけました。camproj動画ファイルに残り音声をつけたら出力→アップロードできる段階です。

ChEMBLdbは、創薬研究に有用な医薬品化合物の情報を提供するデータベースです。現在、約50万個の化合物情報、約190万件の活性情報及びそれらのターゲット情報が登録されています。ユーザーは、生物活性化合物の情報を部分構造検索や類似性検索で調査したり、また、ターゲットのアミノ酸配列からBLAST検索でアッセイ情報を収集することができます。
http://chembl.blogspot.jp/2009/11/blog-post.html

↓最終的な内容

  • Target Search - タンパク質を名前/系統樹/BLAST配列から指定し、リガンドを探す

タンパク質に対するリガンドを活性データ/結合アッセイデータ、Ligand Efficiency Plot(リガンド効率指数)、分子量…の値ごとに表示できる。
 ↑ "Bioactivity filter"でIC50, EC50, KDなどのパラメータを特定の範囲で限定できる。有用そう
・リガンドについての実験情報
ターゲットと化合物のBinding/Functional/ADMET(assessment of in vivo absorption, distribution, metabolism excretion and toxicity)
ADMET…吸収・分布・代謝・排泄および毒性の頭文字をとったもの.これら5種類のパラメータは,組織における薬物の濃度や生体内での薬物動態を規定するため,薬物の力価に大きな影響を及ぼす(https://www.yodosha.co.jp/jikkenigaku/index.html
活性情報のエンドポイント IC50(half maximal inhibitory concentration), Ki(binding affinity),MIC(minimum inhibotory concentratuon), % inhibition(of activity)

  • Compound Search - 化合物の構造を投げ、類似性から探す/名前から探す/SMILE・IDから探す

・医薬品情報について補足。Drug class(低分子,ペプチド, 抗体…)、Rule of Five compliant、経口か、承認年が02年以降か、ファースト・イン・クラスか、モノクロ抗体か、Parental Delivery, Topical Delivery、エナンチオマーの有無、Prodrug(そのままでは不活性な、もしくは明らかに活性の低い形態で投与される医薬品 投与されると、生体による代謝作用を受けて活性代謝物へと変化し、薬効を示す。)か、Boxed warning(=黒箱警告)…etc


↓時間の都合であきらめた内容

  • Analysis of key gene families - キナーゼとGPCRのSAR(Structure-activity Relationship)情報

特に特色あるのは以下の3つ?
  -"Family Browsing" 分子系統樹からキナーゼ(GPCR)を絞っていき、ターゲット化合物を探す
  キナーゼ(GPCR)ひとつにつき"Report Card"ページで承認薬情報が得られる
 -"Binding site" 特定のキナーゼについて結合する部位別に化合物を検索する(キナーゼのみ、GPCRにはない)
 -"Structure" 三次元構造の重ねあわせで化合物の結合位置を確認(キナーゼのみ、GPCRにはない)

  • Neglected Tropical Disease(NTD) archive  - 熱帯病の医薬品候補化合物DB
  • DrugEBIlity - PDB IDやタンパク質の配列を投げると"Druggability" "Tractability"という値を用いて創薬可能な部位と、可能性の予測をしてくれる(…!?)

値の指標はFAQに載っている


盛り込みたい話はいくらでもあったのですがあっさりめに動画を仕上げて(それでも4分半)終了です。
2月内の統合牧場の移転に伴ってラスト放牧でした。統合TV制作班としてのRA活動も一区切りになります。
ありがとうございました。
今後このブログどうしようね?

ChEMBL、統合TV製作にむけた調査にそろそろ収集つけたい

ChEMBLの統合TV製作にむけ調査中です。
医薬品/化合物業界の用語やパラメータの意味がようやくひととおりわかるようになってきた感があります。

ChEMBLdbは、創薬研究に有用な医薬品化合物の情報を提供するデータベースです。現在、約50万個の化合物情報、約190万件の活性情報及びそれらのターゲット情報が登録されています。ユーザーは、生物活性化合物の情報を部分構造検索や類似性検索で調査したり、また、ターゲットのアミノ酸配列からBLAST検索でアッセイ情報を収集することができます。
http://chembl.blogspot.jp/2009/11/blog-post.html

進捗部分は赤字

  • Target Search - タンパク質を名前/系統樹/BLAST配列から指定し、リガンドを探す

タンパク質に対するリガンドを活性データ/結合アッセイデータ、Ligand Efficiency Plot(リガンド効率指数)、分子量…の値ごとに表示できる。
 ↑ "Bioactivity filter"でIC50, EC50, KDなどのパラメータを特定の範囲で限定できる。有用そう
・リガンドについての実験情報
ターゲットと化合物のBinding/Functional/ADMET(assessment of in vivo absorption, distribution, metabolism excretion and toxicity)
ADMET…吸収・分布・代謝・排泄および毒性の頭文字をとったもの.これら5種類のパラメータは,組織における薬物の濃度や生体内での薬物動態を規定するため,薬物の力価に大きな影響を及ぼす(https://www.yodosha.co.jp/jikkenigaku/index.html
活性情報のエンドポイント IC50(half maximal inhibitory concentration), Ki(binding affinity),MIC(minimum inhibotory concentratuon), % inhibition(of activity)

  • Compound Search - 化合物の構造を投げ、類似性から探す/名前から探す/SMILE・IDから探す

・医薬品情報について補足。Drug class(低分子,ペプチド, 抗体…)、Rule of Five compliant、経口か、承認年が02年以降か、ファースト・イン・クラスか、モノクロ抗体か、Parental Delivery, Topical Delivery、エナンチオマーの有無、Prodrug(そのままでは不活性な、もしくは明らかに活性の低い形態で投与される医薬品 投与されると、生体による代謝作用を受けて活性代謝物へと変化し、薬効を示す。)か、Boxed warning(=黒箱警告)…etc

  • Analysis of key gene families - キナーゼとGPCRのSAR(Structure-activity Relationship)情報

特に特色あるのは以下の3つ?
  -"Family Browsing" 分子系統樹からキナーゼ(GPCR)を絞っていき、ターゲット化合物を探す
  キナーゼ(GPCR)ひとつにつき"Report Card"ページで承認薬情報が得られる
 -"Binding site" 特定のキナーゼについて結合する部位別に化合物を検索する(キナーゼのみ、GPCRにはない)
 -"Structure" 三次元構造の重ねあわせで化合物の結合位置を確認(キナーゼのみ、GPCRにはない)

  • Neglected Tropical Disease(NTD) archive  - 熱帯病の医薬品候補化合物DB
  • DrugEBIlity - PDB IDやタンパク質の配列を投げると"Druggability" "Tractability"という値を用いて創薬可能な部位と、可能性の予測をしてくれる(!!!)

値の指標はFAQに載っている


そろそろ動画作りに入りたいですね。

ChEMBL、統合TV製作にむけて調査が進みました

ご無沙汰です。本業に時間を取られまくっていたらすっかり数カ月ぶりの放牧作業です。

ChEMBLの統合TV製作にむけ調査を進めています。
医薬品/化合物業界の用語やパラメータの意味が門外漢にはさっぱりでいちいち調べながら作っているので遅々として進まないです。ひぃ。勉強になります(かすれた声)

ChEMBLdbは、創薬研究に有用な医薬品化合物の情報を提供するデータベースです。現在、約50万個の化合物情報、約190万件の活性情報及びそれらのターゲット情報が登録されています。ユーザーは、生物活性化合物の情報を部分構造検索や類似性検索で調査したり、また、ターゲットのアミノ酸配列からBLAST検索でアッセイ情報を収集することができます。
http://chembl.blogspot.jp/2009/11/blog-post.html

前回調査した「おもなサービス」の使い方を軽く紹介する方向で、以下ぐらいまで調査を進めました
(自分用メモのコピーなのでたいへん見にくいですが)

  • Target Search - タンパク質を名前/系統樹/BLAST配列から指定し、リガンドを探す

タンパク質に対するリガンドを活性データ/結合アッセイデータ、Ligand Efficiency Plot(リガンド効率指数)、分子量…の値ごとに表示できる。
・リガンドについての実験情報
ターゲットと化合物のBinding/Functional/ADMET(assessment of in vivo absorption, distribution, metabolism excretion and toxicity)
ADMET…吸収・分布・代謝・排泄および毒性の頭文字をとったもの.これら5種類のパラメータは,組織における薬物の濃度や生体内での薬物動態を規定するため,薬物の力価に大きな影響を及ぼす(https://www.yodosha.co.jp/jikkenigaku/index.html
活性情報のエンドポイント IC50(half maximal inhibitory concentration), Ki(binding affinity),MIC(minimum inhibotory concentratuon), % inhibition(of activity)

  • Compound Search - 化合物の構造を投げ、類似性から探す/名前から探す/SMILE・IDから探す

・医薬品情報について補足。Drug class(低分子,ペプチド, 抗体…)、Rule of Five compliant、経口か、承認年が02年以降か、ファースト・イン・クラスか、モノクロ抗体か、Parental Delivery, Topical Delivery、エナンチオマーの有無、Prodrug(そのままでは不活性な、もしくは明らかに活性の低い形態で投与される医薬品 投与されると、生体による代謝作用を受けて活性代謝物へと変化し、薬効を示す。)か、Boxed warning(=黒箱警告)…etc

この「化合物情報」データ欄の解釈の仕方がいまいちわからないので引き続き要調査

  • Analysis of key gene families - キナーゼとGPCRのSAR(Structure-activity Relationship)情報
  • Neglected Tropical Disease(NTD) archive  - 熱帯病の医薬品候補化合物DB

生物活性低分子のデータベースChEMBL、統合TV製作にむけて調査中

前回でMendeleyの統合TVを完成させたので新しいプロジェクトに取り掛かっています。
標的はニーズ?があったというChEMBL

ChEMBLdbは、創薬研究に有用な医薬品化合物の情報を提供するデータベースです。現在、約50万個の化合物情報、約190万件の活性情報及びそれらのターゲット情報が登録されています。ユーザーは、生物活性化合物の情報を部分構造検索や類似性検索で調査したり、また、ターゲットのアミノ酸配列からBLAST検索でアッセイ情報を収集することができます。
http://chembl.blogspot.jp/2009/11/blog-post.html

ターゲット情報は主にタンパク質構造を扱うPDBのようにユーザーがデータをDepositeする形ではなく、MedChem系ジャーナルの学術論文から外部委託で手動抽出しているらしい。ひええ。

おもなサービスは以下。

  • Target Search - タンパク質を名前/系統樹/BLAST配列から指定し、リガンドを探す
  • Compound Search - 化合物の構造を投げ、類似性から探す/名前から探す/SMILE・IDから探す
  • Analysis of key gene families - キナーゼとGPCRのSAR(Structure-activity Relationship)情報
  • Neglected Tropical Disease(NTD) archive  - 熱帯病の医薬品候補化合物DB

みんな大好きPubMedで"ChEMBL"検索したところヒットは72件(2013/8/23時点)
http://www.ncbi.nlm.nih.gov/pubmed/?term=ChEMBL
ざっと見たところ案の定?踊る"Prediction", "in silico screening", "linked open data", "High-throughput screening"等などの文字列。
想像どおりウェット屋さんよりかは創薬化学屋さん・ケモインフォマティクス屋さん御用達のサービスのようで。

日本語案件にもこんな活用例がありました。
MMPを構造ベースで解釈する試みはコンテキストが入りまくって一般性は得られないよね - http://blog.kzfmix.com/entry/1372239565
ChEMBLでMMP=Matched Molecular Pairs, 構造の一部共通した化合物の組み合わせを釣ってきて、特定のタンパク質に対するリガンド性を評価。できるの実際?

って話。

いろいろ何をどこまで紹介しようか考えこんでしまったのですが、まあPubChemの統合TVのようにシンプルな機能紹介をすればいいかなあと思っています。
詳しい内容は次回以降詰めていこうかと。

Mendeley統合TV「文献管理ソフトMendeleyを使って論文を読む・前編/後編」アップロード

先日の放牧になりますが統合TV文献管理ソフトMendeleyを使って論文を読む・前編および文献管理ソフトMendeleyを使って論文を読む・後編、アップロードしました。

アップロードした / 文献管理ソフトMendeleyを使って論文を読む・前編 - 統合TV (togotv)(2013-07-18) http://togotv.dbcls.jp/20130718.html #Zenback @zenbackさんから
https://twitter.com/_junk_0/status/357810719976202241

こちら後編も。「使ってみようかな」「触ってはみたけど」て人向け、使いこなしてる人にそこまで目新しい話はないかもですが… / 文献管理ソフトMendeleyを使って論文を読む・後編 - 統合TV (togotv)(2013-07-19) http://togotv.dbcls.jp/20130719.html
https://twitter.com/_junk_0/status/357810719976202241

如何せんひとつのソフトで扱える操作があまりに多いのでとても紹介しきれてはいないです、文献リスト作成機能含めMendeleyの公式チュートリアルで説明してるとこはだいたい端折ってます。「ふだんの論文をちょっと便利に読もう」くらいまでがなんとなくのコンセプト。
https://twitter.com/_junk_0/status/357812888360071168

なので、「こんなふうにも使えるよ!」的なネタはまだまだあったり。
例えば

Taizo_Ayase 2013/06/14 20:44
すっごい今更で恐縮ですが、Tools->Check for Duplicateは複数PCで使っている人には結構便利なので盛りこんでもらえるといいかも…?

junk_0 2013/06/14 21:32
ありがとう。実はその部分も作ったんだけどお蔵入りしたんだよね…書いとけばよかったね。どこかで書いたかな…?けっこう取捨選択してるのよ。
まあ次出すことがあれば入れるかも。ある程度使い倒してる人じゃないと必要性を感じにくいコンテンツかなって意味で。

http://d.hatena.ne.jp/junk_0/20130614/1371207628#c

ということで

なお『Mendeley応用編』的な統合TVの作成は目下検討中ですので、文献管理に一家言おmochiのかたはご意見くださると嬉しいです:)
https://twitter.com/_junk_0/status/357813597063221248

なお今回の

内容は Mendeleyアカウントの作成とアプリのインストール / フォルダ監視を使った文献追加 / PDFファイルのリネームとサブフォルダへの階層分け / PDFから取得した文献メタデータの修正 / ライブラリの検索とPDFビュワーの使い方 / Webアプリの使い方、までです。
https://twitter.com/_junk_0/status/357815361258790913

はい、だいたい作業記録に載せたいこと呟ききってた感ありました。
Twitter宣伝してたからね。
それなのでMendeley続編は今後の反響しだいで検討しようかと思います。反響がそんなでもなければ作らなくていいかな。

文献管理ソフトMendeleyの解説動画、アップロード準備でひっかかり中+初号機Camtasia 7の統合TVプリセットについて

進捗がストップしているので今回の放牧記録は統合TV内部関係者への事務連絡・報告に近いです。

Mendeleyの統合TV、前回までに作った内容(過去記事参照)でMOV出力を
試みました。
が、複数のマシンを使っても製作した動画がMOVに出力できない
エンコーディングの最後に「MOVに出力できませんでした(-108)」とエラーメッセージが出る)という事態に見まわれ。

Camtasiaの例ではありませんが、MOV出力・108のエラーメッセージで失敗する例をぐぐると、確かではありませんが動画サイズに伴うメモリ不足の可能性が挙げられるとのこと。
解決策として動画サイズを落とすことが挙げられていました。

今回出力中にタスクマネージャでメモリ状況を見ていないのでこれが当て嵌まるか確証はなかったのですが、確かに動画を2分割して出力を試みると成功しました。
参考までに、分割前のcamprojファイルは1.07MBでした。

えーと現時点としてはMOV出力を最終的に2分割した動画で完了したので次回の放牧で2本まとめてアップロードで。

  • -

なお以下統合TV関係者への連絡になります。初号機のCamtasia 7には統合TV用のMOV出力プリセットが準備されていません。
準備しようとしたところ、
「TechSmith EnSharpen QuickTimeが必要」
「TechSmith EnSharpen QuickTimeビデオコーデックをインストールするにはCamtasia Studioを再インストールしてください」
と要求が出ましたがめんどくさいのでやりませんでした(´・ω・`)という経緯です
(すみません)
ということで、どなたかお時間のあるときにプリセット準備(のためCanmtasia 7再インストール)をお願いします。次回以降暇があれば私がやります。

文献管理ソフトMendeleyの解説動画、アップロード準備へ

Mendeleyの統合TV、前回までに作った内容(過去記事参照)で本日ゴーサインを貰えたのでアップロード作業に移行します。
本日は動画のフォントサイズ直しとテンプレート画像付加作業、BGM付け作業だけ。
次回でmovファイル出力にアップロード、とカタをつけてしまいたいです。