機械学習

ケモインフォマティクス

【第6回】Uni-Molを用いたモデル構築【PJ-LogD】

Transformerベースの事前学習モデルを活用した特徴量抽出と、それらを下流タスクに適用するためのファインチューニングで構成される表現学習フレームワーク「Uni-Mol」を用いてLogD予測モデルを構築します。
ケモインフォマティクス

【第5回】RDkit記述子×TabNetによるモデル構築【PJ-LogD】

特徴量としてRDkit記述子、アルゴリズムとして「TabNet」を用いたモデルを構築していきます。TabNetは表形式データの学習に特化したニューラルネットワークモデルです。表形式のデータは従来型の機械学習の方が向いているタスクが多いですが、TabNetはそれに匹敵する、あるいは超える性能をもつモデルだと言われています。
ケモインフォマティクス

【第4回】Attentive FPによるモデル構築【PJ-LogD】

グラフニューラルネットワーク(GNN)はグラフ構造のデータを取り扱うニューラルネットワークです。化合物の原子をノード、結合をエッジとみなし、GNNアーキテクチャの1種である「Attentive FP」を用いて予測モデルを構築します。
ケモインフォマティクス

【第3回】Morgan Fingerprint×勾配ブースティング決定木によるモデル構築【PJ-LogD】

化合物の特徴として「Morgan Fingerprin」、機械学習アルゴリズムとして「勾配ブースティング決定木(XGBoost, LightGBM, CatBoost)」を利用したLogD予測モデルを構築します。また、3種のアルゴリズムをベースモデルとしてスタッキングモデルを構築します。