ケモインフォマティクス 【第6回】Uni-Molを用いたモデル構築【PJ-LogD】 Transformerベースの事前学習モデルを活用した特徴量抽出と、それらを下流タスクに適用するためのファインチューニングで構成される表現学習フレームワーク「Uni-Mol」を用いてLogD予測モデルを構築します。 2025.03.09 ケモインフォマティクス
ケモインフォマティクス 【第5回】RDkit記述子×TabNetによるモデル構築【PJ-LogD】 特徴量としてRDkit記述子、アルゴリズムとして「TabNet」を用いたモデルを構築していきます。TabNetは表形式データの学習に特化したニューラルネットワークモデルです。表形式のデータは従来型の機械学習の方が向いているタスクが多いですが、TabNetはそれに匹敵する、あるいは超える性能をもつモデルだと言われています。 2025.03.01 ケモインフォマティクス
ケモインフォマティクス 【第4回】Attentive FPによるモデル構築【PJ-LogD】 グラフニューラルネットワーク(GNN)はグラフ構造のデータを取り扱うニューラルネットワークです。化合物の原子をノード、結合をエッジとみなし、GNNアーキテクチャの1種である「Attentive FP」を用いて予測モデルを構築します。 2025.02.24 ケモインフォマティクス
ケモインフォマティクス 【第3回】Morgan Fingerprint×勾配ブースティング決定木によるモデル構築【PJ-LogD】 化合物の特徴として「Morgan Fingerprin」、機械学習アルゴリズムとして「勾配ブースティング決定木(XGBoost, LightGBM, CatBoost)」を利用したLogD予測モデルを構築します。また、3種のアルゴリズムをベースモデルとしてスタッキングモデルを構築します。 2025.02.20 ケモインフォマティクス