Dataiku分子特性预测解决方案允许计算化学家查询之前研究过的已知针对特定蛋白质靶标的生物活性的小分子(来自公共化学数据库)。这些研究过的分子用于根据其化合物结构训练和建立生物活性预测模型。然后,该模型根据新化合物的预测生物活性对其进行评分。
这种计算机发现过程可以提高药 开曼群岛 Whatsapp 数据 物开发周期的成功率和效率,方法是优先考虑先导开发候选实验,以帮助将稳定的化合物快速投入临床前和临床测试。该解决方案可作为模板,利用分子结构的关键特征将预测分析扩展到进一步的分子特性(如 ADMET),以加速您管道中新化合物的发现和开发。
主要特点:
通过 API轻松查询公共化学数据库,包括ChEMBL和PubChem。
根据RDKit 的SMILES 化学结构和 ChemBERTA 等转换语言模型创建分子描述符和指纹特征。
探索候选药物先前研究过的和新的分子结构的化学空间。
使用小分子描述符和结构特征训练 ML 模型来预测给定蛋白质靶标的生物活性。
允许化学家使用动态仪表板在计算机上筛选主要开发候选物。