与现有方法不同,PickR V1.0使用分子的3D静电和形状性质对苗头化合物发现(Hit Finding)与苗头至先导(Hit-to-lead)发现库中的R基团进行聚类和选择。PickR是一款易于使用的命令行应用程序,与大多数常见的排队系统(如Grid Engine、PBS或LSF)兼容,并在分子之间生成符合药物化学家和计算化学家期望的逻辑关联。
Figure 1. PickR对5500个硼酸聚类后最大的10个Cluster。正电势:红; 负电势:蓝色。
PickR的方法
PickR算法利用了大多数化合物库构建应用的组合化学概念,这样可以将组成化合物库的分子选择简化为合适范围的构建块(Building block)或R-基团的选择。为了评估R-基团的多样性,我们将所有的试剂排列在共同的键上,通常是在组合反应中形成的键,并计算每对构象的静电和形状相似性。由于沿着键的排列涉及旋转自由度,因此我们对每个试剂对的多个相互排列进行采样,以确保获得最佳的空间和静电重叠。
Figure 2. 沿硼-碳键的叠合和旋转以生成两种硼酸的静电图。
与2D相似性比较
与传统2D指纹图谱方法相比,PickR可以发现具有不同相似性的试剂。静电和形状不仅生成了传统2D方法难以描述的意料之中的关系与意料之外的分子间关系。高度官能团化的小环是现代化合物库设计中常用的试剂。3D的差异特别对这些试剂的差异特别敏锐。然而,比起3D相似性方法来,2D相似性对立体化学的选择性不那么敏感,因此我们推荐2D与3D相似性联合使用是最实用的方法。
Figure 3. 使用PickR和RDKit(MACCS)指纹对200个随机选择的市售硼酸分子比较了2D和3D距离打分。
计算
使用3D的静电和形状来评估分子构象间的相似性比使用2D指纹图谱相似性对计算能力要求更高。 PickR设计精良,支持最流行的SGE、PBS与LSF等排队引擎在Linux集群实现全部的计算流程。一个简单的命令行实现集群计算,在合理的时间内处理几千个试剂。
5500硼酸的聚类结果
对大量市售硼酸的聚类实验结果可以看出PickR的性能。使用原子计数和可旋转键限制(原子数<18,可旋转键=3个)从eMolecules数据库下载试剂。PickR采用默认参数,命令行如下:
pickr -s '[B:1][#6:2]’ \ #bond to break specified as SMARTS -Q sge \ #use SGE queuing -j 200 \ #use a max 200 jobs -v \ #verbose output boronics.smi #smiles file (sdf also)
使用150核心大约几个小时完成计算,化合物被分成550类。
Figure 4. 头两个类很好的将3-位取代的4-吡啶基与3-取代苯基分离开清楚地证明了该方法的实用性
结论
PickR是一个很好用的用于化合物库设计的试剂聚类方法,您可以用它选择静电不同的单体以便生成高质量的化合物库和获得更好的知识产权。该方法考虑了构象效应和静电效应,使试剂库的设计更加多样化。尽管在计算上比传统方法更耗时,但它可以使用内置的作业分布选项轻松地应用于数千个试剂的数据集。