用于基准研究的大型化学多样性logP测量数据集外文翻译资料

 2022-08-21 11:08

英语原文共 9 页,剩余内容已隐藏,支付完成后下载完整资料


用于基准研究的大型化学多样性logP测量数据集

摘要

亲脂性是药物开发中一个必不可少的参数,因为它既影响ADME的性质,还影响着候选药物的靶向亲和力。在药物发现的早期阶段,对于预测logP的精密工具是十分需要的。许多计算方法是为了帮助制药科学家进行药物研究而发展起来的。然而,几乎所有的计算方法在与新的化学实体相关的化学空间的几个区域中都存在精度不足和性能变化的问题。现有软件包的低预测能力可以通过与所用训练集相关联的实验log P值的有限可用性和/或可变质量来解释,该实验logP值源于各种协议,并且很难覆盖化学空间。在这项研究中,产生了450万种不同测试化合物中1000种的数据集;用UHPLC对759种可购买化合物(46%非电离、30%碱性、17%酸性、0.5%两性离子和6.5%两性电解质)的logP值进行了实验测定,必要时进行紫外检测或质谱检测。最后,收集了707个从0.30到7.50的经过验证的logP值,可用于对现有的和开发的预测化合物辛醇/水分配系数的新方法进行基准测试。

1.引言

亲脂性(由分配系数D的分配系数进行量化)是药物研究项目中药物科学家每天监测的一个重要参数(Arnott和Planey,2012)。低分子量(MW)和低极性表面积是促进化学物质被动扩散肠道吸收的主要驱动力。亲脂性还通过外排转运蛋白(如P-gp)、药物处置、通过细胞色素P450酶超家族的生物转化和消除影响肠道吸收。因此,亲脂性在控制药物作用的动力学和动力学方面起着关键作用(van de Waterbeemd和Gifford,2003;Cronin,2006;van de Waterbeemd和Testa,2007;Tetko,2007;Martel等人,2009)。事实上,众所周知,新化学物质的亲脂性测定在药物化学以及化妆品、环境和食品化学等领域都具有重要意义。

亲脂性的常用定量描述,正辛醇/水分配系数P,优先以对数形式使用,logP,被定义为平衡条件下两室体系有机相和水相中中性化合物浓度的比值。对于可电离化合物,logD(分配系数)应首选,因为它代表在给定pH下溶液中所有电形式的分配。logD当然可以测量,但也可以从所考虑化合物的logP和pkao中推导出来。与需要这些数据的大量化合物相比,现有实验logP数据的范围可以忽略不计。因此,从分子结构推导logP的可靠方法是非常理想的。目前,已有30多种logP计算方法,它们通常表现出相当大的计算误差,表现出相当差的性能(Mannhold等人,2009)。一些原因解释了现有软件包预测能力差的原因;只有大约30000种化合物的实验logP数据可用,一些被测logP的实验条件不充分,而且迄今为止被测化合物未充分覆盖化学空间。因此,在这一领域取得进展的先决条件是在同一个实验室中,在相同的实验条件下,生成一个相当大的、化学上不均匀的数据集和logP测量。

在本研究中,我们生成了1000种测试化合物的不同数据集;其中759种可以购买,并通过基于超高压液相色谱的最新色谱方法进行logP测量(Henchoz等人,2008、2009;Martel等人,2008)。

2.材料和方法

2.1化学制品

数据集生成的起点是公共可用的锌收集(Irwin和Shoichet,2005年),当时约有来自19家供应商的450万种化合物。并非所有这450万种化合物都是药物或类药物,因为它们已被收集并用于不同目的,从虚拟筛选到合成,甚至是基于片段的药物发现项目。这些化合物以mol2格式从锌网站(http://ZINC.docking.org;2007年2月访问)下载。锌档案馆的作者们确实将各自供应商的单个数据集分成了10万个化合物组。

在虚拟筛选法的基础上,根据代表分子的多样性选择,并在消除永久带电化合物(如季氮化合物)和分子量低于150的化合物的基础上,从16家供应商(见支持信息中的表S1)购买了最终的759种化合物,包括Aldrich(Sigma–Aldrich Chemie GmbH,瑞士布克斯)、Ambinter(法国奥尔良)、Asinex(荷兰DA Rijswijk)、Bionet(Camelford、康沃尔、英国)、Chembridge(圣地亚哥、加利福尼亚、美国)、ChemDiv(圣地亚哥、加利福尼亚、美国)、Chemical Block(俄罗斯莫斯科)、Enamine(拉脱维亚里加)、IBScreen(Edchem、Hove、英国)、Keyorganic(Camelford,康沃尔,英国),生命化学品(布伦瑞克,德国),梅布里奇(Chemie Brunschwig AG,巴塞尔,瑞士),Pharmeks(莫斯科,俄罗斯),Specs(德尔夫特,荷兰)和Vitas-M(莫斯科,俄罗斯)。供应商报告化合物的纯度(如有)在90%(如ID 459)到100%(如ID 925)之间。所有化合物均未经进一步纯化而使用。

2.2计算工作

计算工作在Linux工作站上进行,软件包VolSurf v1.0.2和MoKa v1.0用于数据库化合物的计算表征,GOLPE用于多元统计。

VolSurf (Crivori等人,2000;Crucani等人,2000)是一个将三维能量图转换为分子描述符的程序。在VolSurf 程序中,首先应用网格力场(Goodford,1985)通过水探针(OH2)、疏水探针(DRY)来表征目标分子周围的潜在极性和疏水性分子相互作用场(mif),氢键(HB)受体羰基氧探针(O)和HB供体酰胺氮探针(N1)。然后,根据这些三维地图计算出分子描述符。VolSurf 包含128个分子描述符,涵盖生物学相关特性。除了形状、表面、体积、分子量(MW)、极性比表面积(PSA)、氢键、亲脂性和溶解度等常见的描述外,还包括VolSurf 特定的描述,它们指的是MIF在特定能量值下的体积和相对位置(Crivori等人,2000)。VolSurf 描述符适合用主成分分析(PCA)和偏最小二乘(PLS)等多元统计工具进行处理。

MoKa(Milletti等人,2007)是基于网格MIF的软件,它将可编程中心视为碎片。计算电子中心和周围原子的mif,MoKa建立指纹,用于PLS模型预测pKa。

GOLPE(Baroni等人,1993)是为QSAR、3DQSAR、化学计量学和化学信息学目的开发的软件。在这项研究中,它被用来从每个100000个分子的大集合中选择具有代表性的候选数。

2.3超高效液相色谱法

根据Phoebus软件v1.0(Analis,Namur,begium),在20 mM的固定离子强度下制备不同pH值的缓冲液,以分析所有中性形式的化合物(缓冲液成分见表1)。缓冲溶液通过0.22 lm HA微孔过滤器(微孔,贝德福德,马萨诸塞州,美国)过滤。储备溶液中的化合物浓度在MeOH或ACN中的变化范围为100至2000 lg/ml,这取决于它们的溶解度(目测);最终注入的浓度在100至300 lg/ml之间,这取决于被测化合物的紫外吸收率和溶解度。

通过液相色谱法(LC)测定亲脂性(Martel等人,2008;Gocan等人。2006年;Nonase and Kaliszan 2006年;Nicoli等人。2010年;Zizzari等人。2012):根据溶质在极性流动相和非极性固定相(反相液相色谱)之间的分配,色谱数据可以表示为保留因子(logk,见下文)。根据耦合固定相和流动相,保留因子可通过以下方式与对数值相关:

实际上,必须使用已知logPoct的参考化合物的保留因子来确定每对固定相/流动相的系数a和b。该校正方程可用于新化合物的测定。

表1 用于实验logP测定的缓冲液成分

酸碱值

缓冲液成分

2

甲酸2 M:499.84毫升

氨1 M:8.47毫升

Ad 1000 ml毫克水

5

醋酸1 M:29.89毫升

氨1 M:19.99毫升或氢氧化钠1 M:19.99毫升

Ad 1000毫升毫克水

6.5

碳酸氢铵1 M:20.03 ml

乙酸1 M:7.72 ml

Ad 1000 ml毫克水

7.0

碳酸氢铵1 M:20.09毫升

醋酸1 M:3.18毫升

Ad 1000毫升毫克水

7.3

Tris 1 M:22.90毫升

醋酸1 M:20.05毫升

Ad 1000毫升毫克水

8

Tris 1 M:34.56毫升

醋酸1 M:20.01毫升

Ad 1000毫升毫克水

10-10.5

氨水1 M:328.38毫升

醋酸1 M:19.63毫升

Ad 1000毫升毫克水,用氨水或醋酸调节pH值

在Acquity UPLC系统(美国米尔福德沃特斯)上进行测量,该系统包括一个二元泵送系统、一个注射回路容积为2升的自动取样器、一个紫外可见二极管阵列可编程检测器、一个带烤箱的柱管理器和一个柱前加热器,用于UHPLC测量。系统由Empower软件v2.0控制,检测范围为200nm至700nm(6nm分辨率)。在适当的紫外波长下提取每种化合物的色谱图。

用梯度法和等度法两种模式测定对数对数正态分布。所有化合物首先用梯度模式测量。当梯度模式分析比较实验logP和预期logP后得到不可靠的结果时(见结果和讨论部分),用等比例模式分析化合物。

2.3.1渐变模式

对于这些色谱测量,Acquity BEH Shield RP18柱(30乘以直径2.1mm,直径1.7lm的水(Milford,MA)为固定相,流动相由甲醇和水缓冲液组成。在12.8和4.27分钟内,采用两种通用梯度从2%到98%的甲醇。logkw值直接从HPLC建模软件(Osiris v4.2.0.0,Datalys,SaintMartin DHeres,France)获得。

根据52种已知logP为1-8(图1A)的化合物的logk测量,先前确定了该系统的校准曲线(Acquity BEH-Shield RP18在流动相为甲醇的梯度模式下)。因此,公式(2)用于本研究中测试化合物的对数对数分析(Guillot等人,2009年):

2.3.2等比例模式

在六种不同的有机改性剂-水流动相比例下测定了各化合物的保留时间(tr)。对于每个流动相组成,根据公式计算保留因子:

在上式中,trand t0分别是溶质和未保留化合物(尿嘧啶)的保留时间,tdela是注射延迟,vext是额外柱体积,F是流动相的流速。

外推保留因子(logkw)通过线性外推到100%水,从绘制为流动相组成(u)函数的六个等比例logk值中获得:

其中logk和logkware分别是等比例和外推的保留因子,u是有机改性剂的组成,S是给定溶质和固定实验条件下的常数。

除了在pH 10下进行logP测量外,用Hypersil测量保留时间trade; 金标枪HTS(10乘以内径2.1 mm,长度1.9 lm,英国热科学公司Runcorn)。根据52种已知logP为1至8(图1B)的化合物的logk测量结果,使用甲醇作为流动相,先前确定了该系统的校准曲线。因此,本研究中测试化合物的logP测定采用以下方程式(Guillot等人,2009年):

对于必须在pH值10下测量的化合物,获取BEH Shield RP18(30乘以使用2.1 mm内径,1.7 lm,沃特斯,密尔福德,马萨诸塞州)。根据52种已知logP在1到8之间的化合物的logk测量结果(图1C),先前使用甲醇作为流动相确定了该系统的校准曲线。因此,本研究中测试化合物的logP测定采用以下方程式(Guillot等人,2009年):

2.4 UHPLC-MS检测

一些数据集化合物要么没有被紫外检测到,要么显示出一个以上的峰;这些化合物通过质谱检测重新分析。所用缓冲液是用于UHPLC-UV分析的缓冲液。注入溶液的浓度从0.01 mg/ml到0.3 mg/ml不等。UHPLC-UV-MS测量在Acquity UPLC系统(Waters,Milford,USA)上进行,该系统包括一个二元泵送系统、一个注入回路容积为5 lL的自动采样器、一个UV-VIS双通道可编程检测器,一个带烤箱和预柱加热器的柱管理器,一个三重四极TQD探测器(沃特斯,米尔福德,美国)。系统由Masslynx软件v4.1(Waters,Milford,USA)控制,紫外线检测在206nm(20pt/s)处进行。采用与UHPLC-UV分析相同的程序,包括在12.8和4.27分钟内从2%到98%甲醇的两个通用梯度,并使用相同的柱类型。紫外检测(1:6.7)后,用电喷雾法进行正、负模式MS检测。采用65~1250amu的常规扫描方法。LogP值如上文第2.3节“梯度模式”中所述确定。

3.结果与讨论

3.1多样性导向的数据集生成

在最初的部分中,大约450万种锌化合物

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[409790],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。