使用合适的Ferreira-Kiralj疏水性参数进行离子液体毒性的构效关系研究外文翻译资料

 2022-08-15 03:08

英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料


Phys.Chem.Chem.Phys.,2015,17,4516-4523

使用合适的Ferreira-Kiralj疏水性参数进行离子液体毒性的构效关系研究

Eduardo Borges de Melo

Theoretical, Medicinal and Environmental Chemistry Laboratory(LQMAT), Department of Pharmacy, Western Paranaacute; State University(UNIOESTE), 2069 Universitaacute;ria St., 85819110 Cascavel, Paranaacute;, Brazil.

摘要:

Ferreira-Kiralj疏水性参数Wc是疏水性碳原子的一个分数,它可以被视为一个结构描述符,因为它的计算只取决于化合物中极性和非极性碳的数量。疏水性对离子液体(ILs)的毒性很重要,离子液体本质上是盐。在本文中,使用包括(WcAdap)在内的极性碳原子类型的简单适应性变化来计算该特性的描述符,以探索其在离子液体的定量构效关系(QSAR)研究中使用的可能性。使用对白血病大鼠细胞系IPC-81具有毒性的离子液体数据库来测试所得模型。另外两个模型是使用Crippen logP和Mannhold logP描述符构建的,这两个描述符都可以在自由程序PaDEL中获得。WcAdap的使用带来了一个更好、更具指示性的模型。因此,WcAdap可能是QSAR研究中离子液体疏水性的一个合适的分子描述符。

关键词:

Ferreira-Kiralj疏水性参数Wc、离子液体毒性、WcAdap、QSAR

引言

离子液体是一类化学物质,最近已成为环境破坏性挥发性有机化合物(VOCs)的替代物。它们由大量完全由熔点低于水的离子(即盐)组成的化合物组成,因此在室温或接近室温下时是液体。有机阳离子和有机或无机阴离子的摩尔比为1:1的混合物称为真正的离子液体。有机阳离子通常是咪唑鎓、吡啶鎓、季铵或季鏻;阴离子可以是卤素、三氟甲磺酸根、三氟硼酸根或六氟磷酸根。然而,离子液体不是简单的混合物,因为它们没有保留阳离子和阴离子的“同一性”。此外,如果两个离子液体混合在一起了,那么在每一个离子液体中发现的离子缔合都消失了;也就是说,不可能根据离子的原始离子液体来区分离子,也不可能确定单个离子液体的独特相互作用。

这些被认为是传统溶剂的“绿色”替代品,因为它们具有突出的性能,特别是可忽略不计的蒸气压,这些不会造成空气污染。因此,离子液体是各种化学过程中的有吸引力的介质,例如有机合成、催化或生物催化、蛋白质纯化、二氧化碳捕获、液晶制备、药物合成和递送、电池和太阳能电池板、吸收制冷系统、膜制备、生物柴油生产以及硫化氢和硫醇清除。此外,它们的物理化学性质(例如粘度和密度)可以通过改变离子结构进行适当调整。因此,这类化合物在化学工业中引起了相当大的兴趣。

尽管离子液体由于其微小的蒸气压而可以降低空气污染的风险,但它们确实在水中具有显著的溶解性,这是离子液体流入水生生态系统的最可能途径。此外,它们的非挥发性,以及高化学和热稳定性(这也是工业利益),表明在环境中降解或持久性的潜在问题。Pham等人回顾了离子液体的几个毒物学方面和环境命运。这些化合物的环境行为将由它们的疏水性决定---疏水性离子液体会被沉积物削弱并成为环境中的持续性污染物,而亲水性离子液体很可能进入水生生态系统。

研究表明离子液体可能导致细菌、人类和哺乳动物细胞系的细胞和亚细胞改变。水生毒性试验表明,根据化学结构,这些化合物能够对动物和植物造成急性毒性。尽管离子液体正被认为是绿色溶剂,但它们的毒性可能比有机溶剂的毒性大许多数量级。正因为如此,推导定量构效关系(QSAR)模型的方法已经成功地应用于离子液体各种终点的预测,特别是理化性质。

然而,考虑到疏水性的重要性,重要的是要注意目前可获得的许多算法并没有参数化以计算电离分子、盐和由不连续结构组成的化学物质的log P值。因此,建立在这些条件上,也可以说是在其他类型的非参数化分子描述符上的模型是不可能真正被预测的。所以,本研究的目的是为了从一个有用的分子描述符中得出用于表征离子液体的疏水性,不依赖于分配系数和基团或原子贡献的实验值。结果是以一个关于离子液体毒性的QSAR研究的形式呈现的,该研究使用了来自PaDEL2.2程序的简单描述符,并结合了所提出的描述符,该描述符是一个Ferreira-Kiralj疏水性参数Wc的改编版本。该描述符可被用作一个另外离子液体QSAR研究的非对数型疏水描述符。

实验的数据集

最近,Zhao等人实行了QSAR研究,该研究使用了100种对白血病大鼠细胞系IPC-81具有毒性(以微摩尔计算的EC50)的高度多样性的离子液体的数据库。该数据库,可在UFT/Merck离子液体生物效应数据库(http://www.il-eco.uft.uni-bremen.de)中来找到,被选来检验这项研究的假设。在这项工作中,每个白细胞介素的简化分子输入线输入系统(SMILES)字符串也是从这个数据库中提取的,使用的是每个化合物的相应的化学文摘服务登记号。因此,毒性的范围从-0.24(高)到4.58(低)不等。该数据库被分成一个训练集(ILs 1-80)和一个测试集(ILs 81-90),如原始参考文献中所做的那样。图1显示了该数据库的一些代表。如原始参考(logEC50)中提供的所有化合物和因变量的SMILES字符串可在ESI表S1中获得。

适用的Ferreira-Kiralj疏水性参数(WcAdap)和其他分子描述符

考虑到近年来离子液体的重要性,了解离子液体在不同生物系统中行为的基本因素是十分必要的。其中一个因素是疏水性及其与毒性的关系。根据Ranke等人的观点,某些用于计算logP的理论方法肯定对某些离子液体组有效,但如果正在研究的离子液体结构所需的必要的碎片常数不可用,则可能会失败。

Ferreira-Kiralj参数Wc是一个和疏水性相关的简单的描述符。它本质上是构成性的,因为它仅基于构成一个分子的特定类型原子的数量。因此,Wc可以用以下公式计算:。其中,是疏水碳原子的数目,A是原子的总数,NH是氢原子的数目。根据Ferreira和Kiralj的最初建议,疏水碳原子属于除那些在C=O、C-O-和 组内的以外的所有碳原子。由于Wc是疏水碳原子的分数,所以该等式清楚地表明了结构中疏水碳的数量越多,Wc的值越高,如果分子没有疏水碳(例如H2C=O),则范围从0开始,如果所有碳均为疏水性(例如H3C-CH3),则范围到1结束。该建议最初是用于一组beta;-内酰胺类抗生素的,在一种情况下可以认为与本研究相似,其中亲脂性参数不一定包含革兰氏阴性菌AcrAB-ToIC泵的流出活性与亲脂性和两亲性药物的耐药性之间的关系相关的相同信息,因为这些抗生素中某些具有带电和离域的官能团。由于离子液体是盐,这种情况可以认为是类似的。使用例如Wc等参数的另一个优点是它可以应用于带有烷基链阴离子的离子液体。许多离子液体如1(图1)是由具有长链的阳离子和简单的阴离子(Cl-,Br-,BF4-,或者PF6-)形成的,许多研究以及其他性质仅基于阳离子结构。然而,许多离子液体也具有长链的阴离子结构(例如,20,图1),这影响离子液体的物理化学性质。在这种情况下,仅基于特定类型碳的计数的描述符可能允许评估离子液体的总体疏水性,包括那些有着简单和复杂阴离子的离子液体。然而,重要的是要注意,人们普遍认为阴离子对离子液体毒性的影响从属于阳离子效应。

图1. 在Zhao等人的数据库中的离子液体例子

因此,为了获得WcAdap,除了最初提出的那些以外,还考虑了在阳离子和阴离子结构中与带电原子连接的非疏水碳。表1显示了数据库中所有化合物的、Adap、A、NH、Wc和WcAdap值。这些值是通过简单地计算二维结构中的原子获得的,这些二维结构也可以在UFT/Merck离子液体生物效应数据库和分子式中获得。

有趣的是,使用训练集中化合物的因变量与Wc的皮尔逊相关系数r仅为0.01,表明最初提出的参数的使用并未编码与研究中ILS的疏水性和毒性活性之间的关系相关的信息。然而,使用WcAdap将计算的r增加到0.385。值得注意的是,即使Wc和WcAdap之间的r为0.835,也存在这种差异(见表1中的值)。

表1 、Adap、A、NH、Wc和WcAdap值

这项研究的其他描述符是使用PaDEL2.2(下http://padel.nus.edu.sg/ software/padel描述符)生成的,这是一个基于JAVA的免费开源软件,用于计算分子描述符和指纹。令人感兴趣的是,鉴于PaDEL的发展目标,尽管它是免费可用的,据我们所知,文献中也只有三篇关于源自这个程序的QSAR描述符的离子液体研究,它们都是最近发表的。SMILES字符串用于生成PaDEL中的1D和2D描述符,这有助于其他研究员推导描述符和复制数据。考虑到本研究被提议使用每个离子液体的完整结构来施行,所以选择了最简单的描述符,其主要是基于原子的贡献和原子的类型。由于数据集的化学性质,去除盐选项被禁用。一些最初选择的描述符是缺失或不完整的,可能因为算法未被参数化用于计算带有带电原子的分子或具有不连续结构的化学物质,例如离子液体。常量或接近常量的描述符也是手动提取的。最后,删除具有小于0.2的端点的r的描述符。因此,获得了25个描述符。这些描述符的列表可在ESI的表S2中找到。

在PaDEL中计算的描述符中有四个log P参数:Crippen logP、Mannhold logP、A logP、X logP。后一个描述符是使用中性有机分子参数化的基团贡献法计算的,因此未被选作本研究的描述符。根据文献,Crippen logP和A logP具有原子贡献,证明了它们在离子液体预测模型中的潜在用途,而Mannhold logP仅根据形成化合物的碳数和杂原子数获得。然而,从SMILES字符串中导出A logP会导致一些数据丢失,因此被从描述符列表中删除。因此,只有Crippen logP和Mannhold logP用于QSAR模型的推导,以便与使用WcAdap获得的结果进行比较。观察到三个参数与因变量r具有相似的数量级:WcAdap为-0.417,Crippen logP为-0.358,Mannhold logP为-0.498。

对于变量选择过程,建立了四个不同的矩阵,每个矩阵有26个描述符。每个矩阵之间的唯一区别是疏水性描述符,而其余的描述符是相同的。该列表可在ESI表S3中找到。

QSAR研究

QSAR研究是以用QSAR建模的形式呈现的,这是一个由理论和应用化学计量学实验室研究小组开发的基于JAVA的免费软件(下载:http://lqta.iqm.unicamp.br)。变量的最终缩减在这个程序中进行。描述符矩阵采用变量选择方法,称为有序预测选择(OPS),这是一种用于建立QSAR模型的迭代算法。该方法使用偏最小二乘法(PLS),这是一种通过将数据转换成相互正交的潜在变量(LVs)来减小数据大小的回归方法,为通过信息向量(相关向量、回归向量及其乘积)分类的最重要的描述符放在第一列中的方法来重新排列矩阵的列建立模型。在本研究中,同时使用了三种载体。模型应该按照统计参数的降序分类。在本研究中,初始步骤是利用交叉验证的均方根误差(RMSECV)来选择可以导致较小误差的描述符,随后的步骤是根据留一法(LOO)交叉验证的决定系数(QLOO2)来最大化预测。由于每个选定描述符的数值范围可能非常不同,所以有必要执行称为自动缩放的预处理方案。通过检查移除一些描述符的可能性,使用Pirouette4(www.infometrix.com)对获得的模型进行精炼,以获得最佳化的、更简单的、统计上有意义的解释模型。

在QSAR中,有必要应用验证技术来检查所获得模型的预测能力的统计质量。因此,有可能提供模型能力的测量,以对在建模步骤中未使用的化合物进行研究中的因变量的可靠预测。最常用的方法包括两个步骤:内部和外部验证。

在内部验证中,模型的解释方差用决定系数(R2gt;0.6)评估,模型的显著性用95%置信区间(alpha;=0.05)的F比检验评估。内部预测通过QLOO2(gt;0.5)和RmSquare指标(average rm2(pred)-scaledgt;0

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[416268],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。