1 概 述
Thomas Engel1,Johann Gasteiger2
1Ludwig-Maximilians-University Munich,Department of Chemistry,Butenandtstr. 5-13,81377 Munich,Germany
2Computer-Chemie-Centrum,Universitat Erlangen-Nürnberg,Nagelsbachstr. 25,91052 Erlangen,Germany
陈 静 周晖皓 译 徐 峻 审校
1.1 写 作 动 机
2003年,德国Wiley-VCH Verkag公司出版了由J. Gasteiger和T. Engel博士主编的《化学信息学—教科书》(ISBN 13:978-3-527-30681-7)。该书广受读者欢迎,促进了化学信息学领域的发展。近年来,化学信息学取得了巨大进展,该书的部分内容亟待更新。编委在更新该书的过程中,意识到已经无法在一本书中囊括本领域的全部知识,因而将该书改编为两卷:
上卷:《化学信息学—基本概念和方法》[1]。
下卷:《应用化学信息学—成就与未来机遇》。
上卷介绍了化学信息学的基本理论和方法,也称为“方法卷”。
下卷是2003版“应用”一章的更新和拓展。化学信息学的应用可以独立成卷,这本身就显示了化学信息学发展之迅速,它已经成为一门独立的学科,在化学各领域都有广泛的应用。
这两卷的各个章节是由不同作者撰写的。为了保持本书内容和形式的统一,我们努力让每一章都符合全书的整体主旨和风格,并在各章之间增加了相互引用。希望这有助于读者认识到化学信息学的很多方法是相互依赖的,以及了解如何综合这些方法共同解决特定的化学问题。
这两卷都可用于化学信息学的课堂教学和学生自学。特别是,第一卷解释了化学信息学的基本方法并附有练习题,非常适合作教科书。希望本次修订的这两卷能够有助于化学、生物学、信息学和医学等领域的广大师生和科学研究人员全面了解化学信息学的理论和应用。
1.2 化学信息学起源与发展
药物发现仍然是化学信息学*重要的应用领域(参见第6章),我们也高兴地看到:化学信息学在药学之外的很多领域也获得了应用,相信随着时间的推移,化学信息学一定会得到更多的应用。
因此,需要就本书中使用的某些专业术语做些说明。地理(或文化)上的差异使化学信息学有两个英文拼法:chemoinformatics和cheminformatics,前者主要在美国使用,后者在欧洲和世界其他地区流行。
化学计量学(chemometrics)起源于20世纪70年代初,主要与分析化学相关(详见第9章)。随着时间的推移,化学计量学和化学信息学相互渗透,采用许多相同的研究方法。化学信息学较宽泛,化学计量学中的数据分析方法也可以被视为化学信息学的一部分。
分子信息学(molecular informatics) 含义相对狭窄,不能涵盖化学信息学涉及的全部研究对象。化学领域的许多应用涉及的化合物和材料不限于已知分子结构的材料。例如,第12章介绍的化学信息学中的计算方法在材料科学中的应用,第13章阐述其在过程控制中的应用,都是很好的例子。
随着科学技术的发展,化学信息学与其他学科互相渗透。化学信息学和生物信息学(bioinformatics)相互融合。药物、化妆品开发和生命系统中的许多问题需要同时使用两个学科的知识和方法,如本书讨论的生化途径(第4章4.3节)、药物、靶标和疾病研究(第6章6.2节)和化妆品开发(第11章)。
很多化学领域的问题需要综合使用化学信息学和计算化学(computational chemistry)方法予以解决,这两个学科的界限日益模糊。例如,结构-波谱相关性和计算机辅助结构解析(第5章)、农业研究中的计算方法(第7章)、计算方法在美容产品研发中的应用(第11章)等都涉及化学信息学和计算化学的综合应用。计算化学的基本概念在《化学信息学—基本概念和方法》[1]的第8 章有详细介绍。
2013年诺贝尔化学奖授予了Martin Karplus、Michael Levitt和Arieh Warshel,瑞典皇家科学院的颁奖辞指出:“今天,计算机对于化学家来说如试管一样重要。”化学信息学和计算化学在化学界已得到更广泛的认可。
1.3 化学信息学基础与各种应用
本书向读者介绍化学信息学在化学和其他领域中的应用。但是,化学信息学在各领域的应用仍然在快速发展,本书算是抛砖引玉。
1.3.1 数据库
化学信息学*重要的成就之一是建立各种化学数据库。化学信息技术的发展,使科学家可以在各种数据库中用国际化的图形语言(化学结构和反应方程式)储存和检索化学信息。现在,化学数据库属于常规技术工具,化学家们不要忘记,这些常规技术是1960~1990年期间化学家、数学家及计算机科学家合作努力的结果。《化学信息学—基本概念和方法》第6章描述了建立化学信息数据库的方法[1]。本书将用多个章节介绍化学数据库的各种应用。
近几十年来,化学信息一直以指数式增长。如果没有化学数据库,根本无法管理和利用化学信息。可以说,没有化学数据库,现在的化学家将无法进行化学研究。
1.3.2 化学家的基本问题
化学信息学帮助化学家解决问题的一条思路如图1.1所示。
图1.1 化学家用化学信息学方法解决问题的基本思路
1.3.2.1 性质的预测
1996年,George S. Hammond在Norris奖获奖感言中说:“合成的*终目标不是产生新的化合物,而是产生新的性质。”
因此,化学家的首要任务是寻找所需的性质(药物、农药、油漆,或者抗衰老)与特定化学(子)结构的相关性。这就是结构-性质相关(SPR)或结构-活性相关(SAR)的问题。对这些关系的定量研究即定量结构-性质相关(QSPR)或定量结构-活性相关(QSAR)。
第2章将介绍QSPR或QSAR的方法,建立基于化学结构的性质预测模型。尽管《化学信息学—基本概念和方法》[1]的第9~12章详细介绍了上述方法,鉴于该方法在化学多个领域和各类性质预测中的重要性,在本书的各章之前仍然扼要阐述QSPR/QSAR方法原理。
预测物理、化学或生物性质的很多QSPR和QSAR模型已经建立,本书第3 章介绍这些预测物理和化学性质的方法。第6章6.9节介绍与药物发现相关的吸收、分布、代谢和排泄(ADME)等性质的预测。第7章介绍计算方法在农业研究中的应用。化学物质对生物物种和环境的影响是社会热点问题,第8章介绍对这些问题的研究。第9章介绍化学计量学在分析化学中的应用。
第10章涉及食品科学中的化学信息学;第11章介绍计算方法在美容产品研发中的应用;第12章是关于化学信息学在材料科学中的应用。
1.3.2.2 化学反应的预测和合成设计
当预测到某种化学结构可能具有所需特性时,化学家需要设计该化合物的合成路线。本书第4章4.2节“反应预测与合成设计”介绍计算机辅助合成设计(CASD)的工作,它是化学信息学的源头之一。第4章4.3节“生化途径的探索”讨论那些维持生命繁衍生息的化学反应,也介绍化学信息学和生物信息学是如何协同工作,发现疾病的关键机制。
1.3.2.3 结构解析
影响化学反应结果的因素很多,而我们对化学反应的认识仍不充分,因此需要通过实验方法验证化学反应是否产生了预期的产物。验证过程通常是测量产物的各类波谱数据来推断产物结构,其中必须分析波谱数据与化学结构之间的相互关系。在20世纪60年代末兴起的计算机辅助结构解析(CASE)方法是化学信息学的另一个源头。事实上,斯坦福大学的DENERAL项目被广泛认为是人工智能在解决化学问题上的首次应用。本书第5章介绍这方面的*新进展。
1.3.3 药物发现
药物发现无疑是化学信息学方法*具有前景的应用领域。所有的大型制药公司都有化学信息学部门,是化学信息学专家的*大雇主。近年来开发的药物也都在一定程度上受益于化学信息学方法的运用。药物发现是本书中篇幅*多的内容(参见第6章)。6.1节介绍化学信息学在药物发现中应用的整体情况,也介绍一些后续专题中未涉及化学信息学方法和应用的部分。6.2~6.13 节介绍不同的专题:6.2节介绍生物信息学方法在药物靶标发现和疾病机理研究中的应用;6.3节介绍化学信息学在天然产物药物化学及其他领域研究中的应用;6.4 节介绍化学信息学在中药研究中的应用;6.5节介绍美国国立卫生研究院开发的PubChem数据库。
6.6~6.8节介绍药物分子与靶标蛋白相互作用的研究方法:6.6节介绍药效团的构建和分析;6.7节介绍活性位点的预测、分析和比较;6.8节介绍基于结构的药物虚拟筛选方法。
生物利用度低、药代动力学效应差和代谢稳定性差是许多候选药物在临床前期研究阶段失败的主要原因。研究者已经开发了多种用于预测吸收、分布、代谢和排泄(ADME)性质的模型,以便提前预测化合物的这些理化性质。第6 章6.9节和6.10节分别介绍了ADME性质的预测和药物外源性代谢的预测。6.11节介绍美国国家癌症研究所计算机辅助药物设计(CADD)研究组收集和开发的一系列用于辅助药物设计的化学信息学方法。许多不同的信息资源,如出版物和各种数据库,都包含了有助于药物发现的信息,6.12节介绍了关于探索新的数据来源的内容。6.13节是第6章的*后一节,介绍了资深科学家对药物设计的现状总结和未来展望。
1.3.4 化学信息学在其他领域的应用
正如我们在本书2003版的“展望”一章中所预期的,许多新的领域也得益于化学信息学的发展与应用。本书的第7~13章介绍这些新的研究方向。
第7章介绍农业化学正在使用与药物发现相似的方法来开发新的植保药物。这些方法包括基于配体的方法和基于结构的方法。
化学品对人类健康的危害和对环境的影响已日益成为社会关注的热点。同时,社会对于减少甚至废除使用实验动物进行化合物毒性测试的呼声也日渐高涨。为此,利用计算机模型预测化合物的毒性、环境危害和生物富集的研究领域吸引了科学家的兴趣。本书第8章“监管科学与化学信息学”将对这部分内容进行介绍。
“化学计量学”一词的使用具有较长的历史。通过统计或其他数学方法对分析化学的数据进行分析,均被视为“化学计量学”的范畴。本书第9章将介绍化学计量学在分析化学中的应用和一些代表性的实例(也可以参见《化学信息学—基本概念和方法》第11章的内容)。
本书第10章介绍食品科学中的化学信息学应用。这是近些年化学信息学方法涉及的新领域。
迫于社会压力,化妆品行业正在减少甚至淘汰使用实验动物,转而尝试使用化学信息学和其他计算化学方法评价化学品的安全性,提高美容产品开发的效率。本书第11章“计算方法在美容产品研发中的应用”介绍了相关内容。
材料科学是化学信息学应用*具潜力的新领域之一。由于许多材料无法提供分子结构,因此需要开发在计算机中正确表示研究对象的新方法,它直接影响着相关研究是否能成功。相关内容将在本书第12章中予以介绍。
化学工业的许多过程都受到多种因素的影响。这些影响是非线性的,许多影响因素甚至没有明确的数学关系。在这种情况下,化学信息学方法可通过传感器测定各种控制因素并利用这些数据进行过程建模,从而有助于过程控制。本书第13章“过程控制和软传感器”介绍了一些应用实例。
我们希望上述这些章节能够展现出化学信息学在化学研究和其他领域发展中的重要作用。但是,化学信息学还有很多问题没有得到解决,它将与化学和生命科学同步发展,促进对化学、生物及
展开