服务介绍:
本数据用户可以在数据库中检索指定化合物的谱图,也可以根据谱图/谱峰数据检索相似的谱图,以协助进行谱图鉴定。
用户可以通过IE浏览器显示谱图,特别提示:用户浏览器请勿禁用java applet功能,否则可能导致谱图不能正常显示。 名词与概念:
谱峰匹配 2张谱图上的2个特征峰进行比较,谱峰的数据差异(包括谱峰位置、谱峰透过率、半峰宽、峰差)均在可容许误差范围之内,则系统认为这2个谱图上的2个谱峰属于匹配关系。该误差可由用户指定。
如图3.2.4.1所示,谱峰a与谱峰1匹配,而谱峰b和谱峰2不匹配。
T(%)6040
a20
bT(%)6040
120
212001000
800
600
(cm-1)
12001000800600(cm-1)
图3.2.4.1 谱峰匹配示意图
相似谱图 如2张谱图的特征峰都逐一匹配,或有未能匹配的谱峰也在用户指定的容许范围之内,则系统认为两张谱图彼此相似。未能匹配的谱峰越少,匹配谱峰的数据差异越小,则谱图相似度越高。
图3.2.4.2所示的2张谱图,谱峰a与1匹配,谱峰b与2匹配,则我们认为这2张谱图彼此相似。
T(%)6040
a20
bT(%)6040
120
212001000800600(cm-1)
12001000800600
(cm-1)
图3.2.4.2 谱图相似示意图
谱图分类 指谱图/化合物用途的分类,参见数据库介绍部分。同一个化合物可能具有多个红外谱图,其谱图差异也可能很大。例如乙醇的气相谱和标准谱就很不相似,谱图可见图3.2.4.32和图3.2.4.33。
3.2.4.1 相似谱图检索——输入谱峰检索
基本原理 用户输入某个谱图的特征谱峰数据,并指定命中谱图与输入的提问谱图的最低相似度、容许误差范围等参数。系统根据这些参数,先进行初步筛选,得到候选红外谱图,然后将用户的提问谱数据与数据库中的所有候选红外谱图的特征谱峰数据进行逐一比较,找到与用户提问谱图相似的谱图,并将结果按照相似度递减顺序排列供用户对照。
第一步:谱峰数据输入 输入的用户提问谱图的每个特征谱峰数据都包括4项,谱峰位置、谱峰透过率、峰宽、峰差。
系统总是假定用户提问谱图采用透过率T来表示。
峰宽是指谱峰的半峰宽。峰差是指谱峰的深度,本系统使用峰的顶点投射到两翼最高点连线上的距离作为峰差,如图3.2.4.3所示。峰差特别小的谱峰,在检索过程中将被自动过滤。
43
图3.2.4.3 谱峰的峰差与峰宽的示意图
用户可以手动将提问谱图上的特征谱峰的数据,输入到表格中。请注意,每个谱峰都要有4项数据,否则被视为不完整的输入。如图3.2.4.4所示。如果谱峰超过10个,可点击图3.2.4.4中的左下角的按钮,打开更多的谱峰输入界面。如图3.2.4.5所示。输入完成,点开始检索,进入第二步。
图3.2.4.5 更多谱峰数据输入示意图
第二步:检索参数选择 谱峰数据输入完成后,点击开始检索,即进入检索参数选择的页面。如图3.2.4.4和图3.2.4.5所示。
页面的第一部分是输入谱峰的列表,供用户校对数据。每个谱峰后面有“不可丢失”选项,勾选此选项,
44
峰差(%)半峰宽(cm-1)
图3.2.4.4 谱峰数据输入示意图
则要求检索命中的谱图中必须含有此特征峰,不包含这类特征峰的谱图,即使其他谱峰都能匹配,系统也不会认为它是合格的候选谱图。如果用户不设定任何一个谱峰为不可丢失,则系统认为任何单个峰没有匹配时,都不影响候选谱图的筛选。
图3.2.4.4 检索参数选择(1)
图3.2.4.5 检索参数选择(2)
1. 谱图匹配模式,是指谱图筛选过程中匹配候选谱图的模式,单选,有3种模式可以选择:强峰匹配、官能团匹配、全峰匹配。
由于红外谱图的曲线上存在许多大小不同的谱峰,部分非常微弱的峰通常不用来作为鉴定的根据,一般只观察比较强的特征谱峰,因此强峰匹配在谱图筛选过程中只考察谱图的强峰,只要谱图的强峰索引与输入的提问谱图的强峰索引匹配,则将此谱图作为候选谱图。
官能团匹配是将输入谱峰的数据按照红外解析的规律,判断该谱图对应的官能团,生成官能团索引,系统根据官能团索引筛选出候选谱图。
全峰匹配跟强峰匹配的区别在于全峰匹配筛选过程将考察所有谱峰。
一般情况下,系统默认选择强峰匹配模式,能够快速检索出结果,如选择全峰匹配模式则需要较长时间。官能团匹配模式是与强峰匹配模式同时进行的,对谱峰数据要求比较苛刻,检索命中率不如强峰匹配模式。
2. 谱峰匹配参数 谱图筛选过程中,判断谱峰是否匹配的参数,可多选。系统默认根据峰值(谱峰位置+透过率)来判断,如2个谱峰的谱峰位置的差距、透过率的差距都在容许误差之内,则认为这2个谱峰匹配。
如还选择了其他谱峰匹配参数,例如峰宽,那么判断谱峰匹配的标准还要加上峰宽的差距在容许误差之内。 所有数据间都是AND关系,即任一个数据的差距超过容许误差,就认为这2个谱峰不能匹配。
3. 谱峰检索设置 谱图检索结果的重要指标就是谱图相似度,任何2个谱图的相似度都在0%到100%之
45
间。用户指定允许的最低谱图相似度,只有与提问谱图相似度等于或高于用户指定相似度的谱图才是命中的目标谱图。
考虑到试验误差等因素,有些用户能够接受检索命中的目标谱图的谱峰多于或少于比提问谱图的谱峰。这种情况可以用命中谱图的特征峰多于提问谱图(谱峰冗余率),或者少于提问谱图(谱峰丢失率)来表示。显然,谱峰丢失率和谱峰冗余率越高,初筛得到候选谱图越多,检索结果的噪音也越大。但是这2个参数太小,也可能会丢失一些有用的结果。系统缺省值为30%,用户可以根据自己的情况适当调整。
4. 谱图权重 谱图权重就是候选谱图与提问谱图比较的时候,强峰、中峰、弱峰和指纹区的谱峰对谱图相似度的权重影响。权重越大,越能体现出这部分谱峰对谱图相似度的影响。显然,设置不同的权重值,最后计算得到谱图相似度的数值也会不同。
tips: 如果一个谱图上的特征谱峰大多是强峰,可以适当放大强峰权重,例如设置为1.5,或者1.75,可以凸显出某些谱图特征。
5. 谱峰分级 前面已经说到强峰和中峰、弱峰对谱图相似度的影响是不相同的。每个用户对于强峰的概念也不相同,可在此设置强峰下限与中峰下限。透过率<=强峰下限的谱峰就是强峰,强峰<透过率<=中峰下限的谱峰就是中峰,透过率>中峰下限的就是弱峰。
6. 容许误差范围 容许误差范围是用户对于谱峰匹配设置的重要参数。只有2个谱峰的各项数据差距在容许误差范围之内,才被认为是匹配的。
检索参数选择配置完成后,点开始匹配,系统就进行检索,最后得到检索结果列表。
第三步:检索结果列表查看 检索结果按照相似度递减的顺序列表,用户可以点击查看谱图的连接查看谱图,也可以点击谱峰列表查看该谱图的峰数据,方便与提问谱图对照。
图3.2.4.6 检索结果列表
图3.2.4.7 查看命中谱图与其化合物结构
把鼠标移动到红外谱图上的峰上,可以在窗口下方的状态栏查看谱图上的对应坐标。谱图的三个按钮Transmittance, Absorbance, Zoom Out at的使用说明见下一节。
46
图3.2.4.8 命中谱图的谱峰列表
3.2.4.2
相似谱图检索——上载谱图文件检索
基本原理 本部分与3.2.4.1的区别仅在于提问谱图的数据提交方式不同。用户首先将原始谱图的数据文件(如prn格式等)转换成本系统指定的谱图文件格式(nyy格式),然后上传nyy文件。系统会根据用户设定的取峰参数对用户nyy文件进行分析,得到提问谱图的谱峰数据。用户可指定待命中的谱图与输入的提问谱图的最低相似度、容许误差范围等参数。系统根据这些参数,先进行初步筛选,得到候选红外谱图,然后把用户输入的数据与数据库中的所有候选红外谱图的特征谱峰数据进行逐一比较,找到与用户输入谱图相似的谱图,并将结果按照相似度递减顺序排列供用户对照。
第一步:谱图文件的数据格式转换 本系统接受的谱图数据文件为自定义的nyy格式。用户使用本服务,需要先将原始的谱图文件转换成nyy格式。nyy文件的大小均为7602个字节,可根据这一点初步确认文件转换成功。本系统提供prn格式和asc格式对nyy的转换工具,请在下列地址下载转换工具:
windows版prn转换成nyy的工具:http://202.127.145.134/download/prn2nyy_win.rar dos版prn转换成nyy的工具:http://202.127.145.134/download/prn2nyy.rar dos版asc转换成nyy的工具:http://202.127.145.134/download/asc2nyy.rar
转换工具下载完成之后,先解压缩到本地硬盘。分别得到prn2nyy_win.exe, prn2nyy.exe和asc2nyy.exe. 本工具适用的prn文件格式如下表3.2.4.1所示,第一列为波数(cm-1),第二列为透过率(%):
399.36401.29403.22405.14407.07409 412.86
1.windows下转换工具 prn2nyy_win.exe的使用
双击prn2nyy_win.exe即可打开如图3.2.4.9的对话框,输入prn文件的路径,并指定要生成的nyy文件的储存路径与名称。点击prn转换成nyy按钮即可在指定目录下生成nyy文件。nyy文件名如不存在,会自动创建;如已经存在,则会覆盖原有文件。
74.89475.29275.56675.60975.94976.36876.45
表3.2.4.1 prn文件格式
47
图3.2.4.9 用prn2nyy_win.exe转换成nyy
2. dos下转换工具prn2nyy.exe的使用
图3.2.4.10 用prn2nyy.exe转换成nyy
将需要处理的目标文件*.prn与prn2nyy.exe放在同一个目录下. 启动dos, 进入该目录,输入 prn2nyy *.prn。回车确认即可执行prn2nyy.exe, 得到*.nyy文件,可供检索使用.
操作步骤与输入的命令如图3.2.4.10所示。 3. dos下转换工具asc2nyy.exe的使用
图3.2.4.11 用prn2nyy.exe转换成nyy
操作过程与prn2nyy.exe相似. 进入工作目录后,输入 asc2nyy *.asc,回车确认即可执行asc2nyy.exe, 得到*.nyy文件,可供检索使用. 如图3.2.4.11所示。
第二步:谱图文件的上传与取峰 系统读取用户上传的nyy文件,对谱峰曲线进行逐点扫描,根据谱图的
48
曲线变化获得谱峰及各项数据。
先选择需要检索的nyy文件,如图3.2.4.12所示。
图3.2.4.12 选择nyy文件
图3.2.4.13 谱图文件上传与取峰参数设置
选择文件之后,先要设定取峰参数。用于取峰的参数有:基线、取峰上限、最小峰差、零线校正,如图3.2.4.13所示。其含义分别是:
基线Base Line Height of IR Spectrum(%):系统在取峰时要先对谱峰曲线进行扫描,透过率大于基线的点不在扫描范围之内。因此,那些透过率比基线更高的曲线变化不会被纪录,系统也不会计算该段曲线是否有谱峰存在。
取峰上限Upper Limit of Peak Transmittance(%):扫描曲线获得的谱峰,只有其透过率在取峰上限以下才会被当成有效的谱峰。取峰上限的值不超过基线值。
例如,系统默认谱图的取峰基线为85%,取峰上限为70%。那么那些透过率超过85%的点将不会被扫描到,而无视具体的谱图形状。在85%以下可能有2个谱峰,其透过率分别是71%和69%,在本例中将只取透过率为69%的谱峰,而另一个谱峰(透过率71%)则被忽略。
最小峰差Minimum Differentiation of Peak(%):谱图的曲线上总是有一些不够平滑的微弱的波动,其中有相当一部分是仪器的噪音。考虑到红外光谱图的实际应用,系统设置了最小峰差,只有某个波的峰差大于最小峰差的时候,系统才会认为曲线上的一个波是一个真正意义上的谱峰。那些峰差不够大的波将被认为没有意义。不同的最小峰差值,决定了某些峰是否会被作为有意义的谱峰而被抓取出来,同时也会影响到其他一些峰的峰数据。
零线校正Zero Error of IR Spectrum(cm-1):零线校正是为了校正谱图由于测量仪器产生的整体红移/蓝移的误差。正值表示蓝移,负值表示红移,零表示该谱图无需校正。
49
第三步:谱峰数据校对与检索参数选择 取峰参数设定完毕,点击上载所选文件,系统将自动完成取峰过程,并进入第三步。
页面的第一部分是输入谱峰的列表,供用户校对数据。如果用户发现系统列出的谱峰数据不符合需求,可返回上一页重新设定取峰参数。如图3.2.4.14。
图3.2.4.14 检索参数选择
本部分的参数含义与上一节的完全相同。唯一有区别的是,图3.2.4.14中页面最下方有一个显示提问谱图按钮,点击可弹出窗口,显示出用户上载的提问谱图的形状。如图3.2.4.15所示。
图3.2.4.15 用户上载的提问谱图
用户可以点击谱图上方的Transmittance按钮和Absorbance按钮切换谱图模式,如图3.2.4.16,图中点击Transmittance按钮即可切换到透过率模式。
50
图3.2.4.16 用户上载的提问谱图(吸光率模式)
除此之外,用户还可以通过Zoom Out at按钮放大谱图局部。例如,在Zoom Out at按钮后面的方框里输入1452,点击Zoom Out at按钮即可放大图形局部,如图3.2.4.17所示。图中点击Transmittance按钮或者Absorbance按钮即可恢复全图显示。
图3.2.4.17 用户上载的提问谱图(放大局部)
第四步:检索结果列表查看 检索参数选择完成之后,点击开始检索(图3.2.4.15),得到检索结果,内容与上一节相似, 见图3.2.4.18。可以将检索命中的谱图与提问谱图对照,如图3.2.4.19。
图3.2.4.18 命中的谱图结果列表(部分)
51
图3.2.4.19 检索命中目标谱图与提问谱图对照
3.2.4.3
化合物检索
基本原理 用户输入化合物的英文名称,或者CAS号,或者分子式,选择精确检索或者模糊检索。系统根据用户输入的关键词检索该化合物的红外谱图并列表显示。
输入化合物的名称
用户可输入化合物的关键词,例如英文名称的精确检索如图3.2.4.20,表示检索化合物名称为“chalcone”字符串的化合物的谱图,检索结果如图3.2.4.21。
图3.2.4.20 化合物名称的精确检索
图3.2.4.21 化合物名称的精确检索的结果
用户也可输入化合物的名称进行模糊检索,如图3.2.4.22和图3.2.4.24。例1输入“chalcone”表示检索所有名称中含有“chalcone”字符串的化合物的谱图,例2输入“%oxychalcone”表示检索名称以“oxychalcone”字符串结束的化合物的谱图。检索结果分别如图3.2.4.23和图3.2.4.25所示。
提示:如检索命中结果超过100条谱图纪录,则只显示前面100条纪录。
52
图3.2.4.22 化合物名称的模糊检索(例1)
图3.2.4.23 化合物名称的模糊检索(例2)
图3.2.4.24 化合物名称的模糊检索结果(例1)
图3.2.4.25 化合物名称的模糊检索结果(例2)
输入化合物的CAS号
输入CAS号,有无短划线均可,例如“94-41-7”或者“94417”,分别如图3.2.4.26和图3.2.4.27所示。两种输入方法的检索结果相同,见图3.2.4.28。
图3.2.4.26 CAS号的输入(例1)
53
这 图3.2.4.27 CAS号的输入(例2)
图3.2.4.28 CAS号的检索结果
输入化合物的分子式
输入化合物的分子式(化学元素符号按C、H顺序,其他元素按字母顺序排列)。为方便查询时的输入操作,输入元素符号不区分大小写,数字不考虑上下标。参见图3.2.4.28(例1)和图3.2.4.29(例2),两个输入的意义完全相同。分子式也可以进行模糊检索,输入的界面如图3.2.4.30(例3),检索结果见图3.2.4.31。
图3.2.4.28 分子式的输入(例1)
图3.2.4.29 分子式的输入(例2)
图3.2.4.30 分子式的模糊检索(例3)
图3.2.4.31 分子式的模糊检索结果(例3)
在化合物检索的结果列表中,可以看到化合物的名称、分子式、CAS号和谱图分类。一个化合物可能在不同的谱图分类中有多个谱图,也可能在同一个分类中有多个谱图。不同分类的谱图的形状可能差异较大,即
54
使是同一个分类的不同谱图,可能也会有较大差异,用户使用时候请务必注意。
图3.2.4.31所示的例3中,CAS号64-17-5且分子式C2H6O对应的都是同一个化合物,乙醇Ethyl Alcohol,共有从第3条到第7条共5条记录。如果选取列表中的第5条纪录和第7条纪录查看,分别如图3.2.4.32和图3.2.4.33所示。
图3.2.4.32 例3中检索结果的第5条纪录
图3.2.4.33 例3中检索结果的第7条纪录
55
3.2.4.4 用户常见问题与解决方案
问:本系统只接受化合物的英文名称检索,那只有中文名称的化合物怎么检索它的红外谱图?
答:请先在左边的化学工作辅助工具栏目里选择化合物名称中英互译,将中文名称译成英文名称,然后再检索。名称翻译工具的使用请见图3.2.4.34和3.2.4.35。
图3.2.4.34 化合物名称输入
图3.2.4.35 化合物中文名称翻译成英文名称
问:如果只有化合物的结构,没有名称与CAS号,怎么检索它的红外谱图? 答:有2种办法。
第1种:先通过化学工作辅助工具栏里的化合物结构转换成名称,输入结构,点击按扭生成名字,将结构转换成名称并得到该化合物的分子式,见图3.2.4.36和3.2.4.37。用户即可用生成的名字来检索红外谱图。 特别要说明,本工具生成的名字都是IUPAC命名,而红外谱图数据库使用的名字相当一部分是通用的俗名。如果用系统命名的名字检索不到结果,用户可以尝试用分子式检索。
图3.2.4.36 输入化合物结构
图3.2.4.37 获得化合物的中英文名称与分子式
除了上述的办法,还有第2种办法:
,选择“化合物结构检索”,如图3.2.4.38所示。 1) 请选择“化合物综合检索”
2) 在结构检索的页面点击输入分子结构检索,如图3.2.4.39所示。
3) 点击提交检索,即可在结构数据库中检索该化合物,得到化合物列表。如图3.2.4.40所示。
4) 点击化合物名称的链接,即可进入化合物属性和更多信息的页面。如图3.2.4.41所示。在图中最下方,更
多信息的项目里,可以看到红外光谱的链接。所有化合物的信息里,出现某个链接项目就表示该化合物拥
56
有该属性的数据。
5) 点击红外光谱的链接,即可检索到该化合物所有的红外谱图。如图3.2.4.42。点击查看谱图,就可以显示对
应谱图,如图3.2.4.43所示。
图3.2.4.38 进入化合物综合检索
图3.2.4.39 输入化合物结构
图3.2.4.40 化合物结构检索结果列表
57
图3.2.4.41 化合物属性与更多信息
图3.2.4.42 化合物的红外谱图列表
图3.2.4.43 化合物的红外谱图
58
因篇幅问题不能全部显示,请点此查看更多更全内容