一种高通量的糖基化肽段鉴定策略 血清糖蛋白组学

Slides:



Advertisements
Similar presentations
第十二章 常微分方程 返回. 一、主要内容 基本概念 一阶方程 类 型 1. 直接积分法 2. 可分离变量 3. 齐次方程 4. 可化为齐次 方程 5. 全微分方程 6. 线性方程 类 型 1. 直接积分法 2. 可分离变量 3. 齐次方程 4. 可化为齐次 方程 5. 全微分方程 6. 线性方程.
Advertisements

基本知识和几何要素的投影 模块一: 字体练习 第一章 制图的基本知识与基本技能 题目提示返回.
球面网格及其应用 李杰权 北京师范大学数学科学学院
北京邮电大学. Sep Wireless and EMC Lab 主要内容 实验室研究方向 实验室研究方向 承担项目情况 承担项目情况 对外合作 对外合作 培养方向 培养方向 就业分配 就业分配 实验室文化 实验室文化.
数据挖掘实验 1 Apriori 算法编程实现. 数据挖掘实验一 (20’) 实验目的:了解关联规则在数据挖掘中的 应用,理解和掌握关联挖掘的经典算法 Apriori 算法的基本原理和执行过程并完成程 序设计。 实验内容:对给定数据集用 Apriori 算法进行 挖掘,找出其中的频繁集并生成关联规则。
HistCite 结果分析示例 罗昭锋. By:SC 可能原因:文献年度过窄,少有相互引用.
LOGO 文献管理软件 NoteExpress 简介 《文献管理与信息分析》课程系列之九中国科学技术大学.
一、拟合优度检验 二、变量的显著性检验 三、参数的置信区间
计算机 在分析化学的应用 ( 简介 ) 陈辉宏. 一. 概述 信息时代的来临, 各门学科的研究方法都 有了新的发展. 计算机的介入, 为分析化学的进展提供了 一种更方便的研究方法.
信息安全专业培养计划 Undergraduate Program for Specialty in Information Security ( Version 2009 ) 计算机科学与工程学院 方贤进 博士, 副教授 MSN:
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第六十二讲 ) 离散数学. 最后,我们构造能识别 A 的 Kleene 闭包 A* 的自动机 M A* =(S A* , I , f A* , s A* , F A* ) , 令 S A* 包括所有的 S A 的状态以及一个 附加的状态 s.
1 为了更好的揭示随机现象的规律性并 利用数学工具描述其规律, 有必要引入随 机变量来描述随机试验的不同结果 例 电话总机某段时间内接到的电话次数, 可用一个变量 X 来描述 例 检测一件产品可能出现的两个结果, 也可以用一个变量来描述 第五章 随机变量及其分布函数.
数 学 系 University of Science and Technology of China DEPARTMENT OF MATHEMATICS 第 3 章 曲线拟合的最小二乘法 给出一组离散点,确定一个函数逼近原函数,插值是这样 的一种手段。在实际中,数据不可避免的会有误差,插值函 数会将这些误差也包括在内。
主讲教师:陈殿友 总课时: 124 第八讲 函数的极限. 第一章 机动 目录 上页 下页 返回 结束 § 3 函数的极限 在上一节我们学习数列的极限,数列 {x n } 可看作自变量 为 n 的函数: x n =f(n),n ∈ N +, 所以,数列 {x n } 的极限为 a, 就是 当自变量 n.
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第四十八讲 ) 离散数学. 例 设 S 是一个非空集合, ρ ( s )是 S 的幂集合。 不难证明 :(ρ(S),∩, ∪,ˉ, ,S) 是一个布尔代数。 其中: A∩B 表示 A , B 的交集; A ∪ B 表示 A ,
第十一章 曲线回归 第一节 曲线的类型与特点 第二节 曲线方程的配置 第三节 多项式回归.
协同工作环境研究中心 协同共享 助力科研. 主要内容  认识协同及协同软件  协同科研软件 duckling 介绍.
线性代数习题课 吉林大学 术洪亮 第一讲 行 列 式 前面我们已经学习了关 于行列式的概念和一些基本 理论,其主要内容可概括为:
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第二十五讲 ) 离散数学. 定理 群定义中的条件 ( 1 )和( 2 )可以减弱如下: ( 1 ) ’ G 中有一个元素左壹适合 1 · a=a; ( 2 ) ’ 对于任意 a ,有一个元素左逆 a -1 适 合 a -1 ·
安全操作系统 中国科学技术大学计算机系 陈香兰( 0512 - ) 助教:裴建国 Autumn 2008.
数 学 系 University of Science and Technology of China DEPARTMENT OF MATHEMATICS 第 3 章 曲线拟合的最小二乘法 给出一组离散点,确定一个函数逼近原函数,插值是这样的一种手段。 在实际中,数据不可避免的会有误差,插值函数会将这些误差也包括在内。
聚合物在生物高分子分离中的应用 王延梅 中国科学技术大学高分子科学与工程系 Tel
实验三: 用双线性变换法设计 IIR 数字滤波器 一、实验目的 1 熟悉用双线性变换法设计 IIR 数字滤波器的原理与方法。 2 掌握数字滤波器的计算机仿真方法。 3 通过观察对实际心电图信号的滤波作用, 获得数字滤波的感性知 识。
绪 论 一、药物分析性质与任务 二、国家药品标准 三、药品质量管理规范 四、课程的要求. 药 品 用于预防、治疗、诊断人的疾病, 有目的地调节人的生理机能并规定有适应 症或者功能主治、用法用量的物质, 是广大人民群众防病治病、保护健康必不 可少的特殊商品。 《中华人民共和国药品管理法》 性质与任务.
大亚湾 PMT 读出电子学介绍 王铮 中科院 “ 核探测技术与核电子学重点实验室 ” 年会.
外文文献检索示例. 实验目的: 掌握利用计算机网络检索外文文献的基本方法; 了解熟悉下列数据库的结构、内容并掌握其检索方 法 ; 掌握检索的主要途径:出版物( Publication )、关键 词( Keyword )、作者( Author )等。
1 第 7 章 专家控制系统 概述 专家系统的起源与发展 专家系统的一般结构 专家系统的知识表示和获取 专家系统的特点及分类.
信息利用与学术论文写作 Library of Jiangsu University, Zhenjiang Sha Zhenjiang
第二章 贝叶斯决策理论 3学时.
操作系统原理课程设计指南 姜海燕 设计考核幻灯制作  1.1 封皮:系统名称,研制人员  1.2 目的及意义  1.3 功能设计:功能框图、用例图  1.4 结构设计:系统结构  1.5 核心技术及技术路线:画图  1.6 进度安排  1.7 人员安排  1.8.
量子化学 第四章 角动量与自旋 (Angular momentum and spin) 4.1 动量算符 4.2 角动量阶梯算符方法
主讲教师:陈殿友 总课时: 124 第十一讲 极限的运算法则. 第一章 二、 极限的四则运算法则 三、 复合函数的极限运算法则 一 、无穷小运算法则 机动 目录 上页 下页 返回 结束 §5 极限运算法则.
在发明中学习 线性代数 概念的引入 李尚志 中国科学技术大学. 随风潜入夜 : 知识的引入 之一、线性方程组的解法 加减消去法  方程的线性组合  原方程组的解是新方程的解 是否有 “ 增根 ” ?  互为线性组合 : 等价变形  初等变换  高斯消去法.
第一节 相图基本知识 1 三元相图的主要特点 (1)是立体图形,主要由曲面构成; (2)可发生四相平衡转变; (3)一、二、三相区为一空间。
第二章 通信技术基础 谈英姿 东南大学自控系工业自动化教研室. 通信技术基础 2.1 通信的基本概念 2.2 通信协议与网络层次分析 2.3 常用串行通信技术.
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第五十三讲 ) 离散数学. 定义 设 G= ( V , T , S , P ) 是一个语法结构,由 G 产生的语言 (或者说 G 的语言)是由初始状态 S 演绎出来的所有终止符的集合, 记为 L ( G ) ={w  T *
主要学习内容: 1、用描述法分析样品的风味特征 2 、学习味觉试验方法。 闽北职业技术学院食品与生物工程系.
 符号表  标识符的作用: 声明部分:定义了各种对象及对应的属性和 使用规则。 程序体:对所定义的对象进行各种操作。 $ididname IdnameAttributeIR  必要性 Token : 新表-符号表(种类、类型等信息):
初中几何第三册 弦切角 授课人: 董清玲. 弦切角 一、引入新课: 什么是圆心角、圆周角、圆周角定理的内容是什么? 顶点在圆心的角叫圆心角。 顶点在圆上,并且两边都和圆相交的角叫做圆周角。 定理:一条弧所对的圆周角等于它所对的圆心角的一半。 A B′ C B O.
Department of Mathematics 第二章 解析函数 第一节 解析函数的概念 与 C-R 条件 第二节 初等解析函数 第三节 初等多值函数.
Beyond Database Search PTMs, Mutations & Full Sequence Coverage Bin Ma Professor, University of Waterloo 从搜库到蛋白全序列分析.
首 页 首 页 上一页 下一页 本讲内容本讲内容 视图,剖视图(Ⅰ) 复习: P107 ~ P115 作业: P48(6-2,6-4), P49( 去 6-6) P50, P51(6-13), P52 P50, P51(6-13), P52 P53 (6-18,6-20) P53 (6-18,6-20)
1-4 节习题课 山东省淄博第一中学 物理组 阚方海. 2 、位移公式: 1 、速度公式: v = v 0 +at 匀变速直线运动规律: 4 、平均速度: 匀变速直线运动 矢量式 要规定正方向 统一单位 五个量知道了三 个量,就能求出 其余两个量 3 、位移与速度关系:
《 UML 分析与设计》 交互概述图 授课人:唐一韬. 知 识 图 谱知 识 图 谱知 识 图 谱知 识 图 谱.
1 、如果 x + 5 > 4 ,那么两边都 可得 x >- 1 2 、在- 3y >- 4 的两边都乘以 7 可得 3 、在不等式 — x≤5 的两边都乘以- 1 可得 4 、将- 7x — 6 < 8 移项可得 。 5 、将 5 + a >- 2 a 移项可得 。 6 、将- 8x < 0.
名探柯南在侦查一个特大盗窃集团过程 中,获得藏有宝物的密码箱,密码究竟 是什么呢?请看信息: ABCDEF( 每个字 母表示一个数字 ) A :是所有自然数的因数 B :既有因数 5 ,又是 5 的倍数 C :既是偶数又是质数 D :既是奇数又是合数 EF :是 2 、 3 、 5 的最小公倍数.
1 物体转动惯量的测量 南昌大学理学院
老子大道的逻辑解析 思东创作室 编号: 006. 直接性 — 第 1 章 01— 间接性 直接性 — 第 1 章 02— 间接性.
§10.2 对偶空间 一、对偶空间与对偶基 二、对偶空间的有关结果 三、例题讲析.
7 生产费用在完工产品与在产 品之间分配的核算. 2 第七章 生产费用在完工产品与在产品之 间的分配  知识点 :  理解在产品的概念  掌握生产费用在完工产品与在产品之间的分 配.
力的合成 力的合成 一、力的合成 二、力的平行四边形 上一页下一页 目 录 退 出. 一、力的合成 O. O. 1. 合力与分力 我们常常用 一个力来代替几个力。如果这个 力单独作用在物体上的效果与原 来几个力共同作用在物体上的效 果完全一样,那么,这一个力就 叫做那几个力的合力,而那几个 力就是这个力的分力。
再谈检验医学与医学检验 吕建新 温州医学院 如何定位 ?  检验医学是 “ 学科 ” 的概念  医学检验是 “ 专业 ” 的概念  国家学科专业目录(调整前)  研究生教育的学科专业目录(侧重学科)  医学(门类),共 12 个门类,  医学门类下设:基础医学、临床医学、预防医学、中医学、中.
第三章 基因的本质 第 3 节 DNA 的复制. 特点:遵循碱基 互补配对原则 A-T 、 C-G DNA 平面结构 空间结构.
个体 精子 卵细胞 父亲 受精卵 母亲 人类生活史 问题:人类产生配子(精、卵 细胞)是不是有丝分裂?
中国知网数字图书馆 增值服务介绍 同方知网 张丽华. 全部文献报表 全部文献报表 中国工程院院士(本所专家) 中国工程院院士(本所专家) 本所专利及相关水产标准专利成果 本所专利及相关水产标准专利成果 海洋可捕资源与生态系统 海洋可捕资源与生态系统 海水养殖生态与容纳量 海水养殖生态与容纳量 海水养殖生物疾病控制与分子病理.
“ 百链 ” 云图书馆. 什么是百链云图书馆?1 百链云图书馆的实际效果?2 百链云图书馆的实现原理?3 百链云图书馆的价值?44 图书馆要做什么?55 提 纲.
无忧 PPT 整理发布 无忧 PPT 整理发布 网上教研活动的推进与 学习社区的构建 首都师范大学 蒋国珍 2008 年 12 月.
目录 ontents Related 案例三:研究中的教师专业发展 背 景英特尔 ® 未来教育基础课程理念向教师教 学能力迁移的实践研究 时 间 2011 年 10 月至现在 学 校吉林省东丰县第四中学 研究内容初中语文叙事性散文教学中提问策略的 研究 技术条件网络环境 (网络课程、 QQ 、视频会议、
参考文献管理软件. 常见参考文献管理软件 : 中文 : CNKI E-learning (目前免费) NoteExpress NoteFirst 英文: Refworks Endnote (网络版免费) Mendeley……
开放教育学员入学须知 第一部分:浏览山东理工大学远程与继续 教育学院网站浏览山东理工大学远程与继续 教育学院网站 第二部分:浏览中央电大教学平台浏览中央电大教学平台 第三部分:浏览山东电大教学平台浏览山东电大教学平台 第四部分:浏览淄博电大教学平台浏览淄博电大教学平台 第五部分:淄博电大教学平台使用淄博电大教学平台使用.
森林保护学本科系列课程 教学改革与实践 西北农林科技大学 一、基本情况 二、主要成果 三、创新点 四、成果的应用 项目研究背景 项目的总体设计 成果简介 解决的主要教学问题 解决教学问题的方法 改革前后的对比.
院长助理 教务处长 李学锋 教授 2008 年 9 月 9 日 基于工作过程的系统化高职课程建设.
八. 真核生物的转录 ㈠ 特点 ① 转录单元为单顺反子( single cistron ),每 个蛋白质基因都有自身的启动子,从而造成在功能 上相关而又独立的基因之间具有更复杂的调控系统。 ② RNA 聚合酶的高度分工,由 3 种不同的酶催化转 录不同的 RNA 。 ③ 需要基本转录因子与转录调控因子的参与,这.
张勤 人大报刊复印资料 专题全文数据库 简 介简 介 《人大报刊资料全文数据库》是中国人民大 学书报资料中心与北京博利群电子信息有限 公司联合开发研制的大型数据库光盘。它涵 盖面广、信息量大、分类科学、筛选严谨、 结构合理,是国内最具权威的社会科学、人.
人 有 悲 欢 离 合, 月有阴晴圆缺。月有阴晴圆缺。 华师大版七年级数学第二册 海口市第十中学 数学组 吴锐.
1 第三章 数列 数列的概念 考点 搜索 ●数列的概念 ●数列通项公式的求解方法 ●用函数的观点理解数列 高考 猜想 以递推数列、新情境下的 数列为载体, 重点考查数列的通 项及性质, 是近年来高考的热点, 也是考题难点之所在.
韩文数据库使用说明 鲁锦松. 主要内容 一、为什么要用数据库 二、怎样利用中文数据库 三、怎样利用韩文数据库.
目录 上页 下页 返回 结束 二、无界函数反常积分的审敛法 * 第五节 反常积分 无穷限的反常积分 无界函数的反常积分 一、无穷限反常积分的审敛法 反常积分的审敛法  函数 第五章 第五章.
SCI 数据库检索练习参考 本练习完全依照 SCI 数据库实际检索过程而 实现。 本练习完全依照 SCI 数据库实际检索过程而 实现。 练习中,选择了可以举一反三的题目,读 者可以根据题目进行另外的检索练习,如: 可将 “ 与 ” 运算检索改为 “ 或 ” 、 “ 非 ” 运算检索 等等。 练习中,选择了可以举一反三的题目,读.
§7.2 估计量的评价标准 上一节我们看到,对于总体 X 的同一个 未知参数,由于采用的估计方法不同,可 能会产生多个不同的估计量.这就提出一 个问题,当总体的一个参数存在不同的估 计量时,究竟采用哪一个好呢?或者说怎 样评价一个估计量的统计性能呢?下面给 出几个常用的评价准则. 一.无偏性.
Presentation transcript:

一种高通量的糖基化肽段鉴定策略 血清糖蛋白组学 第二届中国计算蛋白质组学研讨会 一种高通量的糖基化肽段鉴定策略 血清糖蛋白组学 报告人:张扬 日期:2012年11月15日 复旦大学 生物医学研究院 贺福初、杨芃原课题组

Biological Functions of Glycosylation Cell Recognition Protein Folding Glycosylation 糖链 Immunity Cell Adhesion Reproduction

AA-NXS/T-AA Analytical question A B 糖链结构 技术难度 糖基化位点 糖蛋白 糖基化位点 糖链结构 技术难度 Analytical question 1. Trypsin Recognition of glycosylated peptides 2. PNGase Recognition of glycosite Lectins specific recognition Glyco-motif recognition Anti-body specific recognition Boron Acid, HC/HA specific recognition MS analysis of glycopeptides AA-NXS/T-AA A B

理论碎片数目 在谱图水平上 完整解析糖肽是否可能?

N-糖肽 CID谱图解析的可能 合理的质谱条件 合理的算法 合理的数据库 完整糖肽鉴定 Stand Glycoprotein Interpretation Construction of relational network to select correct peaks and reduce false positive results. Focus on constant breakage of glycans on glycopeptides. Suitable for different MS instruments. (e.g MALDI & ESI source) Capture feature mass of QIT, LTQ original data Spectrum feature of low CID, high CID, ETD and HCD N-糖肽 CID谱图解析的可能 合理的质谱条件 合理的算法 合理的数据库

Validation of diagnostic ions – QIT MS Mode 完整糖肽鉴定 Validation of diagnostic ions – QIT MS Mode Mass Path/Chain Peptide Sequence: Asp fragmentation Cys modification Miss cleavage

Moderate level of cleavage on peptide and glycan. 完整糖肽鉴定 High Energy CID Moderate level of cleavage on peptide and glycan. Spectrum quality usually unsatisfied for the need of high-throughput identification. Low Energy CID Comprehensive cleavage on glycan, very little cleavage on peptide. Specifically designed algorithm is needed for interpretation. Background

Glycopeptide Reveal & Interpretation Platform 完整糖肽鉴定 Development of GRIP Glycopeptide Reveal & Interpretation Platform 质量数列表过滤 质量数网络构建 质量数网络分离 Automatic filtration of peptides without glycosylation Automatic interpretation of glycosylation in real sample Adjustable parameters (e.g glycan markers / databases) Compatibility of common proteomic software (e.g TPP) De novo + Database Search Suitable for Standard Glycoprotein Exhaustive search all possible glycan and get consensus result 直接解析 + 数据库搜索(流行)

Glyco-related Mass Capture 完整糖肽鉴定 GRIP软件的框架 Raw Spectra Intensity Filtration Filtration Module Deconvolution Precursor Filtration Network Construction Glyco-related Mass Capture Network Module Relational Tree Glycopeptide Composition Database Prediction Result

肽段与糖链的质量数网络比较 DirecTag DirecTag (2008. JPR) 直接解析 GRIP

Our Software — GRIP Improved Code Single Mass Prediction Software Relational networks were constructed from peaks of glycopeptide fragments. Single Mass Prediction Software FindMod GlycoMod GlycoPep ID GlycoSuiteDB …… Improved Code Redundant edges are cut down to Reduce the Complexity of Network

糖肽鉴定 Test in HRP

糖肽鉴定 GlycoPep ID, 2007 AC Peaklist Mass Database Mass Mass Error Database Entry 4054.8143 4054.9488 33 VVHAVEVALATFNAESNGSYLQLVEISR_[Hex]3[HexNAc]2[Fuc]1 4274.0576 4274.0231 8 VVHAVEVALATFNAESNGSYLQLVEISR_[Hex]4[HexNAc]3 4970.3935 4971.2773 178 VVHAVEVALATFNAESNGSYLQLVEISR_[Hex]4[HexNAc]5[NeuNAc]1 4987.4315 4988.2926 173 VVHAVEVALATFNAESNGSYLQLVEISR_[Hex]5[HexNAc]5[Fuc]1 5003.4442 5004.2875 169 VVHAVEVALATFNAESNGSYLQLVEISR_[Hex]6 [HexNAc]5

完整糖肽鉴定 单糖组分的理论计算器 理论糖肽生成器 Peptide Glycan Database Database Glycopeptide Composition Database Peptide Database Glycan Database 单糖组分的理论计算器 理论糖肽生成器

理论肽段生成原则 HRP: 37 理论酶切肽段(考虑一次漏切) 17个有N糖基化位点 M N 五糖组合: 5 4 2 2 2 6*5*3*3*3 = 810 组合数目:13770

血清糖肽 Next Step: Serum GRIP can extract enough information for N-Glycopeptide identification.

GRIP 验证 HCD 谱图 CID 谱图 同 一 个 母 离 子 预实验 文献 糖肽 血清糖肽 Glycopeptide1 …… Glycopeptide Database 预实验 Peptide Database 理论库太大 半酶切的存在 文献 Glycan Database 糖肽 De-glycopeptide1 De-glycopeptide2 De-glycopeptide3 De-glycopeptide4 …… PNGase TPP The Retrosynthetic State-Transition Library 去糖基化肽段 2DLC-MSMS SEQUEST 365 Glycan Compositions 2009, Proteomics

血清糖肽 实验路线 A. 标准品中测试 B. 实际样品中,小规模的CID/HCD Pair糖谱鉴定 C. 实际样品中,大规模的CID糖谱鉴定

Test Result of Standard ASF (based on the original) 血清糖肽 Test Result of Standard ASF Database searching by GRIP All MS/MS spectra Target result 2% FPR threshold Database searching by GRIP (same parameters) Shuffle spectra (based on the original) Decoy result Threshold (log) Target Decoy-1 Decoy-2 Decoy-3 FPR 0.75 N/A 0.5 0.25 3 0.00% -0.25 10 -0.5 31 1 2 3.23% -0.75 82 2.03% -1 150 4 1.56% -1.25 194 8 6 3.09% -1.5 221 7 9 3.92% -1.75 233 12 4.15% -2 251 17 11 5.31% -99 442 165 174 170 38.39%

Test Result of Standard ASF 第4章 Test Result of Standard ASF

CID/HCD Pair Validation 血清糖肽 CID/HCD Pair Validation A 21,314 peptide spectra 62,878 CID-MS/MS spectra SEQUEST/ PeptideProphet p ≥ 0.99 14,014(65.7%) spectra validated by HCD Human serum Typsinization Enrichment LC-CID/HCD-MS/MS (LTQ-Orbitrap, 2DLC x 2) No overlapping on spectrum level GRIP Score ≥ 0.1 (2.8%FPR) 1,174 Glyco- peptide spectra All paired HCD spectra are manually interpreted for Y1 ions. B Threshold (log) Target Decoy1 Decoy2 Decoy3 FPR 0.75 44 0.00% 0.5 205 0.25 362 628 2 0.11% -0.25 802 4 0.50% -0.5 944 6 10 12 0.99% -0.75 1060 19 18 20 1.79% -1 1174 32 25 43 2.84% -1.25 1297 52 46 63 4.14% -1.5 1425 95 87 113 6.90% -1.75 1582 151 143 177 9.92% -2 1835 235 248 266 13.61% -99 4199 2104 2021 2042 48.96% C

CID/HCD Pair Validation 血清糖肽 CID/HCD Pair Validation DEGLYCOPEPTIDE

CID/HCD Pair Validation 血清糖肽 CID/HCD Pair Validation Threshold (log) Spectra Number DeltaCN >0.5 Y1 Score > 0 % True False FPR 0.75 44 42 36 85.7% 0% 0.5 205 192 151 78.7% 0.25 362 329 252 76.6% 251 1 0.4% 628 538 415 77.1% 414 0.24% -0.25 802 680 515 75.7% 508 7 1.36% -0.5 944 807 600 74.4% 590 10 1.67% -0.75 1060 895 645 72.1% 632 13 2.02% -1 1174 982 683 69.6% 667 16 2.34%

Large Scale Identification in Human Serum 血清糖肽 Large Scale Identification in Human Serum 53,567 peptide spectra A SEQUEST/ PeptideProphet p ≥ 0.99 Human serum Typsinization Enrichment LC-CID-MS/MS (LTQ-Orbitrap,2DLC x 3) 251,886 CID-MS/MS spectra No overlapping on spectrum level Score ≥ 0.178 (1.8% FPR) GRIP 4,341 Glyco- peptide spectra B Threshold (log) Target Decoy1 Decoy2 Decoy3 FPR 0.75 69 0.00% 0.5 501 0.25 1074 1 0.06% 1774 4 6 3 0.24% -0.25 2611 11 15 10 0.46% -0.5 3489 36 33 31 0.96% -0.75 4341 72 77 82 1.77% -1 5179 146 138 147 2.77% -1.25 5934 287 245 288 4.61% -1.5 6602 473 426 458 6.85% -1.75 7269 761 708 726 10.07% -2 7949 1177 1131 1128 14.41% -99 17946 11712 11332 11934 64.97% C

Large Scale Identification in Human Serum 血清糖肽

血清糖肽 血清糖蛋白鉴定情况

血清糖肽

血清糖肽

CID/HCD Pair Validation 血清糖肽

综合比较 血清糖肽

Large Scale Identification in Human Serum 血清糖肽

Large Scale Identification in Human Serum 血清糖肽

仅从de novo 的技术中很难真正解析糖的拓扑结构 三个同分异构体的理论碎片比较 仅从de novo 的技术中很难真正解析糖的拓扑结构 提示数据库匹配方法有可能解决糖拓扑结构真正的解析 每一个糖结构有其特征的理论碎片是区分同分异构体的关键因子

GRIP 𝒇 𝒊 (𝒙) DEGLYCOPEPTIDE DEGLYCOPEPTIDE New Method ? Fragmentation 拓扑结构 DEGLYCOPEPTIDE 𝑵 𝟏 𝑵 𝟐 𝑵 𝟑 𝑵 𝟒 𝑵 𝟓 GRIP Glycopeptide Composition Database DEGLYCOPEPTIDE Glycopeptide Fragment Database 𝒇 𝒊 (𝒙) Fragmentation Glycopeptide Structure Database New Method ?

Simulation using Glycoworkbench 允许发生一次断裂 在分支结构上有大量的断裂没有形成 理论上最多可发生9次断裂 拓扑结构 允许同时发生1次断裂:产生9种碎片,9种非冗余 允许同时发生2次断裂:产生43种碎片,30种非冗余 …… …… …… 允许同时发生5次断裂:产生572种碎片,63种非冗余 Simulation using Glycoworkbench 允许发生4次断裂 理论上最多可发生4次断裂 很难用现存的技术构建N糖肽碎片库

拓扑结构

N糖库的特殊构建流程 拓扑结构 对某个特定的子结构,删除节点的同时也要删除由它衍生出来的子节点。 每个节点的所有子节点信息已事先生成。 在对应的全1矩阵中把删除的所有删除的节点替换成0后得到矩阵T。 矩阵F按行去冗余得到最终结果矩阵F 𝑻= 𝒕 𝟏,𝟏 ⋯ 𝒕 𝟏,𝟐𝟑 ⋮ ⋱ ⋮ 𝒕 𝟖𝟑𝟖𝟖𝟔𝟎𝟖,𝟏 ⋯ 𝒕 𝟖𝟑𝟖𝟖𝟔𝟎𝟖,𝟐𝟑 𝟖𝟑𝟖𝟖𝟔𝟎𝟖×𝟐𝟑 𝑹𝒂𝒘= 𝒂 𝟏,𝟏 ⋯ 𝒂 𝟏,𝟐𝟑 ⋮ ⋱ ⋮ 𝒂 𝟖𝟑𝟖𝟖𝟔𝟎𝟖,𝟏 ⋯ 𝒂 𝟖𝟑𝟖𝟖𝟔𝟎𝟖,𝟐𝟑 𝟖𝟑𝟖𝟖𝟔𝟎𝟖×𝟐𝟑 𝑴𝑾= 𝒎𝒘 𝟏 ⋮ 𝒎𝒘 𝟏𝟎𝟎𝟎𝟒 𝟏𝟎𝟎𝟎𝟒×𝟏 𝑺𝒕𝒓𝒖𝒄𝒕𝒖𝒓𝒆= 𝒔 𝟏,𝟏 ⋯ 𝒔 𝟏,𝟐𝟑 ⋮ ⋱ ⋮ 𝒔 𝟏𝟎𝟎𝟎𝟒,𝟏 ⋯ 𝒔 𝟏𝟎𝟎𝟎𝟒,𝟐𝟑 𝟏𝟎𝟎𝟎𝟒×𝟐𝟑

拓扑结构 N-糖理论子结构库

N糖碎片库的构建 ( 𝒔 𝒊,𝟏 … 𝒔 𝒊,𝒏 ) 增维 找到𝐷𝑖𝑓𝑓中所有等于1的行就是其y离子系的理论碎片。 拓扑结构 考虑每个子结构的碎片其实理论上都包含在F子结构矩阵中,对某个特定的子结构( 𝒇 𝒊𝟏 … 𝒇 𝒊𝒏 )来说,在子结构矩阵中找到出现节点被完全包含的记录。我们可以通过如下步骤得到理论碎片结构:先将特定子结构( 𝒇 𝒊𝟏 … 𝒇 𝒊𝒏 )按照行进行扩增成与子结构矩阵同维的矩阵 𝑭 ′ ,通过MATLAB计算𝐒=( 𝑭 ′ −𝐅)≥𝟎后,找到𝐒中所有等于1的行就是其y离子系的理论碎片。 N糖碎片库的构建 ( 𝒔 𝒊,𝟏 … 𝒔 𝒊,𝒏 ) 增维 𝑺𝒕𝒓𝒖𝒄𝒕𝒖𝒓𝒆 ′ = 𝒔 𝒊,𝟏 ⋯ 𝒔 𝒊,𝟐𝟑 ⋮ ⋱ ⋮ 𝒔 𝒊,𝟏 ⋯ 𝒔 𝒊,𝟐𝟑 𝟏𝟎𝟎𝟎𝟒×𝟐𝟑 𝑺𝒕𝒓𝒖𝒄𝒕𝒖𝒓𝒆= 𝒔 𝟏,𝟏 ⋯ 𝒔 𝟏,𝟐𝟑 ⋮ ⋱ ⋮ 𝒔 𝟏𝟎𝟎𝟎𝟒,𝟏 ⋯ 𝒔 𝟏𝟎𝟎𝟎𝟒,𝟐𝟑 𝟏𝟎𝟎𝟎𝟒×𝟐𝟑 满足𝐷𝑖𝑓𝑓=( 𝑆𝑡𝑟𝑢𝑐𝑡𝑢𝑟𝑒 ′ −𝑆𝑡𝑟𝑢𝑐𝑡𝑢𝑟𝑒)≥0 𝑫𝒊𝒇𝒇= 𝑺𝒕𝒓𝒖𝒄𝒕𝒖𝒓𝒆 ′ −𝑺𝒕𝒓𝒖𝒄𝒕𝒖𝒓𝒆= 𝒅 𝟏,𝟏 ⋯ 𝒅 𝟏,𝟐𝟑 ⋮ ⋱ ⋮ 𝒅 𝟏𝟎𝟎𝟎𝟒,𝟏 ⋯ 𝒅 𝟏𝟎𝟎𝟎𝟒,𝟐𝟑 𝟏𝟎𝟎𝟎𝟒×𝟐𝟑 𝑭𝒓𝒂𝒈𝒎𝒆𝒏𝒕= 𝒇𝒓𝒂𝒈 𝟏 ⋮ 𝒇𝒓𝒂𝒈 𝟏𝟎𝟎𝟎𝟒 𝟏𝟎𝟎𝟎𝟒×𝟏 找到𝐷𝑖𝑓𝑓中所有等于1的行就是其y离子系的理论碎片。 𝑮𝑷= 𝒈𝒑 𝟏,𝟏 ⋯ 𝒈𝒑 𝟏,𝒏 ⋮ 𝒈𝒑 𝒊,𝒋 ⋮ 𝒈𝒑 𝟏𝟎𝟎𝟎𝟒,𝟏 ⋯ 𝒈𝒑 𝟏𝟎𝟎𝟎𝟒,𝒏 𝟏𝟎𝟎𝟎𝟒×𝒏 , 𝒈𝒑 𝒊,𝒋 = 𝒇𝒓𝒂𝒈 𝒊 + 𝒑𝒆𝒑 𝒋

自定义理论质量数与谱图匹配的打分公式 𝑺𝒄𝒐𝒓𝒆 𝟏 = 𝐣=𝟏 𝒏 𝟏 #𝐒𝐡𝐚𝐫 𝒆 𝒋 拓扑结构 自定义理论质量数与谱图匹配的打分公式 𝑺𝒄𝒐𝒓𝒆 𝟏 = 𝐣=𝟏 𝒏 𝟏 #𝐒𝐡𝐚𝐫 𝒆 𝒋 𝑺𝒄𝒐𝒓𝒆 𝟐 = 𝐣=𝟏 𝒏 (𝟏− 𝑷𝒓𝒐𝒃 𝒋 ) 𝑺𝒄𝒐𝒓𝒆 𝟑 = −𝒍𝒐𝒈 𝟏𝟎 𝐣=𝟏 𝒏 𝑷𝒓𝒐𝒃 𝒋 𝑺𝒄𝒐𝒓𝒆 𝟒 = 𝐣=𝟏 𝒏 (𝟏− 𝑷 𝒔 − 𝑷 𝒓 𝑬𝒓𝒓𝒐𝒓 ) 𝒏 𝒊𝒏𝒑𝒖𝒕 ×𝟏𝟎𝟎 𝑺𝒄𝒐𝒓𝒆 𝟓 = 𝐣=𝟏 𝒏 𝑷𝒓𝒐𝒃 𝒋 ×(𝟏− 𝑷 𝒔 − 𝑷 𝒓 𝑬𝒓𝒓𝒐𝒓 )

Precursor_Tolerance = 10 ppm 拓扑结构 谱图:20mM01.01178.01178.2 参数: Peptide-2D-110511.tgp Node_Tolerance = 1 Da Precursor_Tolerance = 10 ppm sp|P01859|IGHG2_HUMAN R.EEQFN#STFR.V 172-180 N_GLYCAN 1157.5227

拓扑结构 𝟓 𝟓 𝟐 𝟐 𝟏

拓扑结构 图形技术改进

StructureMatrix去冗余,得到2284×23列的矩阵 (6,7,8,19) 互换(9,10,11,20) 拓扑结构 𝑺𝒕𝒓𝒖𝒄𝒕𝒖𝒓𝒆= 𝒔 𝒊,𝟏 ⋯ 𝒔 𝒊,𝟐𝟑 ⋮ ⋱ ⋮ 𝒔 𝒊,𝟏 ⋯ 𝒔 𝒊,𝟐𝟑 𝟏𝟎𝟎𝟎𝟒×𝟐𝟑 𝑺𝒕𝒓𝒖𝒄𝒕𝒖𝒓𝒆 ′ = 𝒔 𝒊,𝟏 ⋯ 𝒔 𝒊,𝟐𝟑 ⋮ ⋱ ⋮ 𝒔 𝒊,𝟏 ⋯ 𝒔 𝒊,𝟐𝟑 𝟐𝟐𝟖𝟒×𝟐𝟑 StructureMatrix去冗余,得到2284×23列的矩阵 (6,7,8,19) 互换(9,10,11,20) (12,13,14,21) 互换(15,16,17,22) (4,6,7,8,9,10,11,19,20) 互换(5,12,13,14,15,16,17,21,22)

拓扑结构 N-糖理论子结构库 去除镜像冗余,2284个N-糖结构

Acknowledgement 贺福初 院士 (新当选中共中央委员会候补委员) 刘铭琪 博士 陈瑶函 博士 杨芃原 教授 (CNHUPO 主席) 陆豪杰 教授 (复旦大学生物医学研究院院长) 刘铭琪 博士 陈瑶函 博士 晏国全 老师 周新文 博士 张磊 老师 经费: 国家重大专项、973、863、国家自然基金、……