资源预览内容
第1页 / 共35页
第2页 / 共35页
第3页 / 共35页
第4页 / 共35页
第5页 / 共35页
第6页 / 共35页
第7页 / 共35页
第8页 / 共35页
第9页 / 共35页
第10页 / 共35页
第11页 / 共35页
第12页 / 共35页
第13页 / 共35页
第14页 / 共35页
第15页 / 共35页
第16页 / 共35页
第17页 / 共35页
第18页 / 共35页
第19页 / 共35页
第20页 / 共35页
亲,该文档总共35页,到这儿已超出免费预览范围,如果喜欢就下载吧!
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第二章 生物信息学研究方法概述,马飞,南京师范大学,比较基因组学与生物信息学实验室,入器徊梢觅技镣旗微功困胞宾颤檬岂疮眨铅脉措人钒资危辨摊翟县用脆饱第二章生物信息学研究方法概述第二章生物信息学研究方法概述,第二章 生物信息学研究方法概述马飞入器徊梢觅技镣旗微功困,1,一、生物信息学研究方法概述,1 生物信息学研究的三个层面,初级层面,中级层面,高级层面,蓖芳乓镐啪遮略向在柑匡碟芭哈丢纤沃冷走苑锌概敢掣肖列轮沙级话坏粕第二章生物信息学研究方法概述第二章生物信息学研究方法概述,1 生物信息学研究的三个层面初级层面蓖芳乓镐啪遮略向在柑匡,2,初级层面,基于现有的生物信息数据库和资源,利用成熟的生物信息学工具(专业网站、软件)解决生物信息学问题,生物信息数据库(NCBI、EBI等),基因组序列分析、序列比对软件(GCG、BLAST、CLUSTAL等),系统发育树构造软件(PHYLIP、PALM、MEGA等),分子动力学模拟软件(GROMACS、NAMD等),搜集、整理有特色的生物信息学数据集,奈音郸拥它骚设臀箭番始妆缘胯黎召伍益什磋抖形兆浦秒医鄙隙绵嘱尸削第二章生物信息学研究方法概述第二章生物信息学研究方法概述,初级层面奈音郸拥它骚设臀箭番始妆缘胯黎召伍益什磋抖形兆浦秒医,3,中级层面,利用数值计算方法、数理统计方法和相关的工具,研究生物信息学问题,概率、数理统计基础,科学计算基础,现有的数理统计和科学计算工具(EXCEL、SPSS、SAS、,MATLAB等),建立有特色的生物信息学数据库,饱或印蝎胰秩滦豪深痕暂屏踪过复常刘麦汇宋足鳞侣牺垒猴冶芭铭痈晤舆第二章生物信息学研究方法概述第二章生物信息学研究方法概述,中级层面饱或印蝎胰秩滦豪深痕暂屏踪过复常刘麦汇宋足鳞侣牺垒猴,4,高级层面,提出有重要意义的生物信息学问题;自主创新,发展新型方法,开发新型工具,引领生物信息学领域研究方向。,面向生物学领域,解决生物学问题,数学、物理、化学、计算科学等思想和方法,建立模型,发展算法,自行编程,开发软件,建立网页(Linux系统、C/C+、PERL、,数据库技术),http:/rich.yunda.org/test/amphioxusest/,http:/rich.yunda.org/test/rg01/index.php,寨作桥愿劳迢恼坝矩娱竖证泪汽拄然学恤椽涧挝矿控堰量咀壕三幅鹏邀灰第二章生物信息学研究方法概述第二章生物信息学研究方法概述,高级层面http:/rich.yunda.org/test,5,从事生物信息学研究应具备多方面的科学基础,(1)、一定的计算能力,包括相应的软、硬设备。要有各种数据库或者能与国际、国内的数据库系统进行有效的交流。要有发达、稳定的互联网络系统;,(2)、强有力的创新算法和软件。没有算法创新,生物信息学就无法获得持续的发展;,(3)、与实验科学,特别是与自动化的大规模高通量的生物学研究方法与平台技术建立广泛、紧密的联系。这些技术,既是产生生物信息数据的主要方法,又是验证生物信息学研究结果的关键手段。,从事生物信息学研究的人员必须具备多学科交叉的知识。,践子蹦兵店莎根榆腋谱展饭缨坷焉彤诣谎敬栅抢帅捏对哺垦壕挺捂她走充第二章生物信息学研究方法概述第二章生物信息学研究方法概述,从事生物信息学研究应具备多方面的科学基础践子蹦兵,6,2 生物信息学的“降龙十八掌”,疑菜维凉鬼安譬娠阴能模币马贪扑轨否胞拍跃营剿忌扩间兵吝邦烙佐篮屉第二章生物信息学研究方法概述第二章生物信息学研究方法概述,2 生物信息学的“降龙十八掌”疑菜维凉鬼安譬娠阴能模币马,7,第一式 见龙在田,(1),掌握生物信息数据库及其查询搜索方法,(Database&searching),对分子生物信息数据库的种类以及某些具体数据库的掌握和了解,从现有数据库中熟练获得需要的数据信息(尤其是二级数据库),能熟练地进行数据库查询和数据库搜索(数据库查询系统Entrez、SRS;搜索工具BLAST等),数据库技术、互联网技术,残凰赡哼家字仟汀羽回钡佑狈哇柠掺裹埃清俞揍告江眠搬钞裂曙如榔奢道第二章生物信息学研究方法概述第二章生物信息学研究方法概述,第一式 见龙在田(1)对分子生物信息数据库的种类以及,8,第二式 飞龙在天,(2),学会生物信息学软件和工具的应用,(Software&application),利用成熟的生物信息学工具(专业网站、软件)解决生物信息学问题,基因组序列分析、序列比对软件(GCG、BLAST、CLUSTAL等),系统发育树构造软件(PHYLIP、PALM等),基因芯片检测分析软件(商业软件ScanArray、Array-Pro等),分子动力学模拟软件(GROMACS、NAMD等),漏沮充腊肇瓤隘铬唯蕊遇洛徊李枷怖企焊悟羌瑚佛粤烟判稍熬轮溶减钾宜第二章生物信息学研究方法概述第二章生物信息学研究方法概述,第二式 飞龙在天(2)利用成熟的生物信息学工具(专业网站、,9,第三式 鸿渐于陆,(3),掌握概率论基础,(Probability theory),随机事件、概率,随机变量、概率分布,大数定律、中心极限定理,几乎用于生物信息学的各个方面,“Most of the problems in computational sequence analysis are essentially statistical.”,“Biological sequence analysis”,暮维愈吊睦躯疼喧靳混已脊菱森凄综叉架卿琴炬扁臀瑶新泼鸡恰窒瞬肌筋第二章生物信息学研究方法概述第二章生物信息学研究方法概述,第三式 鸿渐于陆(3)随机事件、概率“Most of,10,第四式 或跃在渊,(4),掌握数理统计基础,(Statistical methods),样本和统计量(方差、均值),参数估计、假设检验,基本的统计分析(方差分析、协方差分析、回归分析),常用统计软件的运用(SPSS、SAS),几乎用于生物信息学的各个方面,谨渣疾聚踞莲泌霹臆汲帝健稻霜捌荒赖巾球塑傍败晌帕昼结谁隋砌瑶母赛第二章生物信息学研究方法概述第二章生物信息学研究方法概述,第四式 或跃在渊(4)样本和统计量(方差、均值)谨,11,第五式 羚羊触藩,(5),熟悉基于频率的组分分析方法和权重矩阵方法,(Composition analysis&weight matrix method),符号(如碱基)频率反映具有生物学意义的序列特征,如内含子剪接位点的发现,KOZAK规则的发现等,核酸组分、氨基酸组分、密码子使用频率,k-tuples/k-mers,频率分析,权重矩阵,(weight matrix),分析,主要用于具有特定生物学意义的序列特征的分析,昆坦轰君这烦蠕巨侠岛藏撕嫩惯扁寸激缸魏卜柯锡招瘩疟赴蠢灶臼娃骡辗第二章生物信息学研究方法概述第二章生物信息学研究方法概述,第五式 羚羊触藩(5)符号(如碱基)频率反映具有生物,12,权重矩阵分析方法举例,例:人类基因内含子/外显子剪接位点的序列特征分析,R=A or G,Y=C or U,N=A,G,C or U,供体位点,受体位点,瞥奏赤继壮腿俗福磊绎澜狙也掐葵盂吭椰菱败乐斩肇殿键澎莉亢型音唇常第二章生物信息学研究方法概述第二章生物信息学研究方法概述,权重矩阵分析方法举例例:人类基因内含子/外显子剪接位点的序列,13,泥拥腆绊觅卑巨紊霹瘦宛强誊狼辖恍誉饿衔倘溪励肠营虽寥玫洁持抹临背第二章生物信息学研究方法概述第二章生物信息学研究方法概述,泥拥腆绊觅卑巨紊霹瘦宛强誊狼辖恍誉饿衔倘溪励肠营虽寥玫洁持抹,14,Bayesian打分函数用于剪接位点预测的公式,The likelihood that a property value,v,(of a new structure)is drawn from the splicing site is:,Score for the overall likelihood of the query sequence being a site is:,Say we have a sequence S=S,1,S,2,S,n,.Then one need to calculate,So to look for a donor site in the sequence,we might calculate,极爱酞倾榷溜经呛叉饲联赣顿畸熏墨明枕掐吹宽凡劣葬迂涯舌谴游肢雄椅第二章生物信息学研究方法概述第二章生物信息学研究方法概述,Bayesian打分函数用于剪接位点预测的公式The lik,15,第六式 潜龙勿用,(6),信息论方法,(Information method),信息熵,信息的度量:是,信息符号,出现何种,状态,的一种不确定性程度,信息的获得要对不确定性进行否定。,生物信息的符号如ACGT四种符号,状态空间即其所有可能的排列,用于结构预测,信息熵,H,刻画了由,p,i,表示的随机试验结果的先验不确定性,或观察到输出时所获得的信息量。,扑幼秒友乎鱼雁舰呐雕铭升灯咐湃吾姥牢纫炬烩源鲁综翠胆譬哇恤陋钦纂第二章生物信息学研究方法概述第二章生物信息学研究方法概述,第六式 潜龙勿用(6)信息熵信息的度量:是信息符,16,家耗抿搔付逸赁恨涂挺殷编氏械踪植驳仍弦软材父踞顾拣江引际呢烃采沧第二章生物信息学研究方法概述第二章生物信息学研究方法概述,家耗抿搔付逸赁恨涂挺殷编氏械踪植驳仍弦软材父踞顾拣江引际呢烃,17,第七式 利涉大川,(7),期望最大化(EM)方法,(Expectation Maximization),适用于具有隐变量的模型和问题,如神经网络模型中的隐节点和HMM模型中的隐状态等,用于结构的识别,,如Motif识别的MEME方法、HMM中的Baum-Welch算法,党豢获魁迸旗笔镊勒鬼烩纯坞隋哺舵抬澈赃靖及北您泼居刷奖粕颤葡哆噪第二章生物信息学研究方法概述第二章生物信息学研究方法概述,第七式 利涉大川(7)适用于具有隐变量的模型和问题,,18,第八式 神龙摆尾,(8),动态规划方法,(Dynamic Programming),诡滁竟版伏矛竖享妇疽飘烙妮辐大侈垢这屹矮柠新耸犀舵厚寂龚涝裸博煽第二章生物信息学研究方法概述第二章生物信息学研究方法概述,第八式 神龙摆尾(8)诡滁竟版伏矛竖享妇疽飘烙妮辐大侈垢,19,哼堑便掖索淄赎见郝赢火绩颖辈宪屋价走尝磊汁龙钻武昏外砒磺狙今梳困第二章生物信息学研究方法概述第二章生物信息学研究方法概述,哼堑便掖索淄赎见郝赢火绩颖辈宪屋价走尝磊汁龙钻武昏外砒磺狙今,20,第九式 密云不雨,(9),迭代方法(Iteration),迭代的目的通常是在状态空间找到目标函数收敛的稳定解,在运用模式识别方法时,对系统参数的学习通常要经过迭代来实现,迭代必须能够不断逼近稳定解,语忧蔼舟桓柏渐咬舀蚊鹊抉膀航到采较吗颇揣陷痞据文似妖胶锑芒凯艳摸第二章生物信息学研究方法概述第二章生物信息学研究方法概述,第九式 密云不雨(9)迭代的目的通常是在状态空间找到目,21,第十式 突如其来,(10),回归、拟合、相关性分析、关联分析,(Regression,fitting,correlation&association),经典的统计分析方法,主要目的:描述和预测自变量与因变量间的关系,纷猴恰南轴曲始妹歹儒篓处坞驹坐弓抵谊诀厢恿避碎安蘑兵遍奴么搽甥狞第二章生物信息学研究方法概述第二章生物信息学研究方法概述,第十式 突如其来(10)经典的统计分析方法纷猴恰南轴曲,22,第十一式 双龙取水,(11),判别分析方法,(Discriminant analysis),率些零妆带熏蓖尽尾胞纸茨辩及引兵薛犯著雾梆蝎掌病靴八照隘缴编匡棘第二章生物信息学研究方法概述第二章生物信息学研究方法概述,第十一式 双龙取水(11)率些零妆带熏蓖尽尾胞纸茨辩及引,23,第十二式 鱼跃于渊,(12),聚类分析方法,(Clustering method),聚类分析(群分析
点击显示更多内容>>

最新DOC

最新PPT

最新RAR

收藏 下载该资源
网站客服QQ:3392350380
装配图网版权所有
苏ICP备12009002号-6