简述
本课是生物信息学算法的第一部分, 内容主要是一些生物信息学里的算法。主要对应以下主题:基因组合,DNA和蛋白质序列比对,regulatory motifs(调控特征序列?),基因重组分析,蛋白质识别等
概述
人类基因序列点燃了生物学里的计算革命。于是,现代生物学和其他科学领域一样,产生了很多新的算法。计算机科学与生物学之间的新关联,影响了我们向计算机科学家教授应用算法的方式。
基因序列只是无数生物学问题中的一个,但与计算方法有着解不开的关系,需要计算方法来解决。 在本课程中,我们将覆盖一些现代生物学中的基本算法思想。 计算概念,如动态规划和图论,能帮助我们探索各种算法,以便应用于大量生物学课题中,课题可以从寻找regulatory motifs(调控特征序列?)到确定人类基因的“脆弱”区域。课程进行过程中,各种生物学算法将被应用于实际的基因数据上。
本课的每一章节会涵盖单个生物学问题,并细致地构建相应算法知识来解决这个挑战性问题。通过这种方式, 编码挑战及练习(很多会要求你将新学到的技能应用到实际的基因数据上)就能无缝整合到教学情景中。
授课大纲
本课将分成6章,包含以下核心问题,及括号中相应的用于解决问题的算法思想。
- DNA序列重复的起始位置?(算法热身)
- 如何制定抗生素使用顺序?(暴力算法,穷举)
- 哪种DNA模式作为细胞锁?(贪心和随机算法)
- 如何进行基因序列的组合?(图算法)
- 如何比较生物学里的序列?(动态规划算法)
- 基因中是否存在脆弱区域?(组合算法)
本课的分数来自每周的若干编程挑战和每个章节末尾的测试。
生物信息学算法(部分2) 将包含以下问题:
- 哪个动物给人类带来了非典? (进化树)
- 如何定位致病突变基因位置? (组合模式匹配)
- 酵母怎么成为了啤酒制造商? (聚类算法)
- 为什么还没有艾滋病的疫苗? (隐马尔可夫模型)
- 霸王龙其实就是大号的小鸡? (可计算蛋白质)
- 人口体现了何种的基因特征? (主成分分析)
先修知识
一点编程基础,语言不限。以下是我们推荐的编程学习资源:
- Codecademy, 特别是Python
- Coursera课程 An Introduction to Interactive Programming with Python
- Rosalind上的引导问题, 这是本课教师创建的生物信息学学习网址。
参考资料
略
授课形式
除了教学视频, 没说什么,略。
常见问题解答
-
课程有证书吗? 是的, 完成本课的学生将有我们签名的完成声明。
-
课程有认证证书吗? 是的, 想要认证证书,请选本课的 Signature Track 方式。
this guy is lazy, nothing leave
comments powered by Disqus