bioinfo-course
Bioinformatics learning^-^Hope to see progress day by day
姓名:姚茗子
学号:2024030045
专业:临床医学类(协和)
本学期生物信息学学习计划
整体目标:
从了解和练习基本的Linux操作开始,通过生物信息所需的计算语言(Bash, R, Python等)的编程训练,逐步掌握生物信息学在新一代高通量测序数据上的基本分析方法。在实践中不断收获!
一、Getting Started & Basic Analyses(Week 1 - Week 4)
Week 1:
- 理解各种工具概念,搭建好环境;
- 规范化GitHub repository,开始用Markdown记录本学期学习过程。
Week 2-4:
- 熟练使用
grep, awk, sed, cut等Linux基础命令(文件操作、权限管理等),能独立在终端执行生信工具命令,要能熟练编写Bash脚本来串联分析步骤。
- 开始尝试做Basic Analyses, 掌握Blast的基本原理,能将临床样本的基因序列与数据库比对,分析突变位点;
二、NGS Data Analyses(Week 5 - Week 12)
Week 5-6:
- 快速上手R语言的基础与数据可视化(ggplot2)。(热图、火山图、PCA图等)
- 掌握Bowtie进行Reads Mapping,并熟练使用bedtools和samtools等工具处理基因组特征数据。
Week 7-8:
- 转录组学与差异表达分析。
- 攻克RNA-seq数据流,从表达矩阵的构建到差异表达分析。
- 掌握GO/KEGG聚类分析和GSEA(基因集富集分析),理解如何将数字转化为生物学功能通路。
Week 9-12:
- 表观遗传学与网络分析。
- 学习ChIP-seq和CLIP-seq的分析流程,理解Motif和RNA调控网络。
- 探索如何利用共表达网络和miRNA靶向预测寻找潜在的疾病靶点。利用五一长假多看看运用了相关生信作图分析方法的文献^-^
三、Machine Learning & AI(Week 13 - Week 16)
Week 13-16:
- 机器学习基础(降维、聚类等经典算法)。
- 结合生信数据进行实操训练。
期末 Final Project:考虑结合RNA-seq差异表达分析流程与Python机器学习基础,尝试复现一篇高质量临床医学文献中的单细胞或转录组分析图表,探索特定疾病靶点的预测。
学习笔记持续更新中