会议详情 菜单
用R语言进行科研数据挖掘实战会议(线上)

用R语言进行科研数据挖掘实战会议(线上)

2021-06-26 08:30 至 2021-06-27 17:00

线上活动  

上海莫速乎教育投资有限公司   

50人

报名截止

推荐会议:2025年科技项目申报与科研平台建设运行、经费使用管理、综合绩效评价专题培训班(1月南京)

发票类型:增值税普通发票 增值税普通发票

参会凭证:

部分参会单位:

中国医学科学院医学信息研究所

-会议内容-

R语言进行科研数据挖掘实战会议

无实验无数据没关系,挖掘别人的数据,发表自己的文章

两天一夜高强度实训,讲究实战,所有经验和盘托出

会后赠讲课录像便于反复复习保障效果(加密播放不零售,保障学员优势权利)

2021/6/26-27  网络精讲班(会议时间两天&一晚)

莫速乎科研会议平台主办 

还在认为没有实验就不能发表论文?还在为不精通挖掘GEO,TCGA,SEER的数据库而痛苦不堪?还在为不知道如何找课题找靶点而苦恼?还在为不会那些高大上的图表而暗自伤神?快来参加莫速乎的科研数据挖掘实战专题学习班吧,挖掘别人的数据,发表自己的文章,一次学习,不再报班!

本会议由于带着明确的目的性去学习R语言,且针对有/无R语言基础的学员均具有很大宽容性,自开班起就广受好评。随着近年来生物信息学技术的普及,R语言是每个科研工作者都有必要掌握的技能,以往漫无目的的学习R效果不理想,用R去进行科研数据挖掘,既学习了R又解决了实际科研问题。


学完课程并掌握后能干什么:

学完课程并掌握后能收获什么技能?

1.没有课题的时候找到课题,没有机制的时候挖掘机制。

2.为基金申请保驾护航,发表paper如虎添翼

3.掌握R语言的核心技能,掌握批量分析数据的能力,掌握自我迭代的思维体系

4.掌握表达谱芯片数据,RNAseq转录组数据,甲基化芯片数据,GEO数据库和TCGA数据库等数据的处理

5.科研绘图:常见科研需求自我满足不求人,特殊需求实现自己定制高端大气。


这是一份带有诚意且注重实战的数据挖掘课程。我们的目标是:一次学习,不再报班。

课程特点


课程特点:

1.不留秘密,私货全出,全程只用R语言,关键步骤不隐藏。

2.第一天晚上时间充分利用,增加带有讲师指导的练习,更多的训练时间,更好的掌握。

3.讲最核心的知识,讲通用的数据挖掘技能,适合各个专业。学后可应用到其他数据库的挖掘。

4.空谈误国,实例操作(至少4个套路),让你快速掌握数据挖掘套路。

5.课程中使用卡片记忆法,帮助学员迅速牢靠地记住R语言知识点。

6.讲师阵容强大,内容丰富深入, 课程设计循序渐进,渐入佳境。


涉及议题:

1.如何使用生物信息学,在没有课题的时候如何找课题,在没有机制的找机制?

2.科研中细胞系处理的两大刚需,加药以及基因敲减,有什么好的分析方案可以让我们精准定位到下游核心分子?

3.为什么大部分公司给的分析结果都用不了啊,导师和我都很着急,怎么处理才能够变废为宝?

4.GEO表达谱芯片数据如何挖掘分析,才能避免画个热图火山图,聚类图就草草了事?

5.TCGA数据库中的数据,如何从下载到分析,到变成可以任意基因任意癌症轻松出图的清洁数据?

6.生存分析的多种方案,包含一个基因的生存分析,两个基因的生存分析,一群基因的生存分析,8秒完成2万个基因的批量相关性分析。

7.如何学会编程的看家本领,让重复的工作批量执行(批量分析,批量作图,批量处理文件)?

8.构建临床预后模型的完整方案是什么?

9.课题组比较关心免疫浸润分析,目前有哪些方案可以提供?

10.我入门的有点晚了,数据都被别人挖完了,有什么开挂的解决方案?

11.为什么做KEGG富集分析的时候,肝癌的数据会聚类出系统性红斑狼疮通路,我该怎么解释?

12.给你一个基因,在不做实验的情况下,你对他能了解到什么程度,以及能产生多少可放在文章中的数据?

13.给你两个基因,在不做实验的情况下,你对他们之间的关系能了解到什么程度,以及能产生多少可放在文章中的数据?

14.给你一群基因,在不做实验的情况下,你对他们能了解到什么程度,以及能产生多少可放在文章中的数据?

15.我做基础研究的,老板不需要纯生信的文章,数据挖掘怎么才能得体的用到自己课题上面来啊?

16.差异分析是数据挖掘的灵魂,那么小样本,大样本,配对样本,多分组样本的差异分析怎么做?

17.GSEA分析是富集分析的神器,他好在哪里,如何使用?如何用GSEA给自己的课题提速?

18.ceRNA如何分析,分析的前提是要掌握mRNA,lncRNA,miRNA的分析

19.目前的signature文章中有哪些埋好的雷等着你去踩?

20.那么多的GEO平台,如何以不变应万变地进行探针ID转换?

21.GEO多芯片数据如何批次矫正?

22.为什么ssGSEA算法是批次效应的终结者?

23.如何使用Guilt of association 方案注释手上的长链非编码RNA?

24.单基因GSEA的用途在哪里?为什么出来的结果跟我想要的不一样? 

25.我手上的样本有点多,WGCNA怎么做?

26.如何才能提取出转移和非转移配对的TCGA样本出来进行下一步分析?

27.我想进一步学习,但不想到处折腾了,有哪些你珍藏的资源推荐?

28.你是通过什么途径学会自己想要的技能的?有什么固定的流程么?

。。。


课程设计:

这么多的内容显然是无法在两天1晚的课程中讲完,否则都是浮光掠影,空有其表。

因此,我们根据科研人学习的四个层面,把课程分成了四个部分。


第1,学会手把手教学的技能:

这部分内容就是课程的主体, 两天1晚的直播课程,配合动画,记忆卡片,大量实操循序渐进让学员迅速入门

其中记忆卡片的使用,有效解决了"讲师口里一大堆,学员脑子一片白"的尴尬局面,这种情况会让学员迅速失去兴趣。

经过测试,即使是零基础的学员也能在第1天结束后记住所教的R语言知识点。


第2,看视频学会技能:

该部分内容是附加课程,需要课后打卡自学,目的是让学员多操多练,渐入佳境。

这部分技能比较硬核,不适合在课堂上讲解,需要学员在掌握基础技能的时候再慢慢深入。

避免出现"脑子会了,手说不会"等手脑不协调的窘境。


第3,看文字学会技能:

我们在课程的文档中穿插了100个文字教程,解决一些小而精巧的问题.

这部分技能训练的是学员自学的能力,有利于让学员形成自我迭代的能力。

在数据挖掘的过程中,并不是每一个技能都能找到合适的教程。

生信工作者长期在做的事情就是阅读文档。


第4,学会没有人教的技:

课程结束后布置涉及到高频操作的家庭作业,作为对课程的巩固和升华,需要学员在一月内提交然后讲师团队评阅。

这部分习题没有标准答案,类似于开放课题,要求学员通过自我学习,互相合作来完成。

学会没人教的技能,是数据挖掘的常态,你不能老是重复别人的套路,因为"既是套路,就为俗物,终将废物"。

我们希望将来在你思路到了的时候,要有能力从源头用代码来实现,而不是碰到了报错完全懵圈,不知进退。

这是数据挖掘的终极技能。


主讲人简介:

果子老师(果子学生信作者,在站博士后),在生信方面具有丰富经验,本次进行两天一晚的高强度实操训练,目标是让大家一次学习不再报班。

作为临床科研工作者,深知无课题之苦,因此愿将所学知识和盘托出,没有隐藏。

致力于给非生信专业人员普及生物信息学,擅长各种组学的处理,且讲课诙谐幽默。

适合人群:

广大临床/科研工作者及心有热血被困囚笼的研究生


时间地点:

2021/6/26-27  网络精讲班(会议时间两天&一晚)

 

-主办方介绍-

上海莫速乎教育投资有限公司 上海莫速乎教育投资有限公司

莫速乎科研教育,简称莫速乎,原名“多圈课堂”,创立于2012年12月,隶属于上海莫速乎教育投资有限公司。2014年3月更名为“莫速乎科研教育”,品牌名源于我国古代著名教育家《荀子·劝学》“学之经 莫速乎”。莫速乎旨在通过独创的EAT理念打造最易接收并最能提高实际技能的高清视频课程,以作为科研传统教育的补充或替代。同时将持续开展现场研讨班,以弥补视频课程之不足。EAT理念以荀子思想为根基,并从“学”的角度优化教学,且课程策划符合哲学的认识论规律,是目前“最符合人性”的教学理念。在课程策划方面,我们坚信每个小领域只需要一部课程,一部优秀的课程,经典的课程,足可供全国千百万人学习,莫速乎正是立志于打造每个小领域内的这一部课程。

课程安排:


日期

时间

内容安排


第一天

08:30-11:55

R语言基础知识介绍
R语言数据结构以及循环控制(向量,因子,矩阵,数据框,列表,for循环,if控制)
编写自己的第一个批量处理数据的程序

R语言中数据框的操作(增删改查)
真实数据的清洗和整理
R包以及bioconductor资源的使用
R包无敌安装攻略
R语言绘图系统

R语言读入以及写出数据








11:55-13:30

休息


13:30-17:00

使用卡片复习R语言基础姿势(两天中重复4次)

GEO数据库成套流程实战(数据清洗,热图,火山图,GO分析,KEGG分析,共表达分析)

GEO数据便捷实用的GSEA分析

GEO芯片的探针probe转化方法汇总

多个Geo芯片联合分析







 

17:00-18:00

休息


晚上

18:00-21:00

R语言数据框的操作练习(掌握tidyr和dplyr)
如何根据需求绘制一个漂亮的火山图(学习ggplot2)
使用R语言制作特定肿瘤所有基因表达的数据库

TCGA原始数据的下载(GDC方法和R包方法)

任意癌症任意基因在癌和癌旁的表达

如果有亚型,在不同亚型中的表达

如果有肿瘤有分期,在不同临床分期中的表达

单个基因在多个正常组织中的表达

单个基因在多个细胞系中的表达

单个基因在多个肿瘤中的表达

两个基因的相关性如何分析




第二天

08:30-11:55

差异分析(从counts数据开始整理表达数据,表达矩阵归一化,DESeq2)
提取mRNA矩阵

提取IncRNA矩阵

提取MiRNA矩阵

CeRNA网络构建

单基因的GSEA分析

神技能:注释任何一个基因包括长链非编码RNA


使用多种统计算法定位 signatures cox,lasso回归


生存分析
绘图美化
任意癌症中任意基因的生存分析
任意癌症中批量生存分析


TCGA文章的框架分析以及复现


答疑环节


11:55-13:30

休息


13:30-17:00

利用GEO和TCGA数据库找到课题
利用GEO和TCGA数据库发掘下游机制

如何利用GEO和TCGA数据库申请基金
如何利用GEO和TCGA数据库发表文章
现场完成一篇生信文章的所有图表
提出科研假设
根据科研假设下载整理数据导入R语言                              

在R语言中清洗和整理数据达到对应R包的要求

数据处理过程中调整分析策略
绘制各个部分需要的图表






​​​​​​​

-会议门票-

票种名称 价格 原价 票价说明
普通票 ¥3400 ¥3400 注册费包含网络直播平台费、专家讲课费及视频课程的费用。
会议标签:

R语言

温馨提示
酒店与住宿: 异地参会客户请注意,为防止会议临时变动,建议您先与活动家客服确认参会信息,再安排出行与住宿事宜。
退款规则: 活动各项资源需提前采购,购票后不支持退款,可以换人参加。

相关会议

分享到

QQ好友 QQ空间 微博 ×