-
改版并重新录制的R语言数据挖掘大课来啦!
一起学习,共同进步。
-
视频小教程_如何画出没有教程的图?
最近有人在群里提问,下面的热图该怎么画。这张热图,在每一个格子里面用对角线一分为二,呈现了两类信息。图片来自于这篇文章的图1D。通常,遇到这种需求,我都会直接检索,看看有没有现成的R包可用。可以提取检索词检索一下,这里主要信息应该是"对角线热图R语言",查阅字典后,关键词就变成了
-
视频小教程_R语言中的批量操作
(本次操作有配套的视频教程,在果子学生信公众号回复“果子爱批量”自行获取,和代码一起以project的形式分享)目前而言,我学R语言,受益最大的是批量操作。比如,我们可以实现批量计算2万个基因的生存分析。这里有个例子:8秒完成2万个基因的生存分析,人人都可以!如果更猛一点,用双基因来分开样本,可以实
-
果子的TCGA教程汇总,持续更新。
首先看这几个帖子:从GDC下载TCGA肿瘤数据库的数据把GDC下载的多个TCGA文件批量读入RTGCA数据的标准化以及差异分析很有诚意!人人可做的转录组数据下游分析下面几个也可以看看TCGA真实数据下的批量生存分析TCGA提取非编码RNA并完成下游分析GTF文件有什么用啊?别的不谈,最起码能提ln
-
果子的GEO芯片分析教程汇总, 持续更新。
这是个导航帖,可以有效解决芯片分析的大部分问题。内容抵得上一个GEO的培训班。首先用20%的精力解决80%的分析,可以看这篇,可以对GEO表达谱芯片有个大致的了解来完成你的生信作业,这是最有诚意的GEO数据库教程在果子学生信公众号回复"果子学生信",可以自助获取R语言环境的配置教
-
dplyr需要掌握的6个函数
dplyr是我十分喜欢的包,这里面需要掌握的函数并不多,但是很有用。数据集介绍这次我们使用R语言内置的数据集iris来示范鸢尾花(iris)是数据挖掘常用到的一个数据集这个数据集150行,5列该数据包含150种鸢尾花的信息每50种取自三个鸢尾花种之一(setosa,versicolour或vir
-
group_by和summrise连用后,分组计算就很方便!
关于分组计算这个话题,我在写过的那些帖子里面,经常用到的就是group_by联合summarise比如多探针求最大值,多甲基化位点求平均值,TCGA中miRNA求最大值GEO芯片中多个探针对应一个基因,是求平均值还是保留最大值?批量读入TCGA的miRNA数据(注意细节)R语言学习路上的忆苦思甜凡是
-
30分钟的教程写了13年,这回正则表达式有救了!
关于正则表达式一定要看完,收藏就是雪藏。如果我们要在一段mRNA序列里查找起始密码子“ATG”的位置,在word中使用查找就可以,也可以使用快捷键Ctrl+F,输入ATG就行。这是常规操作,人人都会。但是如果我们要寻找一段CDS区(蛋白编码序列),他通常是以ATG起始,以TGA,TAG,TAA三个中
-
我喜欢的gather快要被淘汰了,好在来了更好的宽长转换工具!
果子唠嗑不断地有人问我,你的简书文章哪里去了。很难受,我的简书被封掉了。而我一直把简书当作写作工具在使用,也一直在蹭他的图床。今天在熊的帮助下,我用上了新的markdown工具,用上了自己的图床,工作又可以开展了。具体的过程在明天的帖子里面。(在发这个帖子的过程中,又获得了熊的极其骚的操作,我现在跪