大家好,欢迎来到IT知识分享网。
一 热图
识图能力停留在只会看高中函数图象的自己,除了看热闹,完全不知道这一幅幅图代表着什么意思,看不懂图成了我们读文献的第一道坎。有句话说得好,三分文章七分图,一幅精美的Figure在一篇文献中的地位举足轻重,所以,想要速读文献,抓住重点,就要练就一眼看懂图的本领。话不多说,图来了!
初读文献时,大家一定经常见到这种热图,花花绿绿,很是高大上!但其实它是数据表现的入门必备技术,相对也比较简单,那它到底有什么用呢?大家先来看这张表:请在三秒钟内指出表中哪一块的数字较大?
黑人问号脸?三秒钟我一行数据都看不完!
但是如果看下面这张图,告诉你红色代表数字较大,原谅色代表数字较小:
大家是不是一眼就可以找到较大的数字在哪里!没错,这就是热图!热图(Heat map)是一个以颜色变化来显示数据的矩阵。它的用途主要包括两大方面:1)直观展示重点研究对象的表达量及数据差异变化情况;2)呈现多样本或多基因表达量的聚类关系。其实天下各图本一家,和函数图像一样,只要搞懂纵坐标,横坐标代表什么,那么这幅图要表达的意思也就呼之欲出了。
比如这幅图,要怎么看呢?我们先把它分成五部分:
①就是它的横坐标,代表样本;
②是它的纵坐标,代表基因,此外还表示红色代表高表达,绿色代表低表达;
③是它的主体部分,代表各个基因在样本中的表达情况;
④表示这些样本共分为了两类;
⑤是对这些基因表达模式的聚类分析的树形图。
所以这幅图要表达的意思是这8种基因在两类样本中的表达情况,大家可以直观的看到天蓝色的样本某些区域要比粉红色样本更红一些,也就是这些基因表达量更高一些。
通过对数据进行这样的可视化处理以后,我们就可以很清楚的看到两类样本基因表达含量的差异性,从而帮助我们抓住研究重点,对差异性进行进一步的分析。
二 柱状图
这里的柱状图分为柱状图、堆积柱状图、浮动柱状图。在解读柱状图之前,先来为大家讲讲其中的一些核心组成部分。误差棒是在柱状图中经常出现的,误差棒就是在统计图中表示误差的线段,此处有三个概念要向大家介绍,分别是标准差(SD)、标准误(SE)和间接表达误差的指标置信区间。标准差实际上反映的是数据点的波动情况,标准误是均值的波动情况。而置信区间(Cl)我们最常用的则是95%Cl=(均值-1.96SE,均值+1.96SE),以下为误差棒的一些图像表示:
柱状图用于比较不同类别或组别之间的数据量或数据关系,它通过绘制垂直或水平的矩形柱来表示各个类别的数据,柱的高度或长度表示相应数据的大小或数量,典型适用场景如下:
1、数据比较:高低大小一目了然;
2、类别分布展示:数据的组成或分布特征十分清晰;
3、时间序列数据:可以通过观察数据随时间的变化,帮助读者分析趋势、季节性变化或其他时间相关的特征;
4、多维数据比较:通过在同一个柱状图中绘制不同类别和变量的柱形,可以同时比较它们的数据量、数量或频率,帮助读者理解不同变量之间的关系和差异。
其次讲到堆积柱状图,堆积柱状图是一种柱状图的变体,通过在同一柱形上堆叠不同类别的矩形柱来表示数据每个类别的矩形柱在整个柱形上的高度表示该类别的数据量,而各个类别内部的分布通过柱形的分割来展示,典型适用场景如下:1、多维数据比较:堆积柱状图适合用于展示各个类别内部的分布情况。通过堆积的方式,将不同类别的数据在同一柱形上进行可视化;2、变化趋势分析:通过在不同时间点或时间段绘制堆积柱状图,可以直观地观察类别之间的变化趋势和整体分布的变化情况。
浮动柱状图也是一种柱状图的变体,用于显示具有起始值和终止值的数据区间或时间段。每个数据区间由一个水平的矩形柱表示,起始值和终止值决定了柱形的长度和位置,典型适用场景有:
1、时间段比较-浮动柱状图适合用于比较不同时间段或时间段之间的数据区间。通过绘制具有起始值和终止值的柱形,可以直观地显示时间段的持续时间和数据区间的差异,帮助读者理解和比较时间段内的事件、过程或现象;
2、任务进度展示:起始值与终止值表示任务或项目的开始和结束时间,柱形的长度表示任务或项目的持续时间,读者可以直观地了解各个任务或项目的进度或时间跨度;
3、资源利用比较:浮动柱状图可以清晰地展示每个资源的起始值和终止值,读者可以对比资源之间的利用差异和时间分布。
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/123484.html