导言

数据可视化在科研工作中发挥着越来越重要的作用。基于可视化图形,我们可以更好地展示科研数据中的主要特征和规律。以生物医学为例,大多数临床医学学生和初级科研工作者一般需要花费数十天乃至数月的时间去熟悉和掌握常用的数据可视化工具,如 SPSS、Origin 和 Graphpad。之后才有可能去完成部分基础的数据统计分析和可视化。 如果是要专门从事数据分析和建模方向的相关人员则还需额外学习一门甚至数门编程语言(如 MATLAB、R 和 Python )。而要达到能够自由探索数据的水平则还需要额外花费更多时间去深入学习和进阶。

近年来,随着各类云计算平台(如生物医学领域的 Galaxy 和 DNAnexus)、相关 IT 软硬件基础设施的发展(如分布式计算、容器技术、软件包管理器、数据分析流程构建框架等),初级科研工作者已经可以相对比较轻松地获取相关数据的上游分析结果。特别是当常规组学数据的上游分析流程趋于稳定和完善,数据上游分析流程的可自定义程度和可变程度已经大大降低。而数据分析下游流程中的可视化和个性化深度解读已经成为当前用户面临的最大挑战:

  1. 开源用户社区开发的可视化软件或方法大多还没有很好的整合在一个统一的用户接口之下;
  2. 国内缺少活跃的针对科研数据可视化的协作社区,"** 画图群" 成为初级科研用户为数不多的选择;
  3. 国内缺少类似于 Graphpad、MATLAB 核心数据可视化软件和平台,在被美国禁用之后,只能花费额外成本进行流程迁移或重头开始开发;
  4. 国内外开发的一些平台和工具用户体验一般:用户界面不够美观;中英文支持的屈指可数;上手仍然有一定难度;部分平台的文件管理不太方便;用户能够主动参与平台建设的屈指可数;
  5. 相关数据可视化工具仍然相对匮乏,杂志和用户需求旺盛,已发布多年的 Circos 圆圈图可视化,通过封装一些便捷操作就可以发表文章:
  • Rasche H, Hiltemann S. Galactic Circos: User-friendly Circos plots within the Galaxy platform. Gigascience. 2020;9(6):giaa065. doi:10.1093/gigascience/giaa065;
  • Marx H, Coon JJ. MS-Helios: a Circos wrapper to visualize multi-omic datasets. BMC Bioinformatics. 2019;20(1):21. Published 2019 Jan 11. doi:10.1186/s12859-018-2564-9; Yu Y, Ouyang Y, Yao W.
  • shinyCircos: an R/Shiny application for interactive creation of Circos plot. Bioinformatics. 2018;34(7):1229-1231. doi:10.1093/bioinformatics/btx763)

Hiplot 简介

Hiplot (https://hiplot.com.cn) 是由生物信息学开源社区 openbiox 于 2019 年 10 月发起,并在新冠疫情爆发后快速发展的一个社区开发项目:致力于建立一个快速迭代、支持中英文环境的科研数据可视化平台和协作社区。

目前该平台建设初具规模,已提供 60 余种基于 R 语言的基础可视化的功能:

基础绘图(1)
基础绘图(2)
进阶绘图
开源书籍
基础绘图示例(seqlogo)
基础绘图示例(双侧标准化图)
基础绘图示例(比例韦恩图)

Hiplot 的初心是希望能够建立起一个由国内开发者主导的综合科研数据可视化平台,以解决广大临床医学学生和其他科研工作者的科研可视化需求:


1. 基础可视化:覆盖大多数基础的科研可视化功能,参照 SPSS、GraphPad、国内外开发的相关可视化软件和工具

2. 进阶可视化:包括 Shiny 在内的复杂可视化图形和应用;文献图表的重现和再分析;新的可视化图形展示插件:如基于 Circos、circlize 的二次开发;openbiox 社区贡献的可视化应用(如 UCSCXenaShiny 和 bioshiny)

3. 其他任务:低计算量的其他任务(如文献数据资源下载、简单的文本挖掘、微生物组学分析等)

4. 文件管理(支持上传、下载、复制、移动、删除、在线预览和编辑等操作)

树形文件浏览和管理(支持上传、下载、复制、移动、删除)
文件上传窗口
表格文件在线查看和编辑(XLSX/CSV/TXT)
文献原文和附录下载任务(基于 openbiox 社区 bget 项目)
文献原文和附录下载任务(基于 openbiox 社区 bget 项目)

为了让更多普通用户可以体验 Hiplot 的绘图功能,我们已经面向所有普通用户开放了基础模块和部分进阶模块的免注册使用。而面向参与内测的注册用户,我们则提供了更多额外功能:所有进阶绘图模块和附加模块绘图插件、保存绘图历史记录、编程语言接口、RESTful APIs、下载 TIFF/PPT 格式文件、下载 .Rdata 绘图对象文件、一键导出所有结果等。

自 7 月 19 日开放内测用户注册以来,平台网站访问量达到 2 万余次,参与 Hiplot 协作开发的梯队人员发展到近 20 人。基本形成了开发人员和普通用户互相促进的良好正反馈机制,循序渐进,不断推进着平台的优化与迭代。

如果你愿意参与我们的内测或者直接参与到 Hiplot 平台的开发协作中来,欢迎扫描下方二维码进行登记:

当然,你也可以直接通过网站的主页右上方的求助与反馈按钮与我们进行沟通。

开发者福利

如果你有优质的科研数据分析应用,但是没有好看的 UI,没有服务器资源,无法推广。欢迎与我们联系,将应用部署到 Hiplot 平台。在 Hiplot 部署应用的几大好处:

1. 强劲的硬件支撑

强劲的服务器集群作为你最坚强的后盾(可供扩展的高性能节点,每节点支持 80v CPU,512G 内存及 100T 高 IO 存储),我们将为每个 app 提供合理和充裕的硬件资源分配。

2. 强大的技术支持

在你提交自己的应用后,我们会有专业的技术人员对接,对应用进行 1 对 1 的 UI 设计及性能优化,让你的应用体验更上一层楼。

3. 广阔的使用人群

Hiplot 应用人群覆盖面广阔;同时对接多个科研媒体平台,可以让你的应用在极短的时间内获取极高的使用。

4. 远大的个人前景

对于 app 自身而言,不断地有人使用会催生其顽强的生命力,这同时也对开发者本人提出了很高的要求。要求开发人员必须不断地学习文献、学习技术,提升自己的能力。对于优秀的应用开发人员,Hiplot 团队会有一整套从基础开发人员到核心开发人员的培育体系,并有机会加入生物信息开源社区 openbiox。对于每一位开发人员来说,都是提升自我的有效途径,对于个人成长非常重要。

写在最后

长风破浪会有时,直挂云帆济沧海。希望 Hiplot 项目可以不忘初心,一直长久维护下去,不骄不躁,持续稳步发展。