UCSC Xena(https://xena.ucsc.edu) 是加州大学圣克鲁兹分校(UCSC)建立的癌症基因组数据库。该数据库收集并整合了已发表的多个公开的癌症基因组数据源,包括 TCGA、ICGC、TARGET 等,已成为癌症研究领域的重要资源。基于 UCSC Xena 数据库,研究人员可以整合不同癌症之间的基因表达、突变、拷贝数变异等数据探究癌症的发病机制和原理,筛选潜在的治疗靶点和药物。
然而,已有工具并未很好地实现对 UCSC Xena 数据库进行综合地可视化分析和挖掘。UCSCXenaShiny 是 Openbiox 在2019 年发起的开源项目,用于下载和可视化分析著名癌症数据库 UCSC Xena。UCSCXenaShiny 在2022年发表于学术期刊 Bioinformatics,目前已被下载 3 万余次,谷歌学术引用超过 40 次,是 Hiplot (ORG) 可视化分析网站进阶模块中的一个常用工具。
UCSCXenaShiny v2.0 将在原有功能的基础上,计划增加更多分析和可视化模块,以满足研究人员不断增长的需求。新版本将支持多组学数据的降维分析和可视化,泛癌环境中的相关性分析,差异表达基因列表的可视化和下载等功能。同时,项目还将探索与 cBioPortal 数据库的对接,为用户提供更全面的数据资源。总体上,本项目需要考虑如何设计用户友好的界面和交互功能,使用户能够轻松地使用我们开发的网页接口/R函数进行数据分析和可视化。你还需要考虑如何优化代码的性能和可重用性,以便其他开发人员可以轻松地在你的项目基础上进行扩展和修改。最后,你还需要考虑如何测试和验证你的代码,以确保工具的稳定和可靠性。
项目主要需求
- 支持多组学数据的的降维分析和可视化;
- 支持泛癌环境中某些变异与某些基因表达之间的相关性分析,例如KRAS突变的KRAS表达(WT vs. Mut);
- 泛瘤种实现某些突变/拷贝数变异状态的差异表达基因列表,提供可视化和下载;
- 待研究基因与某个通路/IOBR signature的相关性分析;
- TCGA新免疫浸润方法结果的补充;
- 一些功能特性的探索性研究:例如完成过滤模块中现有的分类合并实现,探索与 cBioPortal 的数据库的对接。
项目产出要求
- 新增4个以上的分析可视化模块和对应的接口函数;
- 优化对近年R版本和依赖包更新的支持。
项目技术要求
- 可以熟练使用R 语言/统计/绘图工具包;
- 了解 UCSCXenaShiny 开发框架(见论文:https://doi.org/10.1093/bioinformatics/btab561);
- 有 R 包、Shiny开发经验,Git/GitHub使用和协作开发经验优先;
- 有 UCSC Xena、TCGA、cBioPortal 癌症数据库使用经验优先。
项目成果仓库
https://github.com/openbiox/UCSCXenaShiny
成功参加本项目并且完成项目产出要求的同学可以获得什么呢?
- 由开源之夏活动主办方提供的 12000 元(进阶难度)现金奖励;
- 开源之夏活动主办方颁发的项目证书;
- Openbiox 社区额外提供的资助奖励,包括但不限于现金、服务器资源、书籍等;
- 技能点+N。
如果希望报名本项目的同学,可以提前联系本项目导师 Shawn,shixiang1994wang@gmail.com
ChatGPT4 说:学生时代参与开源项目建设可以收获什么?
- 技术能力的提升:通过参与实际项目,你可以学习到新的技术和工具,不断提升自己的编程能力、设计能力和解决问题的能力;
- 团队协作能力的培养:在开源项目中,你需要与来自世界各地的其他开发者一起协作,这有助于培养你的团队协作和沟通能力;
- 建立个人品牌和信誉:在开源社区中,你的贡献和成果可以被其他人看到,这有助于建立你的个人品牌和信誉。这对于将来找工作和发展职业生涯非常有帮助;
- 扩展人际关系:参与开源项目可以结识到很多志同道合的朋友和专业人士,拓展你的人际关系网络。这对于未来的职业发展和合作机会非常有价值;
- 提高自学能力:在开源项目中,你可能会遇到各种各样的问题,这需要自己查阅资料、向他人求教,从而锻炼自己的自学能力;
- 了解工程实践:参与开源项目可以让你了解软件工程的实际操作,如版本控制、代码审查、持续集成等,为将来的职业生涯打下基础;
- 为自己的简历增色:在求职过程中,参与过开源项目的经历会让你的简历更加丰富,提高你的竞争力;
- 成就感和满足感:参与开源项目,贡献自己的力量,能为全球用户创造价值,这会带给你很大的成就感和满足感。
总之,学生时代参与开源项目建设对个人技能的提升、职业发展和人际关系的建立都有很大帮助,是非常值得尝试的一种学习方式。
