「本文参与少数派 2019 年度征文 + 效率有心得」

去年9月份开学,一只脚正式踏进了科研圈。经过了一个多学期的学习,现在也总结了一些经验。所以今天就打算来聊聊,我在科研上面的一些方法和经验。但是,我的这些思考也只是经过了半年的迭代而已,可能还需要完善,但希望对你有用。

科研新人

幸运的课程

初来乍到,我其实对科研实际是干什么的,也不太懂。但是,所有现成的方法都是有迹可循,而这个就是应该被传承的经验与方法。我很庆幸,学校有两门 PhD 新生的必修课,分别是:

  • Comprehensive Studies in Selected Topics in Computer Science
  • Research in Computer Science

先来说说第一门课,课程的主要组织内容是 每周一门课请 Department 里面的 Professors 或者 Visiting Scholar 来给大家讲述一下他们对科研的理解与他们的研究课题。它没有太大的 Work load 给到学生,但是对学生拓宽他们对别的领域的理解,去除对科研的迷雾很有帮助。

诚然,有不少从本科直接读博士的学生,他们对行业或对某个领域的理解不深,仅仅是对某一名词觉得比较热门,感兴趣就选择了当前的导师做着一些未知的事情。但是,如果真的可以听一下自己导师做一遍现场 Presentation 你会有更好的理解自己要做什么。或者发现,自己真正感兴趣的反而是别的课题,也有方法与途径去协商转换,从而实现双赢。

这门课的另一个线下任务是要求学生去参加一些 Seminar 交流,然后写不少于 2000 个词的 Report。这其实很痛苦的,2000 个单词真的好多啊,也不属于自己的研究课题,但是在这其中,你学会了如何聆听别人的 Talk,学会了如何组织文字和语言去表达你听到了什么。毕竟,带着任务去听,和没有压力去听,那种认真程度是不一样的(笑)。

然后另外一门课,它的本质是一个 Mini Project,它不是一门常规的组织学生到课堂的课程,而是要求导师跟学生每周有不少于 2 个小时的 Meeting 交流,指导学生如何进行 Research,包括但不限于如何提出一个合格的 IDEA,如何组织实验,如何写一篇研究型的文章。

在这一门课程里,由于课程有截止时间,你会快速地大量学到自己的导师的一些技能和技巧,这将是一笔巨大的财富。而且,由于有强制性的要求,你将不会遇到一周都见不到导师一面的尴尬放羊状态,浪费时间。而在每一步的 Step by Step 的过程中,你逐渐掌握了 what is Research in actual(笑),然后你就可以在某些场合自如地交流,“I am a new researcher on xxx, and bla bla...”

我很幸运,作为一个新人,能有这样一个完善的流程指导我进入这个大门。也因为这是一个流程,所以它本质上是强制性的,减少了很多不必要的麻烦。同时,也给了导师一个更好认识你的机会。

两个微小的建议

当你初入江湖,迷茫不知道该干什么的时候,不妨认真地跟导师沟通一番,寻求一些经验。如果不能从导师那获得一些有用的经验,不妨主动去探索一些顶尖的大学是怎么教导学生去做科研的,模仿他们的方式总是比自己在黑暗中探索高效一些。

而另一方面,一个导师能教给你的东西,总是少于两个导师能教给你的东西。所以,please feel free to contact other supervisor for advise。尤其是一些较为年长的博士导师,我发现他们的思维里更加蕴藏着丰富的财富。一般情况下,导师们也是很乐意给学生帮助的。

科研方法

正如一千个读者就有一千个哈姆雷特一样,我认为每个人的方法都是不一样的,所以我的方法和观点可能不一定有普遍性,但也请希望不要过度指责。

区分概念

刚入门的时候,我一直在跟老板 argue 各种问题,也被折磨地死去活来,他总是在用各种看似不奇怪的概念但又极度抽象的概念来问我,在没有搞懂他们的区别之前,并不允许我做课题和相关的实验。

那他们是什么呢?

  • Research Topic
  • Research Domain
  • Research Problem
  • Research Challenge
  • Research Novelty

这几个名词,看似相近但又不尽相同,实在是折磨人的小妖精们。我花了快一个月的时间才搞懂它们真正的区别。但是在这里,我并不打算向读者去阐述我对它们的理解,一来是它们确实很难在文字/中文的语境下表达,二来是这个探索的过程也是一笔无形的财富。

所以我的建议是,如果你觉得自己还没有办法区分它们,不妨认真思考一下,在日常读 Paper 的过程中找出答案。当你有办法确定性得区别并找到真正的 Challenge 的时候,某些情况下,与之相应的 Solution 也随之浮现在你的脑海中了。

从新到更新 回顾旧

我相信很多人都听说过一个学习领域的经典模型。由于没有找到出处,所以我随手画了一张意思意思。

假设我们以一个黑色的圆形代表这整个世界现有的知识,你刚出生的你处于圆心的位置,对一切的东西都是未知。经历小学阶段的学习,你学会了浅绿色的知识;紧接着,中学阶段,掌握了黄色部分的知识;大学阶段,选择了自己喜欢的专业,朝着一个大方向继续学习这个领域内的知识;研究生阶段,你会自主地去探索当前比较前沿的知识,在某一个小小的子领域内触碰到当前知识的边界;而博士生阶段,你将面对孤独在这个子领域更进一步,扩展现有的知识,成功这个子子领域的专家。

但是引入了这个模型后,如果从历史的长河里面来看,如果每次都需要从圆心开始探索到边界,你将要耗费大量的时间才能真正开始属于你的 Research。所以更加常规的办法是关注最近两年内在顶会发表的相关文章,仔细阅读并跟上前沿的研究。然后你在逐步扩大知识边界的同时,也必会需要回顾前人当时为什么这么做去创新出一些特定的东西,所以研究的过程反而是前进和后退同时进行的。

然而,万事开头难,如果没有科研经历,要搞懂第一篇 Paper,也是比较吃力的。我这里给出的建议是,尽量先看 Technical Report 和 Survey 。这是两种比较特殊的 Research Paper。前者能够很好的告诉你目前技术的瓶颈是什么,从而让你思考和寻找真正的 Challenge 是什么;后者已经帮你总结了一个特定子领域的问题是什么以及目前的研究者们的 idea 和 solution,快速搞懂它能帮助你铺垫 Background 知识以及有了一个总览的全局观,但是如果要在这个子领域继续探索,深入阅读相关的每一篇论文还是必不可少的,然而它能使你事半功倍。

科研神器

说到科研,不得不提一下你肯定需要一款趁手的 论文管理 工具。目前来说比较流行的有:MendeleyEndnoteZotero 这三款工具。不管用什么软件,你都需要有一定的准则去使用和管理他们。

Inbox

首先不要过分追求阅读论文的数量,论文在精不在多。从 GTD 法则里面迁移来的经验,在这里也适用。你要思考的是,挑选合适的有深度的论文加入你的待阅读列表里面,而且建议这个列表的长度不要超过个位数。每一篇加入进去的 Paper,都应该被你快速阅读过 Abstract 然后判断它可能有价值的。

Classification

这个其实相对比较好理解,就像文件管理和书签管理一样,每个 Researcher 都不会仅有唯一一个子子领域的,不然真的遇到瓶颈,如果没有办法切换思路,那可能一辈子都无法绕过这个坎。多涉猎一些东西,它反而可能帮助你拓展思路去解决你的主研究领域的问题。对了,记得应该按一定的规则重命名文件,不然看到 p909-sivathanu.pdf 你真的能想起来它是什么吗?

Tags

对于同一个问题,往往有不少不同的方法去解决,在文章结构里面一般会有一章 Related Work,而人们传播性地用同一个类别名称去分类这些方法。参考他们,在论文管理软件里面,依据这些类别名称给 Paper 打上标签,能够帮助你快速索引被遗忘的某一技术,更重要的是在你自己需要写 Paper 的时候,Related Work 这一章几乎就是信手拈来的事情,只要你有好好维护这个 Tags。同样的,统一的 Highlight 颜色和符号也能帮你快速索引,比如红色高亮代表关键点,蓝色代表实验设置,+ - ? 分别代表某些信息点等。

Comment

我个人喜欢写一些总结性的东西,对于每一篇深度有思想的文章,我都喜欢给它们写上一些短小的话来 Summarize 文章里面的 idea,可能只有一句话,也可能像微博一样有 140 词的短文,只要它能正确描述就好了,毕竟人类总是健忘的。每当你没有太多想法的时候,一篇一篇看这些 Idea Summary 也能使你提起斗志,去投入到枯燥的科研中,亦或者偶然发现某个 Idea 正好能解决你当前的困境。

真正的科研神器并不是某一款好得不得了的软件,而是如何指导你使用它们的方法论,在我的世界观里,工具永远在变,不变的是在背后支撑这套工具的理论。后面有机会我再专门写一篇文章来介绍我的工作流吧,用最趁手的工具尽可能自动化这一切。

科研好物

最后,分享一个超好用的科研好物,帮助你解决颈椎病问题(笑)。其实就是一个平面支架,但是它有可调节的活动支点,可以变换出不同的模式。

  • 坐姿阅读模式
  • 站姿阅读模式
  • 书写模式

稳定性和外观都无可挑剔,不用每天长时间低着头写字真的太棒了~~~

以上,就是我在科研路上提高效率的一些方法感悟,感谢阅读。