本文参与年度征文活动「记录」赛道。


2024 年,时间仿佛被拉长,经历了比以往更为丰富的体验。虽然这一年没写几篇少数派,但提笔总结时,却发现有太多感悟值得记录,一时竟不知从何说起。

这一年,我依旧在探索,在挣扎,在寻找属于自己的破轨之路

作为一个计算机专业的博士生,我始终担心在实验室里闭门造车,最终做的工作与现实脱节。因此,今年我选择走出象牙塔,进入工业界实习,先后加入了华为 2012 实验室和字节跳动豆包大模型团队。这两段经历,不仅让我更坚定了自己的理想,也刷新了我对行业和自身的认知,促使我重新思考未来的发展方向。

初入职场:新鲜感褪去后的体验

初到一个崭新的工作环境,总会带着一层滤镜,一切都显得很好。然而,当这层滤镜褪去,华为和字节的工作环境便呈现出截然不同的面貌,各有千秋。

在华为的实习部门是 2012 网络组,属于预研部门,工作内容和校园里极其相似。朝九晚五,每天就在工位上思考算法,读读论文,码码代码。实习的研究课题隶属于校企合作项目,每周要向导师汇报项目进展,本质上更像是借华为的工位为实验室工作。

正因如此,这份实习工作并没有超出我的舒适圈,随着时间的推移,我逐渐感到乏味。五月底,我将华为的工作总结成论文投出后,萌生了换个环境实习的想法。如今回想起来,只能感叹一句:小年轻就是闲不下来,非要找点苦吃。

在我寻找新机会时,字节跳动的 HR 主动联系了我。尽管我对字节的印象是急功近利,缺乏探索性工作,不太适合博士生实习,但“字节和心脏只有一个能跳动”的传闻激起了我的好奇心。既然想给自己上点强度,何不直接挑战最卷的公司?于是,我就抱着试试看的态度接受了面试,并且最终拿到了 offer。

我的实习部门是豆包大模型基础模型团队。入职前,我担心实习生只能做重复性劳动,但事实证明我多虑了。这里不像华为那样,对实习生和正式员工的区分不明显,我承担的工作与正式员工无异。由于从事基础大模型系统优化,几乎没有重复性劳动,反而常常一整天忙碌却毫无进展,因为完全是在无人区摸索,碰壁成了常态,甚至连求助都找不到方向。就这样,我如愿以偿地进入了“高强度”工作环境。

以终为始:每一个分叉口的抉择

这一年的经历让我深刻认识到,比埋头做事更重要的,是明确自己真正想要什么。只有目标清晰,周围的人才有机会「帮助」你实现它。

上面的流水账或许让人觉得这些经历顺理成章,但在平行宇宙中,也许存在另一个选择了不同道路的我。而如今的我,之所以做出这些选择,是因为一直想「做出一项有影响力的工作」。

第一次抉择:脱离科研舒适圈

将时间拨回到2023年底,我面临两个校企合作项目的选择,都和华为有关,但部门和研究课题截然不同。第一个课题是研究可编程网络的其他应用,旨在让计算机网络承担更多传输以外的职责。第二个课题则是研究大模型训练系统中的网络优化,这是一个热门但竞争激烈、门槛高的方向。

从发论文的角度看,可编程网络方向更容易出成果,因为我有研究积累,并且是一个相对小众的方向。而大模型训练系统则更加热门,也更具挑战。热门往往意味着更大的影响力,没人看的论文不如不发。因此,我选择了第二个课题,踏入了大模型训练系统的领域。

第二次抉择:向产业前沿跨越

华为2012虽然已经算是工业界,但是终究还是在公司里做科研,离真正的产业还是有一定距离。所以有时候看着各种大模型新闻,总是感觉自己还是局外人,总有一种想要入局的冲动。带着这样一个想法,我才开始寻找新的实习机会。

微软亚研院,从大学本科开始就是我的白月光,也是我的首选公司。但是接触了几个老师,发现都不是我想做的方向。此时正值字节hr推进面试,面试官是我在海外师兄的同门。这个师兄在微软总部,面完之后,我在微信上询问了他关于微软和字节的对比。他说字节是一个有活力的地方,并且卡也很多,他的同门也是一个很nice的人,建议我去字节实习。在他的影响下,我最终选择了字节。

第三次抉择:为理想接受代价

我们实验室是不允许学生出去实习的。但我管不了那么多,一心想要逃离现状,并且认为如果我直接参与秋招,在大模型赛道上没有足够的竞争力。拿到实习offer后,还需要过导师这一关。我第一时间给导师打电话,表明自己想要实习的意愿。导师也很理解我的诉求,于是让我延毕一年出去实习。我接受了这个条件,因为我终于有机会去看看业界前沿的工作是怎么做出来的。

也许是因为我尽早告诉mentor自己的想法,他没给我安排什么脏活累活,而是给我制定了一个偏长期的科研项目作为主要工作内容。组会的时候,我发觉现在的科研团队,各个都做出过受业内关注的工作,也算是误打误撞入局。

在以上抉择中,只有明确的目标,才能让周围的人有机会「帮助」我:

  1. 明确自己不想水论文,而是想做一些有意义的工作,实验室才能给我安排华为2012的合作项目,让我有机会接触最热门的科研方向。
  2. 明确自己想要参与专业的团队,做前沿工作,师兄才能给我合适的建议,最终来到字节,有幸结识了一群聪明且勤奋的同事。
  3. 同样明确自己想要做有挑战的事,而不是拿个博士学位毕业了事,才会接受延毕一年的代价。如果参与了当时的秋招,也许会仓皇地找一个工作,最终发觉自己并不喜欢它。
  4. 明确自己实习的目标是发表论文,mentor 才能给我制定一个偏长期的科研项目,并且在新的团队体验到了不一样的科研氛围和合作方式。

人生切割术:重塑工作与生活的边界

社会化的第一步

没有在北京出租屋合租过,就不算北漂。一开始来北京实习的日子,和8个人合租了一个四室一厅。同屋合租的有一家四口,一对母子,一个同为字节的员工和另一个小伙子(住在储藏室)。

这对母子就住在我隔壁,母亲应该是陪小孩在附近上小学。每天早上七点就会喊小孩起床。小孩喜欢赖床,他妈妈就会恨铁不成钢的教育他,然后就能听到母亲的打骂声混合着小孩的哭声。由于隔音不好,顺便就把我喊醒了。另一家人是带着婴儿的,深夜就能隐约听到屋子里传来孩童的啼哭声。不管白天出门还是夜晚回家,都能看到唯一的那个小伙子在合租房的客厅玩电脑。至于那个字节的员工,在合租的半年里,就在电梯里见到一次,还是后脑勺,只有在十一二点听到他房门转动钥匙的声音才知道他下班了。

年底房子到期了,师弟也来北京实习了,就和他一起租了一间两室一厅。从居住体验来说,和熟人一起住一整间房固然最舒服,再也不用在上厕所之前做心理准备了。缺点就是生活快速地收敛到宿舍——公司两点一线的老状态。

原先由于合租的屋子没那么舒服,即使是周末我也会尽可能地约人出去玩,而不是呆在家里躺着。而现在,我更喜欢周末在屋子里打一整天的游戏,完全不用担心扰民。

合租的噪音就像副歌,让生活这首曲子完整。

北京的小屋

公司人格的形成

在最开始的新鲜感消除之后,工作对生活带来的负面影响逐渐占据上风。上一天班回到家里,总是会有些恍惚,明明早上刚打开喝了一口的水,感觉像是摆了一周没人动过。在家中的体验,完完全全的被工作割离出去,就像《人生切割术》。

在公司里,我也感觉患上了失语症,吃饭的时候,即使内心想要聊一些工作以外的话题,也不知道聊什么。所以大部分时间和同事就是坐在一起默默无言地干饭。

公司里的环境让人不得不时刻保持专注力,专注的越久,就越难再下班后回归生活。脑子像被一根绳子拽住,不停地思考工作中的问题。只能寄希望于另一根强有力的线把注意力给拉回来,唯有刷短视频,或者游戏能够抗衡。然后再过两个小时的缓冲,才能够静下心来看看书,准备睡觉。

在这样的工作状态下,是能够具象地感受到自己的生命力被抽走。有时候想着今天没什么事,可以早点回去看看书或者写写文章。结果吃完饭之后被临时喊住解决一个问题,经过一两个小时,再回家只想躺在自己的懒人沙发上刷刷b站。

当工作能够快速异化一个人,人格分离手术就是不人道中仅存的人道吧。

人文滋养的浅尝

借助上半年在华为的工作成果,我有幸前往比利时参加了一场学术会议。会议地点并非布鲁塞尔或安特卫普这样的国际都市,而是比利时第五大城市——沙勒罗瓦。这座小城让我体验到了相对地道的欧洲生活。

平平无奇的欧洲小城

沙勒罗瓦给我的第一印象就是“慢”。抵达的那天正值周末,按惯例几乎所有店铺都关门歇业,只有家乐福这样的连锁超市营业到晚上6点。我们办理完入住后,便去超市买了些蔬菜和肉类,回住处自己做饭。无论何时,街上总是只有零零散散的几个行人,慢悠悠地走着。偶尔能看到穿着外卖服的小哥,三两成群地坐在广场长椅上聊天,或许是在等单,也可能是在休息。

开会时还碰到一个小插曲,让我久违地体会到一次人文关怀。由于签证问题,一些团队无法到场演讲,就请我帮忙放他们提前录好的演讲视频。由于他们团队没有提前邮件知会委员会,这样的操作是不符合规定的。在我上台打开准备好的视频后,他们问我为什么要这样做,制止了我的行为,并且激烈地讨论应该怎么处理这样的情况。我就只好下台了。

下台之后,我就在座位上坐着,会议主席看到了,立马走到我的身边,安慰我,说了一大堆话,我其实并没有听懂,但是他一遍又一遍地重复着:”This is not your fault.“我听懂了这句话。也许是在国内呆久了,心之壁逐渐增厚,没觉得自己受到了创伤。反而是主席,意识到这种行为对学生的潜在影响,并尽他的努力帮助我,让我很感动。

我这才意识到,自己的心变得麻木,特别是在开始工作之后,对周边的感知力骤然下降。

阅读是砍向我们内心冰封大海的斧头。

卡夫卡在这段时间是我最恰当的嘴替。他对打工生活的评价和批评可谓是一针见血。奈何我的语言能力不够,难以道出他的文字精妙之处。然而,我发现,即使是卡夫卡极力批评的生活,都尚且能做到五点下班,上班中途想出去散步就出去散步。这种体制内般的生活,已经是国内打工生活的「天花板」了。很幸运,他没有在国内互联网大厂上过班,否则怕不是要直接抑郁地说不出话来了,更别谈写作了。

未来坐标:下一站该驶向何方

2024年底,DeepSeek-V3 发布,在大模型行业掀起一场风暴,顺势波及到我。DeepSeek 的核心优化点之一,正好是我研究项目中使用的技术,于是开始受到内部的持续关注。之前测试的各种数据,实现代码,都有人找我学习,这种情况让我觉得自己的工作有领先之处。但是在这之前,我提出的一些问题,没有多少人关心。在 DeepSeek 之后,这些问题受到了更高优先级的关注。

我开始思考,为什么现在才推进呢?也许是因为有一个领先者,需要超越吧。超越是一件好事,前提是有一个领先的对手。如果对手不存在了,又该如何超越?而抱着超越的心态,又怎样能走出一条新的路?

想说却还没说的,有很多。攒着是因为想写成歌。

2017年,大二的夏天,我和几个同学参加了一场为期72小时的黑客马拉松,需要从零开始做出一个项目。当时年少无知,真的以为要从零开始,而且不能有所准备,不然就不够纯粹。于是,几个人零经验就去参加活动了,自然是什么都没有做出来。

我安慰同学,现在年级太低了,没做出来什么很正常,等我们到了大四,做这种东西是信手拈来。当时想做一个文生音乐的项目,通过文字生成对应的一段旋律,并且可以组合起来。当时还觉得挺简单,现在想想真的是无知者无畏。

音乐就像魔法。一段旋律,能够调动起我的情感,或激动,或悲伤,或平静,也能在我注意力涣散的时候强行进入专注状态。文字如是,好的文字读起来能够让人心跳加速,也能够让人屏息,让人闭上眼去回味,去遐想。文字和音乐都是一种语言,但是表达的载体不同。如果能够根据文字生成一段完美的音乐,就像完成了这两种语言的翻译,是一件很有趣的事。

我觉得这个想法应该发表在共创题材,但是太懒了,不知道何时会真正地去重启这个项目,所以就抛砖引玉地发出来吧。

在少数派,我总能遇到一些人,他们认真地做着有价值的事,或是自己热爱的事。这或许是我依旧驻守在少数派的原因。在当下的环境中,能看到一群人努力生活,并热爱自己的生活,还能将这份热爱分享出来,实在难得。希望能够凭自己的努力,维护这个社群。