如果你从事某一科学领域,则应尝试对该领域建立起深刻而公正的理解。这不仅是在以尽可能最好的方式教育你,还在帮你预见本领域中的机会。

研究论文通常是围绕某个主题的广泛实践,深入而真实。在撰写研究论文时,作者批判性地思考问题,进行严谨的研究,评估研究过程与信息来源,组织想法,然后开写。这些真正地动手实践最终产生出一篇好的研究论文。

如果你想养成定期阅读论文的习惯(像我一样),我已经试着分解了整个过程。我已经与该领域中的研究者进行了交谈,阅读了大量杰出研究人员的论文和博客,并记录下了一些可以供你遵循的技巧。

让我们从理解什么是研究论文,研究论文又不是什么开始吧!

什么是研究论文

研究论文是密集而详尽的手稿,汇编着对某一问题或主题的透彻理解。它提出解决方案以及进一步的研究,还有本研究演绎和进行的条件、解决方案的效力和所进行的研究、以及研究中潜在的漏洞。

撰写研究论文不仅可以提供难得的学习机会,还可以为该领域的进一步发展铺平道路。这些论文帮助其他学者萌生思想的种子,这些种子要么带来一个新的思想世界,要么激发出一个解决某个长期问题的创新方法。

研究论文不是什么

人们普遍认为,研究论文是关于某一问题或主题的翔实的总结,由其它来源写成。

但是,你不应该把它误认为是一本书或某人在特定主题上发表的自以为是的见解。

为什么你应该阅读研究论文

我发现阅读优质研究论文让人着迷之处在于,你可以对某个主题进行深入研究并以新的观点与社区互动,从而了解该主题及其周边可以实现的目标。

我从事教学设计与数据科学的交叉领域。学习是我日常工作的一部分。如果我的教育资源有瑕疵或效率底下,那么从长期来看,我的工作会失败。这适用于科学领域的很多其它工作,尤其是研究工作。

有三个阅读研究论文的重要理由:

  1. 知识——从别人的视角理解问题,他们可能花了数年时间解决它,并且注意到了你在一开始可能不会考虑到的边界情况。
  2. 探索——无论你是否拥有一个明确的日程,都有很大的机会发现一个值得跟进的边界情况或缺陷。通过长时间的不懈努力,你可以学会利用这些知识谋生。
  3. 研究与审查——写研究论文的一个主要原因是促进该领域的发展。研究人员阅读论文,为会议评审它们,或对一个新的领域进行文献调查。例如,Yann Lecun 关于将域约束集成到反向传播中的论文在 1989 年为现代计算机视觉奠定了基础。经过数十年的研究与开发工作,我们目前已经完成了诸如对象检测和自动驾驶汽车优化之类的问题。

不仅如此,在因特网的帮助下,你可以用所有这些原因或好处来推测多种业务模型。它可以是一个技术先进的创新型产品、一个高效的服务模型、一个内容创建者,也可以是一份理想的工作,你在这份工作中解决对你来说很重要的问题。

阅读研究论文的目标——你应该阅读哪些?

首先要做的就是搞清楚你阅读论文的动机。有两种可能让你阅读论文主要场景:

  1. 场景 1——你有一个清晰的日程/目标,并且你已经融入了某个特定的领域。例如,你是一名 NLP 从业者并且你想学习 GPT-4 是如何让我们在 NLP 领域取得突破的。这始终是一个不错的场景,因为它提供了清晰的信息。
  2. 场景 2——你想跟上某些领域的发展,比如一个新的深度学习架构是如何帮助我们解决了一个已经存在了 50 年的理解蛋白质结构的生物学问题。对于初学者或那些每天花时间从研究论文中获取新闻的人来说(是的,他们是存在的!),这很常见。

如果你是一位好奇的初学者,但又不知从何开始,请从场景 2 开始。列出几个你想要阅读的主题,直到找到让你感到好奇的领域。这最终会把你带到场景 1。

ML 重现挑战

除了这些通用目标外,如果你的最终目标是养成阅读研究论文习惯,你应该查看 ML 重现挑战

1

https://openreview.net/group?id=ML_Reproducibility_Challenge/2020

你将从世界级会议上找到值得深入并重现结果的顶级论文。

他们一年举行两场这个挑战,在 2021 年春季就有一场。你应该研究过去三个版本的挑战,我会写一篇详细的文章,介绍应该期望什么、如何准备,等等。

现在你肯定想知道——如何能找到正确的论文来读?

如何找到正确的论文来读

为了获取一些相关想法,我向我的朋友 Anurag Ghosh 求助,他是一名微软的研究员。Anurag 一直致力于计算机视觉、机器学习和系统工程的交叉研究。

Screenshot-2021-03-04-at-12.08.31-AM

https://anuragxel.github.io/

这里是他的一些入门技巧:

  • 始终选择一个你感兴趣的领域。
  • 阅读几本有关该主题的好书或者几篇详细的博客文章,然后通过阅读这些资源中参考的论文进行深入。
  • 寻找围绕该主题的开创性论文。这些论文报告该领域的重大突破,并提供了新的方法观点,这些观点蕴藏着在该领域中进行后续研究的巨大潜力。查看 the morning paperCVF——时间检验奖/赫姆霍兹奖(如果你对计算机视觉感兴趣的话)。
  • 查看像 Richard Szeliski 的 《计算机视觉:算法与应用》 这样的书,并寻找书中参考的论文。
  • 拥有并建立社区意识。找到志趣相投的人,加入促进这些活动的 group/subreddits/discord 频道。

除了这些宝贵的技巧之外,在搜寻正确的论文来读的时候,还有很多网络应用帮助我缩小了搜索范围,我已经将它们列出来了:

  • r/MachineLearning——有很多研究员、从业者和工程师在这里分享他们的工作成果以及在取得这些成果的过程中发现的有用的论文。

Screenshot-2021-03-01-at-10.55.53-PM

https://www.reddit.com/r/MachineLearning/

  • Arxiv Sanity Preserver——由 Andrej Karpathy 建立,旨在加快研究速度。它是一个有着 142846 篇论文的仓库,涵盖计算机科学、机器学习、系统、人工智能、统计、计算机视觉,等等。它还提供了很多过滤器、强大的搜索功能,以及一个论坛,造就了一个超级有用的研究平台。

Screenshot-2021-03-01-at-10.59.41-PM

  • Google Research——这个谷歌的研究团队正对那些影响着我们日常生活的问题进行研究。他们分享自己的出版物,供个人和团队学习、贡献并加速相关研究。他们也有一个谷歌 AI 博客,你可以看看。

Screenshot-2021-03-01-at-11.13.31-PM

如何阅读研究论文

在你准备好阅读清单之后,接下来便是阅读这些论文的过程。记住,并不是每一篇论文都有用,我们需要一种可以帮助我们快速筛选值得阅读的论文的机制。

为了应对这一挑战,你可以使用 S. Keshav 的三步阅读法 。该方法建议你分三个步骤阅读论文,而不是从头开始,一路深入直到结束。

三步阅读法

  1. 第一步——快速扫描,捕获该论文的宏观观点。仔细阅读论文的题目、摘要和简介,接着阅读各章节与子章节的标题,最后阅读总结部分。应该要不了 5-10 分钟,你就能知道你是否想进入第二步了。
  2. 第二步——仔细阅读,但不用检查技术证明。写下所有重要的笔记,在页面空白处突出关键点。仔细研究图形、图表和插图。回顾其中的图片,标记出未阅读的相关参考以便进一步阅读。这能帮助你理解该论文的背景。
  3. 第三步——到了这一步就说明你已经发现了一篇你想要深入理解或审阅的论文。第三步的关键在于重现论文中的结果。检查所有的假设,并记下重新实现过程中所有的变化和原始结果。写下所有的想法,便于将来的分析。对初学者来说,这一步应该会花费 5-6 小时,而有经验的读者只需要 1-2 小时。

跟踪论文流水线的工具和软件

如果你真心实意地阅读研究论文,你的论文列表很快就会变成一个难于跟踪的庞然大物。幸运的是,我们有软件,可以帮助我们建立一种机制来管理我们的研究。

这里是一些你可以使用的软件:

  • Mendeley 【不免费】——你可以从浏览器直接添加论文到你的文献库中,导入文件,生成参考文献和引文,与研究者协作,从任何地方访问你的文献库。这主要是由经验丰富的研究人员使用。

Screenshot-2021-03-02-at-1.28.19-AM

https://www.mendeley.com/?interaction_required=true

  • Zotero 【免费 & 开源】——与 Mendeley 路线相同,但是它是免费的。你可以在有限的存储空间内利用所有的功能特性。

Screenshot-2021-03-02-at-1.42.28-AM

https://www.zotero.org/

  • Notion——如果你刚开始并想使用可以在一个工作区中整理论文、记笔记并管理一切的轻量级软件,那么它非常适合你。它可能比不过上述工具,但是我个人在使用 Notion 时感觉很舒服,我还创建了这个面板,用来跟踪我现在的进度,你可以复制它:

2

⚠️ 阅读论文的症状

阅读研究论文可能令人沮丧、备受挑战和耗时,尤其当你是初学者的时候。你可能会遇到以下常见的症状:

  • 你可能因不理解论文在说什么而开始觉得自己不聪明。
  • 发现你自己很难理解那些证据背后的数学原理。
  • 用头撞墙,让满脑子中都是论文中使用的首字母缩略词。只是开个玩笑啦,你将不得不时不时地查找那些缩略词。
  • 在某个段落上卡住了超过一个小时。

这里是一个完整清单,展示了你可能经历的各种表情,就像 Adam Ruben 在这篇文章中解释的一样。

关键要点

我们应该全力以赴。这里是我们所介绍内容的一份简要概述:

  • 科研论文是一项深度研究,它为某一主题或问题提供详尽的解释,还包含研究过程、证据、解释的结果和关于未来工作的想法。
  • 阅读研究论文,从而形成对某一主题/问题的深刻理解。然后你既可以作为研究员的一部分审阅论文,探索该领域和该类问题,从而构建解决方案或者就从此开始研究,还可以简单地通过阅读它们了解兴趣领域的最新发展。
  • 如果你是一名初学者,从探索开始,尽快找出通往目标研究的道路。
  • 为了找到好的论文来读,你可以使用像 arxiv sannity、google research 这样的网站,也可以使用像 r/MachineLearning 这样的小社区(subreddits)。
  • 阅读方法——使用三步方法寻找论文。
  • 使用 Zotero/Notion 这类工具跟踪你的研究、笔记和进展。
  • 阅读论文可以立马让你不堪重负。确保你懂简单开始,并逐步增加负载。

记住:艺术并不是在一个周末就可以完成的简单方法或步骤,而是一个随时间推移而取得显著成果的过程。

你也可以在我的 YouTube 频道 上观看这一主题的视频:

https://www.youtube.com/channel/UCH-xwLTKQaABNs2QmGxK2bQ

如果你有一些点子、问题或想法,请随时响应这篇博客或者在视频上发表评论!

你可以通过 TwitterLinkedIn 联系我。

原文:How to Read a Research Paper – A Guide to Setting Research Goals, Finding Papers to Read, and More,作者:Harshit Tyagi