前言
无论是在学界还是在业界,文献(期刊、学位论文等)都是重要的研究资料。文献可以帮助我们了解某领域的知识,也能作为我们论证和下结论的依据,但这都建立在“大量”的基础上。文献管理,尤其在较短周期的项目中,显得非常重要。好的文献管理可以减少手动工作量,提升整个研究过程的效率。本系列文章的目的旨在介绍基于Zotero软件的文献管理办法,特别是在短期研究项目的应用,希望带给有文献研究需求的读者一些参考。
Zotero是一款免费、开源的文献管理软件,具有操作简单、功能丰富可扩展的优点。短期的文献研究通常来业界,需要在短时间解决一个具体的研究问题,例如HR想知道影响求职意向的因素有哪些。根据研究问题我们需要制定研究计划、收集和筛选文献、抽取和整合文献信息、撰写研究报告。
(资料图片仅供参考)
Zotero在制定计划以外的其他阶段都能帮助你提升研究效率。本文会主要集中在文献的收集和筛选环节,并且进一步拆分为了1、文献的收集;2、文献的整理;3、文献的存储。围绕文献研究中的需求场景,介绍一些软件技巧和插件。受限于笔者精力,仅做简单介绍,更多资料会以链接形式放在文中。
阅读本文可能帮你解决以下问题:
我如何自动抓取文献元数据?
我如何批量获取文献全文?
我如何快速给文献做记号?
我如何备份和同步我的文献?
文献收集目的是获取能回答研究问题的资料,是一个不断查找、筛选和下载的过程。在此,我们不讨论文献的检索相关问题,假定我们已经获得了结果列表,下一步,我们要做的是获取文献的元数据(描述文献的信息,包括标题、摘要、关键词、出版日期等)和全文(通常是pdf格式)。使用传统的本文件夹管理时,在获取文献元数据会面临元数据难存储和难获取的问题;在下载文献全文时也存在频繁操作的问题。而使用Zotero可以在很大的程度上解决这些问题。
你需要了解“条目”这个概念,条目是Zotero的管理单位,条目会存储元数据,也可以携带附件(通常是文献的全文或笔记)。形式上,条目好像是文件夹,里面收纳了附件。实际上,如果你去探索Zotero的全文文件存储位置,你会发现它在一个由英文和数字命名的文件夹里,这个文件夹还存了元数据的文件。原来,在Zotero每个条目都对应一个文件夹,但不会有更高层级的文件夹,这样“单一保存、平铺”的好处你会在2.2部分找到。
本节仅介绍文献元数据的抓取(元数据的导出也十分有用,但笔者会在后文介绍)。元数据的抓取有两种方式:
1)从网络上抓取
Zotero提供了浏览器插件Connector,它能够自动浏览当前网页的类型(博客、期刊、会议等),然后一键抓取元数据,自动在Zotero里生成一个条目。默认设置的Connector插件对中文网站的识别有欠缺,你可以更新它的Translator文件,详见Zotero Translators中文维护小组主页:https://github.com/l0o0/translators_CN
你也可在数据库选中多篇文献,导出他们的元数据。通常选择BibTeX、RIS、Text等格式,而后批量导入到Zotero中。配合下文1.3自动获取全文使用,这无疑会节省你很多时间,但这对中文文献有局限,所以更加适合学界的研究场景。
2)从全文pdf里抓取
当你把一篇全文pdf放到Zotero时,通常它会自己尝试提取元数据生成条目,这对大部分英文论文有效。但中文全文就需要插件“茉莉花”的帮助,确保你获取的文献标题正确,这个插件会去CNKI里按标题找到对应的元数据并获取它们。
茉莉花插件还提供一些对中文文献管理友好的功能,例如提取硕博士论文的目录、合并拆分作者名、获取知网引用量等。 https://github.com/l0o0/jasminum
1.3 自动获取全文
当你用Connector自动生成一个条目时,通常Zotero会自动帮你提取全文pdf。如果你拥有数据库的权限,通常它会自动帮你下载,然后放到条目下,不需要你点击。如果你没有数据库的权限,它会启动“查找可用的pdf”功能,如果那篇论文是Open Source类型,它会找到并下载,放到条目下。自动下载全文在你批量导入文献元数据后很有用,你可以批量选中没有全文的条目,右键点击“查找可用的pdf”,Zotero会自动帮你找文献,下文献,放到指定的条目下。但Open Source的范围实在是太少了,你可以通过如下办法利用Sci-Hub来调取大部分的英文论文,但对在学界做研究非常有用。https://zhuanlan.zhihu.com/p/112141757
对文献的整理就是一个分类和贴标签以及排序的过程,终极目的是为什么更快地找到想要的文献。实际上,你如果只想要一篇文献,你使用搜索就够了。但对一个研究项目来说,更具体的需求应该是,你需要把一个项目的文献放在一块儿,然后边阅读,边标记文献的阅读的状态、重要性、关键主题。使用Zotero可以很好满足这些需求。
Zotero上方有个搜索框,你可以输入标题、作者等一些字段来检索文献;同时你可以使用高级搜索,来更精准找到文献。但你可能会用搜索找到了一篇论文,想要反推它归类在哪里(当你分类数量和层级很多时)并不是很容易。这时你可以按住Ctrl键,然后鼠标左键点击条目,这样该条目属于的分类将会闪烁一下,提醒你该条目归属于那里。
Zotero最主要的整理方式就是分类,新建一个分类,就可以直接开始放入你收集的文献。它在很多地方与文件夹相似,这并没有什么值得说的,但是也有两点很明显的差异。
① 文献条目A可以同时存在于多个分类,但是A只会保存1份,无论在哪个分类修改了A,其他分类中看到的也是修改后的A,试想在传统的文件夹中,其实是保存了多个A副本,修改某个文件夹内的A,不会影响其他文件夹中的A副本。
② 当你删除某个分类时,你可以选择仅删除分类但保留条目(没有分类的条目会自动归入“未分类的条目”),试想,在传统的文件夹中,这是无法做到的。拥有这些特性,让一篇交叉领域的研究不需要在因为分到哪儿而苦恼。
这比分类更值得说,使用标签通常可以帮你进一步筛选文献,标记你需要重点关注的文献,Zotero也有自定义标签和自动标签两种,你至少需要知道下面这些技巧:
① 添加自定义标签/使用快捷方式/批量添加标签/标签美化
添加自定义标签:选中条目,在右侧的属性面板区域找到标签,点击“add”。添加好的标签会出现在左下方的标签区域。
当你添加好了标签,你可以右键单击标签,给指派颜色和快捷键(通常是数字1、2、3、4)给标签,尤其是常用的,例如“已读”、“未读”、“重要”、“排除”等,这样你可以更快的给文献打上标记。
实际上,Zotero同样也支持批量添加标签,但这很隐蔽。你可以多选条目,然后拖动它们,一直拖到想要添加的标签上面松开,这些被选中的条目就会都打上标签。
如果你想要美化Zotero的标签样式(显示阅读进度),你可以使用“Zotero Style”这个插件:https://github.com/MuiseDestiny/zotero-style
② 隐藏和删除自动标签
往往导入文献时,文献附带的一些标签,大多是一些关键词。自动标签很容易变得很多,也许会使得你很烦恼,你可以选择隐藏它们或者直接统一删除它们。
排序在以下两种情况很有用,① 你在按照年代阶段梳理文献内容;② 你在核对文献的笔记(通常是一张表格,每一行对应了一篇文献)是否缺漏。你可以右键单击条目区上方的类似“表头”的区域,就可以切换正序和倒序,你还可以右键选择需要展示的元数据,并且用它们来排序。
对于研究者来说,文献资料应该有个好的存储备份方式,以免丢失。你可以选择Zotero的原生云或者WebDAV。
原生一般意味着简单,你可以组测一个账号,然后选择用Zotero云备份,此外不用做什么额外的配置。但缺点是免费的额度只有300M,长期使用的话是不够的,但购买更多的容量价格并不友好,所以使用WebDAV可能是更合适的方式。另外,你需要知道的是Zotero的群组功能只有原生云能够同步附件,如果你需要团队在线协作,那只能选择原生云。
WebDAV可以片面理解为一项云盘服务,它允许你不用下载云盘软件,仅通过网站、账号、密码就可以在本地和云端之间同步文件,这样就可以帮助你备份Zotero中的文献资料。提供这种能力的云盘很少,你可以尝试坚果云,或者TeraCloud。
实际上TeraCloud更有优势,因为坚果云会限制每个月上传和下载的流量,虽然对于文献的同步需求来说,免费版本也是足够用的。但TeraCloud没有流量的限制,免费的容量可以通过邀请任务升级到15g,备份文献完全足够。
具体的教程参考如下:https://www.bilibili.com/read/cv18956813?from=articleDetail
本文主要聚焦在Zotero在文献收集和筛选环节上的应用,提到一些技巧,比如标签的运用、使用Sci查找pdf、teracloud云同步等,也提到了一些插件,比如connector、茉莉花、Zotero style等。后续文章笔者将继续介绍Zotero在文献阅读、信息抽取与整合、报告输出等方面的应用场景和技巧。希望能够对从事文献研究的你有所有帮助,同时如发现文章有需要改进之处,请留下你宝贵的意见。
标签: