一、总论
这篇博客会从一个初学者的视角去积累一些科研中的常见“名词”,希望可以借此达到一个科普和入门的目的。
事实上我也没法以不是“非初学者”的视角去写,因为事实上我也刚知道这些东西不到一个上午。所以可能会有一些错误或者偏颇的地方,还望大家见谅。
此外因为我本人是做系统的,所以可能 AI 等方向我并不清楚,在下面的文章中也不会涉及。
二、实体
2.1 学术组织(Association)
学术组织是由计算机科学领域的学者和专家组成的非营利性团体。他们可以说是比较“中心”的一个实体了,许多实体都与它有联系。可以想见,这样的组织或者说社区,可以说是一个行业的基础了。
在计算机领域的较为有名的学术组织如下所示:
- ACM (Association for Computing Machinery): 国际计算机学会。是世界上第一个科学性及教育性计算机学会,ACM是全世界计算机领域影响力最大的专业学术组织。ACM所评选的图灵奖(A.M. Turing Award)被公认为世界计算机领域的诺贝尔奖。
- IEEE (Institute of Electrical and Electronics Engineers): 电气电子工程师学会。
- USENIX (The Advanced Computing Systems Association): 高等计算系统协会,原来叫 Unix 用户群(Unix Users Group) 。
- CCF (China Computer Federation): 中国计算机学会,隶属于中国科学技术协会。
学术组织往往发挥出版社、会议组织者和数据库维护者的角色。
2.2 会员(Fellow)
“Fellow” 是一个在学术或专业组织中的荣誉称号。在科学、工程、医学和其他领域中,一些组织会通过评选来授予该称号给在该领域做出杰出贡献的成员。成为”Fellow”可以被视为对个人在该领域中的成就和专业才能的认可。
成为一个会员通常需要经过严格的评选过程,包括被同行评审、提名、推荐和评审委员会的讨论等。获得该称号的人通常要展示出在他们的领域中的杰出创新、领导能力、学术成就和专业贡献。被授予 “Fellow” 之后,个人可能获得一些特权,如参与组织的重要决策、担任职务、享有特殊待遇等。
2.3 会议(Conference)
简单理解就是会议就是学术组织成员聚会,会议往往属于某个特定的组织。
因为会议上可以讨论科研,所以很多科研工作者选择将自己的文章在会议上发布(当然也要会议组织方的同意)。这样发表的论文被称为会议论文。
在计算机领域,会议论文是影响力较大的发表形式。这是因为会议具有及时性、多样性的特点,发表的论文还可以参与会议交流,影响力也会更大(仅在计算机领域)。
2.4 期刊(Journal)
简单理解就是学术组织的一种定期出版的学术、科技或专业性的刊物,用于发布原创研究论文、综述、评论和其他学术成果(注意不知有原创论文)。
期刊同样为论文发表提供了环境,这样发表的论文被称为期刊论文。但如前所述,计算机领域更看重会议论文。
2.5 研讨会(Workshop)
研讨会(Workshop)是指一个相对较小规模、设有具体议题或目标的学术会议。研讨会通常以某个特定的主题、问题或技术为中心,邀请专家和研究人员共同参与交流、讨论和合作。研讨会的目的是为了深入研究和讨论特定议题,并在有限的时间内促进交流、共享经验和推进相关领域的进展。
有些学术研讨会(workshop)可以接收、评审和发表论文。
2.6 课题(Track)
Track 是会议、研讨会或研究领域中的一个特定主题或方向。一个会议或研讨会通常会包含多个”track”,每个”track”都涵盖了某个具体领域的相关议题或课题。每个”track”都可能有自己的程序委员会,负责选择和审查与该主题相关的论文或演示。
每个课题都会由一个或多个课题主席(track chair)来负责管理,他们可能会协调审查过程、选择论文、安排演讲和组织相关活动。
2.7 论文(Paper)
也就是科研人员智慧的结晶,它需要被发表才能被世人知道,同时获得知识产权的保护。
论文似乎是应当要钱的,但是似乎计算机领域的会议论文很少收钱,我也不知道为啥。我修过一门分子生物学,他们的论文都是要收钱的,所以像 Sci-hub 这样的网站十分火热也不足为奇了。
在第二章中论文就是所有实体中的最小粒度单位了。
2.8 数据库
当论文被发布后,显然这些论文都需要相关人员知晓(这样才能被尊重),但是着并不是一件容易的事情。
要做到上面这点,首先就是把现在存在的论文收集起来放到一个地方,这就是文献数据库。
不过正如前所述,某个论文往往属于一个会议或者杂志,进而属于某个学术组织,所以基础的数据库都是由学术组织来维护。但是因为存在多个学术组织,所以检索会变得很麻烦,需要到多个数据库分别进行检索。
为了解决这个问题,往往会出现一些“引文数据库”,他们会对于这些学术组织数据库再次进行收录和整理,这样在这种“引文数据库”中检索,就可以检索出更加多而全的内容了。
当然,这种“引文数据库”的维护者拥有了“决定某个期刊或者会议是否收录入库”的权力以后,有些就会衍生出一些评价标准来判断这个事情。而这些评价标准如果公正和有说服力的话,同样也会成为科研人员的指标。换句话说,维护者发明了评判某个会议或者期刊是否够好的指标。当然也不是所有的评价指标都来自这个目的。
这种“引文数据库”包括 SCI , 中国知网,等。
三、会议层次
3.1 CCF 体系
一种是 CCF 提供的分类系统 。具体来说,就是 CCF 将计算机领域分为了如下几个方向:
- 计算机体系结构/并行与分布计算/存储系统
- 计算机网络
- 网络与信息安全
- 软件工程/系统软件/程序设计语言
- 数据库/数据挖掘/内容检索
- 计算机科学理论
- 计算机图形学与多媒体
- 人工智能
- 人机交互与普适计算
- 交叉/综合/新兴
对于每个方向,CCF 给出了 3 个层次,分别是 A, B, C 。A 是最好的,而 C 是比较差的。我们常说的某某毕业需要“1A1B”,就是说需要发表一个 A 类会议论文,一个 B 类会议论文才可以毕业。
这里简单罗列一下系统方向的 A 类会议:
方向 | A 类会议 |
---|---|
体系结构 | PPoPP, FAST, DAC, HPCA,MICRO, SC,ASPLOS, ISCA, USENIX ATC, EuroSys |
系统软件 | PLDI, POPL, FSE/ESEC, SOSP, OOPSLA, ASE, ICSE, ISSTA, OS |
信息安全 | CCS, EuroCrypt, S&P, CRYPTO, USENIX Security, NDSS |
3.2 中科院分区
正如前所述,SCI 提供了一种指标来评判各个文章,这个指标被称为影响因子(IF, Impact Factor),指某一期刊的文章在特定年份或时期被引用的频率,是衡量学术期刊影响力的一个重要指标。
一种刊物的影响因子越高,也即其刊载的文献被引用率越高,一方面说明这些文献报道的研究成果影响力大,另一方面也反映该刊物的学术水平高。
但是期刊的 IF 每年不断浮动,把 IF 定值作为学术评价指标不适合,而且不同学科领域期刊的影响因子差异很大,仅凭 IF 不能直观地比较不同领域的期刊。于是,把同一学科领域的期刊,按 IF 大到小做排序后,划分入不同区域。那么,只要是某领域 1 区的期刊,就是该领域的顶级刊物,直观反映该刊在领域内的水准和大致排位。
具体的分区方法,又存在多种,中科院分区就是其中的一种方法。国内比较认可这种分区方法。但是在计算机领域,大家更认可 CCF 一些。
3.3 顶会
本来到这里就应该结束了,但是我其实很好奇“顶会”这个说法,后来发现“顶会”并不等价于“CCF-A”,但是“顶会”这个说法到底是由某个组织提出的,还是民间说法,我就不得而知的。我个人感觉是民间凑字数的说法(甚至啥方向都是“四”大顶会,都不出个别的数),选取的应该是 CCF-A 中质量高同时中稿率低的会议,总结如下(不保真,怕被打,从知乎抄的):
方向 | 顶会 |
---|---|
信息安全 | CCS, NDSS, S&P, USENIX Security |
系统 | OSDI, SOSP, ATC, EuroSys |
体系结构 | ISCA, MICRO, ASPLOS, HPCA |