写在前面:硕士论文讲究严谨,对细节、语法需要细细揣摩。本文是总结甘老师的经验和个人犯的错误,也欢迎大家增加自己的情况。在检查自己的论文时可以假想自己是一个没有涉及过该领域的读者,通过阅读论文,自己能否理解本文讲述了什么?做出了什么贡献?借此可以查看自己有哪些地方没有写清楚,哪些地方没有引用正确。我们写出来的论文需要简练,表达要直截了当而且清楚。主要以陈述句居多,祈使句为辅,很少出现倒转和割裂的现象。表达上切忌摸棱两可,一语双关。本文配套“TexStudio使用教程.md”食用更佳。
通用
我们写论文的整体语气是非人称、客观的,并且为了给读者提供可信且具有说服力的信息,通常使用肯定性的、指向性的、宣称性的动词
常用的五类动词:
- 行为的物质过程动词:do, act, create, change, choose
- 感觉的心过程动词:see, hear know, expect, find, realize
- 存在和发生的存在过程动词:exist, happen, occur
- 报道的言语过程动词:describe, explain, indicate, reveal, show
- 生成的关系过程动词:be, become, get, keep, remain, appear, grow, end up
第一次提出一个概念、技术或特殊结构,要写明全称,之后的可以用缩写,如下:
High-utility itemset (HUI) mining is widely applied to many scenarios in the real world.
Ps. 注意“摘要”和“后文”是互相独立的章节,摘要中提到的缩写只能在摘要中使用,后文第一次涉及到仍要写全称。
不是自己提出的新技术,需要用utilize、adopt等词表明这是自己采用其它人的技术,如下:
错误示范:We also use the array-based utility technique
正确示范:We also utilize the array-based utility technique
引用文献通常为期刊版本(更完整),不使用会议版本(在引用中有“[C]//”字样)
第一次提出别人的已有概念、技术需要注明引用,如下:
Frequent itemset mining (FIM) [20] has been widely…
引用标明注意规范,需要标注在标点符号前,引用内容后空一格,如下:
错误示范:
- In frequent itemset mining[20],
- In frequent itemset mining, [20]
正确示范:
In frequent itemset mining [20],
若引用句中出现人名,那么引用标志一般放在人名后面,如下:
In a study by Wu et al. [11], the paper demonstrated that…
Ps. 没有出现人名一般可以放在句尾或算法名后
用到的参数统一用斜体表示,如下:
In top-k HUI mining…
使用斜体通常用 \textit{内容…} 表示,但用 $内容…$ 也可以,需要注意的是:使用$$会导致部分字母间距变大
各章节的小标题不使用缩写
全文表达形式多样化,不要单一的重复句型或单词
语法问题
- 特定名词前加 “the”
- 标点符号不要使用中文
- 逗号、句号后要空一格
- 默认使用第三人称,样式为 “s/he”
- 引用文献两个以上作者,使用 Xx et al. 格式,若少于三个,写姓即可,如:Liu and Qu [13]
- 不使用缩写 “can’t”,使用 “cannot”
- 默认规定 “itemset mining”,“mining itemsets”
- 不要使用“so”这样太过口语化的词,应该用“thus”,$\$“therefore”替代
- but是跟在前面的语句,不能用在开头。….., but ……这才是正确的用法
- 对表格类数据进行描述时:1, 2, 3 and 4 是错误的,正确描述为:1, 2, 3, and 4
时态
- 处理时态的基本原则:
- 选定动作发生的时间参照点。可以将当前写论文的时刻定为现在时间,在此之前和在此之后
- 确定动作进行的状况和方式。动作有(非)持续性、(非)完成性、结束性
- 时间参照点和动作进行状况的结合考虑。
- 不同时态的使用场合:
- 一般现在时
- 用于无需考虑谓动词发生的时间,或不受时间限制的客观存在事实的描述
- 用于发生或存在于写论文时的感觉、状态或关系等的描述
- 用于致谢部分
- 一般过去时
- 用于描述写作之前其他人或自己所做的工作描述
- 用于确定的过去时间发生的动作或状态描述
- 用于作者感觉是写论文之前发生的动作或存在状态
- 一般将来时
- 用于描述写作之后发生的动作或存在状态
- 用于已确定将来时间发生的动作或状态描述
- 用于作者感觉时写论文之后发生的动作或存在状态
- 现在完成时
- 用于强调持续性,一直保持的状态或一直发生的动作(时间标准时写论文时)
- 用于强调动作的完成性或结束性(时间标准是写论文时)
- 过去完成时
- 用于过去某一时间之前已发生的动作或存在的状态
- 用于过去某个动作之前已发生的动作或存在的状态
- 一般现在时
- 类似主从复合句,需要前后主句与从句的语态保持一致,同为现在或将来时态,抑或同为过去时
时态 | 引言 | 背景 | 定义 | 算法 | 实验 | 结语 |
---|---|---|---|---|---|---|
现在时 | 大量使用 | 很少使用 | 大量使用 | 大量使用 | 大量使用 | 大量使用 |
过去时 | 偶尔使用 | 大量使用 | 偶尔使用 | 偶尔使用 | 偶尔使用 | 几乎不用 |
- 使用主动语态比被动语态表达更有力,如 It was found that… 没有 We found that… 更强烈,但具体使用哪种取决于句子要强调的重点
Title
特点:
- 英文标题要求精炼、明确,所以要尽可能抓住中心词,省去不必要的部分
- 虚词、冠词、连词、连系动词、形容词、副词都在省略范围
- 时态和语态主要采用一般现在时、将来时或现在进行时
- 缩写一般采用标准化的缩略词,读者可以在论文中找到全称
- 一般标题中不适用标点符号,但可以使用冒号(英文)引出副标题
忌讳:
- 避免重复,“研究”、“探讨”、“观察”、“分析”等词使用时要慎重
- 标题应紧扣文章内容,恰如其分地表述研究范围和深度、切忌夸大其词、以偏概全
- 控制长度,通常在10个实词以内,最多不超过15个实词
- 前后标题(包括子标题)格式不统一,有的首字母大写有的都小写。给个正确样例大家自己体会一下(狗头保命):Dataset Scanning using Projection Technique
Abstract
摘要是论文的内容不加注释和评论的简短称述,内容应当包括:1. 从事这项研究的目的和重要性(introduction);2. 研究的主要内容,凸显已完成的工作(related work);3. 获得的基本结论和成果,突出论文的新见解(analysis result);4. 结论、成果的意义(conclusion)
实际上,一句话就可以概括一项内容,最多可以用三句进行补充描述。要确保:读者在阅读摘要后就能了解该篇论文的研究工作!!!(为了解决什么问题?怎么解决?效果如何?比较情况?)
摘要部分不能有引用,所以最好不要出现他人写的算法名,如下:
错误示范:
the Efficient High‐utility Itemsets Mining withting’s Negative Utility (EHIN) was proposed.
正确示范:
several efficient algorithms for high‐utility itemsets mining with negative utility has been proposed.
下图可以作为写摘要的参考结构:
Introduction
该章节通过简单地介绍研究领域发展状况(关键代表性算法不能省略),自己提出的新算法做出了哪些方面的贡献(必须有),主要是给阅读者一个整体大致印象,为下一个章节做铺垫。
- 缩写一般用大写形式,全称用小写
- 最后一段总结需要写完整各个章节是分别说明什么内容,不要有遗漏或跳跃。
Related work
该章节是需要进行详细说明,相比于introduce的简单几句介绍,要清楚说明发展历程,有什么缺陷,使用了哪些当时先进的技术。例如:
- Two-Phase 提出的 TWU概念
- UMing 设计的 Tree-structure结构
- HUI-Miner 提出的 Utility-List结构
- EFIM 设计的 upper-bound判断值
- 可以使用“总-分-总”结构,其每小段还可以采用 “总-分-总”结构叙述
- 一般比较少使用“Xxx提出xxx算法”句型,而是“xxx算法被提出来”句型
- 这部分引用最多,要注意引用格式,他人的东西一定要加引用
Problem definition
该部分主要是介绍前人已经做出的定义,性质及其证明,因为我们大多工作是在他人的基础上进行改进的,所以很多定义内容是别人已经发表,在书写过程中要注明引用。
公式或符号一般都采用斜体(新罗马字体)
当符号有下角标时,下角标不应该斜体,符号保持斜体,如:$T_\mathit{1} \times, T_1 \checkmark$
定义用名前后要保持一致,格式也一样,该斜体就要一直斜体
编写表格要注意排版简洁美观,避免出现串行现象,如下不正确图:
表格或示意图最好要有文字解释,方便阅读理解
表格或文字要用latex打上标签,方便后续阅读到可以点击跳转查看
e.g., 使用,例如:(e.g., purchase quantity)购买的数量或者发生的次数,是我们这论文里面定义的内部效用的其中一种
w.r.t. 是 with respect to 的缩写。(“关于,谈及,谈到”的意思)
i.e. “也就是,亦即”的意思
The XXX algorithm
本文的核心部分,说明用到哪些技术、方法,可以结合样例数据进行说明。(这一部分需要好好润色,要让读者简单易懂)
- 算法的伪代码排版要美观
- 介绍第几行伪代码时,应使用大写开头,如 “Line 9”
Performance evaluations
表格图的标题需要放在该图的上面,如下图:(注意标题和图片之间的间隔不要太大,看文献的时候也可以多注意一一下)
其它示意图的标题需要放在该图的下面,如下图:
获取实验数据应该从最高值往小测,这样方便自己划定测试范围,至少要有五个测试点,每个测试点之间应该要有一个数量级差(如:500, 1000, 2000, 3000, 5000, 10000)
测试的数据集通常会议版:4个,期刊版:6个
对图片进行适当放缩,可以让图片看起来更清晰,代码如下:
\scalebox{\includegraphics{参数}{图片}}
,其中“参数”可以设置:裁剪图片空白部分trim={<left> <right> <up> <down>}
,数值间用空格隔开,单位cm,pt都行;width= <数值>,设置宽,同理还有高,特别强调“width=0.5\textwidth"意味着图片占幅为一半,这个在双栏写作中很有用;但每个参数之间使用“,”隔开。图片填写的是文件相对于根目录的完整路径(根目录就是*.tex文件)数值>绘制实验数据图的时候,用红色实线表示提出的算法,以作醒目
Conclusion and future work
方便他人了解该算法还有什么地方可以扩展、延申研究
Reference
- 最好采用TexStudio导入,使用Google Scholar检索到相关文献后,选择BibTex引用粘贴到bib文件夹下,这样方面对参考文献格式修改:文献标题首字母大写,加双引号之类
- 一般参考文献为35-40个,尽量不要多于40个文献,因为有的期刊会有这硬性要求。太少文献也不好,例如少于30个文献,又显得论文的相关成果太少,不够重要
- 当所表达的理论、知识、想法、事实、数据或图表非本文原创时,就应该使用引用标注文献出处
- 引用文献切忌原文照抄,至少要改一改表达
- 大多数情况下,引用句子中会虎烈作者名字,这样可以保证语句衔接紧密、流畅
- 引用某篇文献的时候自己至少要全文浏览一遍,确保没有以讹传讹
补充
- 一定要配套使用TexStudio的语法检查功能,能够及时修正那些错误单词或语句
- 参考文献直接原文粘贴到*.bib文件里,复查时有助于判断引文是否正确
- 标题格式、关键词简写要保持风格一致
润色
在完成论文的整体书写后,仍需要对论文进行修改,目的是为了使行文更通顺,让审稿人阅读起来不那么难受。
- 写文章不要太口语化,可以尝试着删掉“我们”“我”这样的人称代词,再读读语句看看是否更客观合理了
- 不改变文章内容原意的基础上,通过纠正语法、拼写等错误,订正基本语句错误,使文章语句通顺(这个自己全文读两遍就知道哪里别扭了)
- 通过调整句子的句型、语法、结构,替换专业词语,来达到文章表达简明、逻辑通顺、专业性强的目的
- 通过整理文章的排版(涉及到Latex语法)、引用文件格式,使文章更规范