搜论文网

您现在的位置是:首页 > 论文结构 > 正文写作 > 博士论文写作

博士论文写作

如何应用大数据发表sci论文(写作技巧介绍)

2024-10-27 22:12:19博士论文写作 学术堂 王老师
从SCI论文中提取出优秀的语句,常用的词汇,并将这些语句、词汇直接教授学生,提高了学生的学习效率,降低了导师的工作量,使得学生能够全面地学习到SCI论文的写作技巧,并为未来高校开展SCI论文写作课程提供了理论基 />

  SCI论文发表数量已经成为评价教师、学生学习及科研成果的一项重要指标。如何写出优秀的SCI论文,已经成为各个高校- -项重要的课题。目前各大高校尚无成熟的SCI论文写作课程,大多数学生的论文写作经验都由其导师直接传授,这无形中增加了导师的工作量,由于不同的导师对SCI论文写作有着不同的经验,学生只从导师那里学习写作技巧,难免会有片面性,同时降低了教学的效率。

  近年来随着人工智能以及互联网的发展,网络中每天产生的数据量远远超过人们的想象,这直接推动了机器学习等技术的发展,监督学习为垃圾邮件识别提供了理论基础,人们不再被垃圾邮件所困扰,情感不再是主观的概念,而是一个可以被计算的变量,人们只用抬起手就可以控制家中电灯的开关。无监督学习使得新闻网站工作者能够快速归类相同类别的新闻,提高了工作效率。强化学习使得AlphaGo能够战胜韩国着名围棋运动员李世石,并在乌镇的围棋峰会上,以3:0的战绩完胜围棋排名世界第一的少年围棋天才柯洁。深度学习使得汽车不再需要人的操控便可以自动行驶,相机可以自动识别人脸并进行美颜处理,监控系统可以从人群中一眼发现犯罪分子的踪迹,甚至可以从脸部判断一个人的性格。协同过滤算法使得我们在逛淘宝时总能第一-眼看见我们喜欢的商品,打开爱奇艺时首页上总会显示我们爱看的电影。异常检测算法使得我们不再需要安排人员轮流监视生产线上可能出现的异常情况,出现异常情况时便会自动报警。自然语言处理技术使得机器人听得懂人类说话,能与人类进行交流,写出来的诗已经可以与人类一较高下。

  有了自然语言处理技术,SCI论文进行量化分析已经成为可能。从SCI论文中提取出优秀的语句,常用的词汇,并将这些语句、词汇直接教授学生,提高了学生的学习效率,降低了导师的工作量,使得学生能够全面地学习到SCI论文的写作技巧,并为未来高校开展SCI论文写作课程提供了理论基础。

  我们使用自然语言处理技术进行了材料类SCI论文的词频标注及提取。

  ①读取PDF格式的文献,使用PDFbox开源工具包自动对文献进行格式转换,将其转换为txt格式文档。由于文献格式较为复杂,直接将其转换为txt格式会造成一-定程度上的错位乱码情况,如txt中无法显示表格,表格中的文字会混淆于正文之中,对于文献的边角信息,如作者地址等,也会造成不同程度的混淆。我们分析了目前主流杂志社的文献格式,按照不同杂志社可能出现的错误进行了初步的降噪处理,粗略地识别了边角信息及表格的情况,并去除了文献中的页眉、引文等部分,提高了文献的纯净度,便于后续的进一一步处理.提高了词汇标注的准确性。具体步骤如图1所示。

1.png

  图1“大数据” 提取步骤

  ②使用正则表达式技术,模糊匹配了文献各个部分的标题,将文献按照Introduction、Experiment、 Results and discussion、Conclusions 分成四大部分。通过斯坦福大学自然语言处理工具箱对文献进行处理,假定S是某一个特定的句子,由一串有顺序的单词w,w2, w3, .... w,组成,其中n指句子的长度。使用马尔科夫模型,假定某一词汇的词性只与前一个词有关,简化问题。计算各个词性出现的条件概率p[w,/(w,- 41)], 将概率最大的词性作为当前词汇的词性,完成词性标注。

  ③对统计结果中由于格式转换问题如乱码等进行了二次识别,删除了第一次降噪时没有识别到的错误。为了提高结果的代表性,我们只保留了出现频率较高的词汇,对一些不常见的低频词汇,如专有词汇、化学符号等进行了删除,对一些没有意义的冠词,如the、a等进行了删除。下面展示我们提取的“大数据”库,供大家参考。

  1.1 Introduction 部分

  动词第三人称单数

1.png

  动词非第三人称单数

1.png

  过去分词

1.png

1.png

  动名词和现在分词

1.png

  动词过去式

1.png

  动词原型

1.png

  副词

1.png

  常用名词复数

1.png

1.png

  1.2Experimental部分

  动词第三人称单数

1.png

  动词非第三人称单数

1.png

  过去分词

1.png

  动名词和现在分词

1.png

  动词过去式

1.png

  动词基本形式

1.png

  副词

1.png

  常用名词复数形式

1.png

1.png

  1.3Results and Discussion部分

  动词第三人称单数

1.png

  动词非第三人称单数

1.png

  过去分词

1.png

  动名词和现在分词

1.png

  动词过去式

1.png

  动词基本形式

1.png

  副词

1.png

  常用名词复数

1.png

  1.4Conclusions部分

  动词第三人称单数

1.png

  动词非第三人称单数

1.png

  过去分词

1.png

  动词和现在分词

1.png

  动词过去式

1.png

  动词基本形式

1.png

  副词

1.png

  常用名词复数形式

1.png