您好,欢迎来到九壹网。
搜索
您的当前位置:首页大数据背景下“数据挖掘”课程的教学研究

大数据背景下“数据挖掘”课程的教学研究

来源:九壹网
第34期 2017年12月 江苏科技信息 Jiangsu Science&Technology Information No.34 December,2017 大数据背景下“数据挖掘"课程的教学研究 黄艳梅 (江西工程学院,江西新余338029) 摘要:数据挖掘是大数据背景下的独特产物,如今已经走进了各大高等职业院校,从而为大数据的有效 应用提供了较大帮助。在这种睛况下,“数据挖掘”课程的教学改革及研究引起了社会以及教育界的一致 关注。“数据挖掘”课程因涉及的知识较杂,学科较多,因此,在具体教学的过程中,遭遇了较大难题。一般 而言,“数据挖掘”课程的学习内容包括数据预处理、数据仓库、数据挖掘和数据挖掘应用。现如今,数据 挖掘技术虽然已经在各行各业进行大面积的应用,但是主要的应用还是在电子商务、移动网络、网络办 公等领域。文章以“数据挖掘”为主要内容进行分析,对"3-前的教学改革提出相应的建议。 关键词:数据挖掘;大数据;教学;改革 0引言 大的数据库产生了一定变化,如MB,GB,TB以及EB等, 大数据背景下,人们利用网络能够在最短的时间 未来随着数据库的不断壮大,相信会出现更大的数据 内处理相关事务,极大地提升了生产能力和效率。伴 统计单位。(2)数据的表现形式较多,其中文本形式最 随着数据越来越丰富,如何有效地利用数据促进社会 普遍,易存储、易挖掘。另外,图片、音频、视频等现如 各行各业的发展已经成为人们需要探索的问题,而 今应用较广的数据形式,占用的数据库空间较大,但 “数据挖掘”课程就是基于这种情况下的产物,对于数 也正逐渐成为一般性的数据结构形式,而其他的如 据化在各领域的发展具有积极的促进作用。但是,由 网络中的关键词等为一些不完整的数据结构形式[ 。 于课程的复杂性正在日益加深,教学面临极大的困难, (3)在实际应用过程中,数据化的处理、存储、挖掘与 因此,有效地进行教学改革是课程发展的必由之路。 应用是一个相互促进的过程,之间也存在着较大联 本文在分析教学现状的基础上,从增强学生数据敏锐 系,不同的数据结构形式可以相互转换,因此,在丰富 意识、夯实学生的理论基础、培养学生的实践能力以 数据存储网络的同时,也为实际挖掘与应用加大了难 及提升学生独自探索能力这几个方面对课程的改革 度。而从数据的本质而言,数据本身就是从社会的各 方向进行了探索。 领域中汇总而来,社会各领域的不断深入联系,使人 1大数据相关概述 们在进行数据处理时需要加大处理范围,因此,造成 大数据是一个较为宽泛的概念,互联网发展到一 了数据处理的难度[2]。(4)在数据处理的过程中,大 定时期,由于其相关的数据处理能力、数据存储能力、 数据运行的速度较快,在一定程度上加快了数据处理 数据检索功能以及数据具体应用较强,人们将这种现 整个过程的效率。 象统称为“大数据现象”。因此,大数据不能简单地用 2教学软件分类 具象化的事物进行概括。人们普遍认为大数据是一个 如今,数据挖掘工具也有不同种类,常用的一般 支撑网络运行的数据集合,并通过多台计算机进行数 有WEKA,RapidMiner,NLTK,Orange,KNIME以及R— 据互联,通过云处理、云计算的方式对其进行挖掘及 Programming等。其中,WEKA基于Java编程语言,因 应用。 其设计较为繁杂,功能较为全面,因此,在实际运用过 (1)数据包有大小之分,而其单位也随着日渐庞 程中,可以适应多领域的数据挖掘需求。此外,它能对 基金项目:2016年江西省高等学校教学改革研究省级课题;项目名称:大数据时代高职院校数据存储与 应用的建设研究;项目编号:JXJG一16—28—3。 作者简介:黄艳梅(1979__),女,江西南昌人,讲师,硕士;研究方向:计算机网络技术。 一63 第34期 2017年12月 No.34 江苏科技信息・科教研究 December,2017 数据处理的整个过程进行干涉,并根据实际需求进行 软件功能的定义,以此让其功能更加适用。RapidMiner 式均为一致,一般文件都储存在其自带的存储库中。 需要明确注意的是,在进行教学之前,需要安装专门 的文件阅读编辑器。(2)选择合适的算法以及实验的 数据集。本文教学实验中所选用的是C4.5,选用的数 是一款位列挖掘工具排行榜榜首的工具,广受人们的 喜爱,其主要原因在于虽然其也是基于Java编程语言 的工具,但是在实际运用过程中不须用户实际编写,极 大地节省了用户的时间。更可贵的是此软件在实际运 用过程中镶嵌了WEKA的一些运行程序,使其功能 更加完善,此外,它是一款开源数据工具l3]。NLTK在 语言处理方面是这类挖掘工具的最强者,对各类语言 能够精确分析并实施处理工作,在运行的过程中,极大 据集为某种疾病的预测样本数据集,并提前将其转 化为对应的格式,其中屙l生为9个,样本为260个。其 中1个类别属性,并为两个可能性。(3)掌握相应的工 具中的测试使用方式,以及c4.5算法具体实施关键 内容。 3.2实验步骤 地了使用者的双手,基于Python的工具能够为实 际的使用体验增添一些乐趣,因为它还能够白定义一 些任务。Orange的优点则在于它可视化的编程设计, 包容性强,并且其附加了强大的文本挖掘工具,对运 用具有实际性的帮助,因此,适用从简单到复杂的一 系列数据处理工作,深受各类用户的喜爱。KNIME在 数据处理阶段,具有较为全面的功能,并能够同时适 主要的步骤具体分为以下几个方面。首先,将相 应的数据集加载进数据挖掘工具,在其面板上选择对 应文件进行加载,一般在其接口处,以此完成数据预 处理工作。其次,在其工具中的分类功能,“工具assify” 中设置相关参数,因其有很多的子条目,因此,具体操 作如下:单击“设置assify”一“trees”一“J48”——“v参 数分类器”一“J48”一“c0.25”一“M2”。老师在学生完成 后需要对此认真进行检查,让学生能够明确步骤;设定 用商用以及开源性的工作需要,在具体处理的过程中, 尽量照顾到了用户多次处理的需要,以便用户对结 果进一步完善。R—Programming集成了大部分软件的 优点,重点是在统计、制图上具有一定的成效,包含了 其测试选项,具体如下,单击“老师assify''_。‘‘Testoptions” usetrainingtest”,这个过程不拘于一种形式,可以让 “学生进行多选择的练习;评估样本设置,单击“这个 assify”一“Start”,进行评估以及分类器的设定,学生应 该分析其中的结果输出,从而进行具体判断,完成数 据挖掘工作;对于所分析的结果进行了解之后,将以 这方面软件的开发、数据建模,其编写的语言综合 了c语言、FORTRAN语言以及R语言。在这款工具 中,R语言被极大地扩展,使其工具的使用难度也进一 步降低[ 。 本文选用的是功能较为全面的WEKA数据挖掘 工具,因其适用的系统为中文版3.6.11版本,也是一 款比较适用于学习的软件,其中包含了在预处理过程 中能够使用到的学习算法、数据预处理、数据分类、回 上步骤进行重复演练,随机更改以及添加相应的样本 数据属性以及分类参数,从而得到不一样的结果。最 后,老师在对学生的试验成果进行评估之后,引导学生 对相应的结果进行可视化展示,具体如下:单击“进行 assify'’。 ‘ResuItList”一“trees.J48”一“vsualizetree”。 归分析等,在交互界面上能够实现可视化。而如果需 要针对某项数据进行特定的处理,一般也可以选择在 其中编辑出适用的算法,以适应教学内容。而其广泛 使用的历史也能够证明其具有较为完备的系统功能, 比较适用于新课程的改革和研究。因此,本文以WEKA 4结语 “数据挖掘”是一门涉及范围广、多门类、专业性 的实践应用课程,早在20世纪十年代,国外计算 机领域的专家就提出将其作为一个的计算机门 类进行研究,到了21世纪初期,随着人们对于计算机 数据处理及应用要求的不断提升,数据挖掘也逐渐发 挥出了相应的功用,在诸多领域内起着积极的作用。随 着数据形式、内容的不断丰富,必将演变出更实用的 数据挖掘技术,为教学改革提供动力。 参考文献 数据挖掘工具为基础,对“数据挖掘”课程的教学实践 进行探索,为提高学生的实践能力以及夯实理论基础 提供一定的帮助。 3实践教学示例 3.1 实验准备 一般而言,在进行实验之前,教师需要准备相关 数据,以便具有明确的实验流程。(1)对于工具的认 识,在WEKA中,首先要认识其数据格式,以免在分析 的过程中数据运行出现问题。WEKA的数据格式为 [1]方璐.浅析大数据时代的科学研究方法[J].信息通 信,2014(5):150—151. [2]张艳.大数据背景下的数据挖掘课程教学新思考[J]. 计算机时代,2014(4):59—61. ARFF,所以在进行运算分析以及处理过后的文件格 ——64 34 2017年12月 第34期 No.江苏科技信息・科教研究 December,2017 [3]李海林.大数据环境下的数据挖掘课程教学探索[J]. 掘课程实践教学探索[J].池州学院学报,2016(6):128- 计算机时代,2014(2):54—55. 130. [4]叶明全,黄道斌,卢小杰,等.大数据时代下数据挖 (责任编辑王雪芬) Teaching research on“Data Mining ”course under the background of big data Huang Yanmei (Jiangxi University of Engineering,Xinyu 338029,China) Abstract:Data mining is a unique product under the background of big data,and nOW it has entered the maj0r hi er vocational colleges,SO as to provide effective help for the effective application of big data・In this ca 。,th。 teaching ref0l珊and research of “Data Mining”course has aroused the unanimous concern of the society and the educational circles.The‘‘Data Mining”course involves more knowledge and more subjects,SO it encounte great dififculties in the process of teaching.Generally speaking,the course of“Data Mining”includes data preprocessmg, data waI.eh0use,data mining and data mining applications.Today,data mining has been widely used in all walks ot life.but the main application areas are in e-commerce,mobile network,network office and SO on.This pape ana1vzes the data mining as the main content and puts forward some suggestions for the current teaching re1o珊・ Key words:Data Mining;big data;teaching;reform (上接第47页) 参考文献 [2]戴伟.面向用户感知的广电数据业务监测探讨[J]. [1]汪剑.建立宽带网络质量监测系统掌握网络运维 有线电视技术,2014(5):67-70. 第一手资料[J].有线电视技术,2015(3):75—81. (责任编辑孙琳) Application of network quality monitoring system in Jiangsu broadcasting broadband Li Qin (Jiangsu Broadcasting Data Network Corporation Limited,Nanjing 210000,China) Abstract:111is paper analyzes the imp。rtance。f netw。rk quality monitoring system depl。yed on Jiangsu broadcasting broadband'introduces the depl。yment scheme and the procedure。f the netw。rk quality monit。ring system,analyzes the main monitoring task type and the comparison of the parameter data in detail・ Key words:netw。rk quality m。nitoring system;Jiangsu broadcasting broadband;user exPerienc。 一65— 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- 91gzw.com 版权所有 湘ICP备2023023988号-2

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务