广东开放大学数据分析与
线性回归包括一元线性回归、多元线性回归和分段回归( ) 选择一项: 对 错
答案是:错
关联规则数据挖掘的主要目的是找出数据集中同时出现的关系( ) 选择一项: 对 错
答案是:对
回归分析是通过建立模型来研究变量之间相互关系的密切程度、结构状态及进行模型预测的一种有效工具( ) 选择一项: 对 错
答案是:对
贝叶斯定理的应用场景包括分类问题的归类。( ) 选择一项: 对 错
答案是:错
从狭义角度来说,相对于数据挖掘,数据分析侧重于实际的业务知识。( ) 选择一项: 对 错
答案是:对
相对于数据分析来说,数据挖掘更需要有优秀的编程能力。( ) 选择一项: 对 错
答案是:对
从狭义角度来说,相对于数据挖掘,数据挖掘的结果是模型或规则。 选择一项: 对 错
答案是:对
神经网络对于复杂的非线性的决策边界的建模能力高度准确,并且也不太容易过拟合。( ) 选择一项: 对 错
答案是:错
支持向量机的优点是容易过拟合( ) 选择一项: 对 错
答案是:错
从广义角度来说,数据分析和数据挖掘包含的范畴是一致的。( ) 选择一项: 对 错
答案是:错
通常情况下,神经网络不会应用在下列哪个领域?( ) 选择一项: a. 模式识别 b. 预测系统 c. 统计分析 d. 信号处理
答案是:C
下列常用的数据分析与挖掘工具中,不属于开源工具的是?( ) 选择一项: a. Python b. SPSS c. Weka d. R语言
答案是:B
从狭义角度来说,数据分析与数据挖掘是有区别的。下列哪项是对狭义层面下数据分析的描述?( ) 选择一项: a. 数据分析更重视结合业务知识解读统计结果 b. 数据分析需要有过硬的数学功底和编程技术 c. 数据分析更重视模型或规则的构
答案是:A
有一天,老师问了个问题,只根据头发和声音怎么判断一位同学的性别。为了解决这个问题,同学们马上简单的统计了7位同学的相关特征数据。那么请问,要解决老师的问题,采用哪种数据挖掘方法最合适?( ) 选择一项: a. 假设检验 b. 聚类分析
答案是:D
下列选项中,不是对支持向量机的描述的是?( ) 选择一项: a. 在线性的情况下,就在原空间寻找两类样本的最优分类超平面 b. 以结构风险最小为原则 c. 对于复杂的非线性的决策边界的建模能力高度准确,并且也不太容易过拟合 d.
答案是:D
下面选项中,属于列表的方法的是( )。 选择一项或多项: a. 假设检验 b. 贝叶斯定理 c. PowerBI d. Weka
答案是:CD
免费的数据分析与挖掘工具有下列哪几种:( ) 选择一项或多项: a. Weka b. R语言 c. Python d. SPSS
答案是:ABC
数据挖掘流程的操作步骤有几种?( ) 选择一项或多项: a. 应用部署 b. 模型评估 c. 构建模型 d. 数据清洗
答案是:ABCD
下列不属于数据挖掘技术的有:( ) 选择一项或多项: a. 假设检验 b. Weka c. SQL d. PowerBI
答案是:BCD
下列属于数据挖掘技术的有:( ) 选择一项或多项: a. 神经网络 b. 回归分析 c. 决策树 d. 关联规则
答案是:ABCD
相对于数据分析来说,数据挖掘需要掌握的技能有:( ) 选择一项或多项: a. 优秀的编程能力 b. 良好的数学功底 c. 常用可视化图表展现的能力 d. 基本的统计学知识
答案是:AB
相对于数据分析来说,数据挖掘更加侧重于哪些层面:( ) 选择一项或多项: a. 运用技术手段从海量的数据中发现未知的模式和规律 b. 技术的实现 c. 将数据和业务紧密结合,实现功效的最大化 d. 实际的业务知识
答案是:AB
下列属于数据挖掘技术的有:( ) 选择一项或多项: a. 决策树 b. SPSS c. 神经网络 d. 支持向量机
答案是:ABC
下列选项中,属于数据挖掘的成熟技术的是:( ) 选择一项或多项: a. 聚类方法 b. 神经网络 c. 决策树 d. 支持向量机
答案是:ABCD
属于数据分析与数据挖掘工具的有:( ) 选择一项或多项: a. Python b. SQL c. R语言 d. Weka
答案是:ACD
下列不是对决策树CHAID算法的描述的选项是?( ) 选择一项: a. ID3 b. CART c. SQL) d. CHAID
答案是:C
下列描述中,不属于神经网络的特点的是?( ) 选择一项: a. 良好的自适应性、自组织性和高容错性 b. 大规模并行结构和信息的并行处理 c. 较强的学习、记忆和识别功能 d. 完美的知识和结果的解释性
答案是:D
下列关于聚类分析不正确的说法是:( ) 选择一项: a. 运用层次的方法, 依次让最相似的数据对象两两合并,这样不断地合并,最后就形成了一棵聚类树 b. 直接作为模型对观察对象进行群体划分 c. 数据处理阶段用作数据探索的工具,通过
答案是:D
关于神经网络,描述错误的选项是?( ) 选择一项: a. “神经网络是通过输入多个非线性模型以及不同模型之间的加权互联 b. 大规模串行结构和信息的串行处理 c. 主流的神经网络算法是反馈传播,该算法在多层前向型神经网络上进行学习
答案是:B
在回归分析中,不属于参数估计方法改进方向的选项是?( ) 选择一项: a. 岭回归 b. 非线性回归 c. 主成分回归 d. 偏最小二乘回归
答案是:B
相对于数据挖掘来说,数据分析呈现的结果更多偏向于:( ) 选择一项: a. 统计描述结果的呈现 b. 通过模型或规则实现智能的商业决策,划分产品所属的群类 c. 通过模型或规则可对未知标签的数据进行预测判别用户是否响应某种营销活动
答案是:A
2008年,谷歌发布了“谷歌流感趋势”地图,利用人们突然狂搜感冒、咳嗽、发烧等和流感相关的词汇直接预测流感爆发。这主要是运用了下列哪项数据挖掘技术?( ) 选择一项: a. 假设检验 b. 神经网络 c. 回归分析 d. 决策树
答案是:C
从狭义角度来说,数据分析与数据挖掘是有区别的。下列选项中对数据分析描述错误的是?( ) 选择一项: a. 数据分析侧重于实际的业务知识 b. 优秀的数据分析能力需要统计学、数据库、Excel、可视化等知识和技能 c. 数据分析属于描
答案是:D
下列选项中,不是对支持向量机的描述的是?( ) 选择一项: a. 在线性的情况下,就在原空间寻找两类样本的最优分类超平面 b. 基于小概率事件原理 c. 训练数据较大 d. 以结构风险最小为原则
答案是:B
Python语言是荷兰人Guido van Rossum发明的,首次公开发行的年份是哪一年?( ) 选择一项: a. 1989年 b. 1991年 c. 1993年 d. 1996年
答案是:B
2016年,Alphago以4比1击败了围棋世界冠军李世石。您认为,Alphago的能力成长主要运用了下列哪项技术?( ) 选择一项: a. 假设检验 b. 决策树 c. 支持向量机 d. 神经网络
答案是:D
不属于数据分析与数据挖掘工具的有:( ) 选择一项: a. R语言 b. SPSS c. SQL d. Python
答案是:C
下列不是对决策树CHAID算法的描述的选项是?( ) 选择一项: a. 应用的前提是因变量为类别型变量(Category) b. 依据局部最优原则 c. 利用卡方检验来选择对因变量最有影响的自变量 d. 检验标准是基尼系数(Gin
答案是:D
沃尔玛超市中“啤酒和尿不湿”的营销案例,属于哪种数据挖掘技术的经典应用?( ) 选择一项: a. 关联规则 b. 决策树 c. 聚类分析 d. 神经网络
答案是:A
如果我们要给餐饮业做数据分析和挖掘,那么在整个实际流程中,下列哪个步骤是耗时最长的?( ) 选择一项: a. 模型构建与评估 b. 应用部署 c. 数据收集与清洗 d. 明确数据挖掘目标
答案是:C
关于支持向量机,下列说法正确的选项是?( ) 选择一项: a. 大规模串行结构和信息的串行处理 b. 通过输入多个非线性模型以及不同模型之间的加权互联 c. 对于复杂的非线性的决策边界的建模能力高度准确,并且也不太容易过拟合 d
答案是:C
下列对决策树ID3算法的描述不正确的选项是?( ) 选择一项: a. 利用卡方检验来选择对因变量最有影响的自变量 b. 根据信息论理论,采用划分后样本集的不确定性作为衡量划分好坏的标准,用信息增益值度量不确定性 c. 样本集的划分
答案是:A
对于假设检验,下列说法正确的是:( ) 选择一项: a. 主要用于分类问题的归类等 b. 以结构风险最小为原则 c. 基于小概率事件原理 d. 知识和结果的不可解释性
答案是:C
不属于Python语言代码特点的是:( ) 选择一项: a. 不可移植性 b. 简洁性 c. 易读性 d. 易维护性
答案是:A
数据挖掘流程的操作步骤中,不包括以下哪种?( ) 选择一项: a. 构建模型 b. 模型评估 c. 应用部署 d. 绘制表格
答案是:D
从狭义角度来说,数据分析与数据挖掘是有区别的。下列哪项不是对狭义层面下数据挖掘的描述?( ) 选择一项: a. 数据挖掘侧重于实际的业务知识 b. 数据挖掘需要有过硬的数学功底和编程技术 c. 数据挖掘更重视模型或规则的构建 d
答案是:A
下列常用的数据分析与挖掘工具中,属于商业软件的是?( ) 选择一项: a. SPSS b. R语言 c. Weka d. Python
答案是:A
构建模型前的数据准备时间在整个数据挖掘流程中的时间占比是多少?( ) 选择一项: a. 0.8 b. 0.2 c. 0.6 d. 0.5
答案是:A
下列对数据挖掘的描述不正确的选项是?( ) 选择一项: a. 贝叶斯分类方法(Bayesian Classifier)是非常成熟的统计学分类方法,它主要用来预测类成员间关系的可能性。 b. 回归分析是通过建立模型来研究变量之间相互关系
答案是:C
采用假设检验的方法观测事件并下结论(在一定的显著性水平下得出的)时,有可能会给出错误判断。下列描述不正确的是?( ) 选择一项: a. α错误和β错误在其他条件不变的情况下是一致的,即α增大时,β就增大;α减小时,β就减小。α错误容易受
答案是:A
常见的数据模型有:层次模型、链状模型和关系模型。( ) 选择一项: 对 错
答案是:错
与层次模型相比,网状模型具有更大的灵活性,可以更直接地描述现实世界,性能和效率较好。 选择一项: 对 错
答案是:对
网状模型是关系模型的一种扩展( ) 选择一项: 对 错
答案是:错
数据库应用系统通过DBMS提供的接口操作数据库( ) 选择一项: 对 错
答案是:对
Microsoft公司的SQL Server数据库系统支持的是Transact-SQL(简称T-SQL)。 选择一项: 对 错
答案是:对
Savefig()函数的参数包含() 选择一项或多项: a. transparent b. fname c. bbox_inches d. format
答案是:ABCD
Savefig()函数的参数包含() 选择一项或多项: a. dpi b. fname c. format d. transparent
答案是:ABCD
Savefig()函数的参数包含() 选择一项或多项: a. pad_inches b. bbox_inches c. transparent d. format
答案是:ABCD
Savefig()函数的参数包含() 选择一项或多项: a. fname b. facecolor c. edgecolor d. dpi
答案是:ABCD
以下属于鼠标触发的事件() 选择一项或多项: a. button_press_event () b. draw_event() c. button_release_event() d. plot()
答案是:ABC
鼠标与键盘事件的常用属性Ydata的含义() 选择一项: a. 鼠标当前位置的x坐标,单位与轴域坐标相同 b. 鼠标当前位置的y坐标,单位与轴域坐标相同 c. 鼠标经过轴域时表示当前Axes轴域实例 d. 鼠标按下的键,1表示左
答案是:B
鼠标抬起时触发的事件() 选择一项: a. key_press_event() b. button_release_event() c. draw_event() d. button_press_event ()
答案是:B
设置当前子图的图例样式的扩展库 matplotlib.pyplot 的函数( ) 选择一项: a. mean() b. legend() c. gca () d. plot()
答案是:B
鼠标进入轴域时触发的事件() 选择一项: a. figure_enter_event() b. scroll_event() c. resize_event () d. axes_enter_event()
答案是:D
鼠标与键盘事件的常用属性Y的含义() 选择一项: a. 鼠标当前位置的y坐标,距离画布底部边界的像素数量 b. 事件名称 c. 鼠标当前位置的x坐标,距离画布左边界的像素数量 d. 触发事件的画布
答案是:A
鼠标与键盘事件的常用属性xdata的含义() 选择一项: a. 鼠标按下的键,1表示左键,2表示中键,3表示右键 b. 鼠标当前位置的y坐标,单位与轴域坐标相同 c. 鼠标经过轴域时表示当前Axes轴域实例 d. 鼠标当前位置的x
答案是:D
鼠标按下时触发的事件() 选择一项: a. button_release_event() b. key_press_event() c. draw_event() d. button_press_event ()
答案是:D
鼠标进入图形时触发的事件() 选择一项: a. resize_event () b. figure_leave_event() c. figure_enter_event() d. scroll_event()
答案是:C
绘制图形时触发的事件() 选择一项: a. draw_event() b. button_release_event() c. button_press_event () d. key_press_event()
答案是:A
在默认情况下,matplotlib 会使用 进行图形绘制,绘制的多个图形会叠加并共用同一套坐标系统。 选择一项: a. 独立绘图区域 b. 半个绘图区域 c. 不使用绘图区域 d. 整个绘图区域
答案是:D
鼠标与键盘事件的常用属性x的含义() 选择一项: a. 事件名称 b. 触发事件的画布 c. 鼠标当前位置的x坐标,距离画布左边界的像素数量 d. 鼠标当前位置的y坐标,距离画布底部边界的像素数量
答案是:C
Python扩展库 matplotlib 主要包括 ()、pyplot 等绘图模块。 选择一项: a. Pylab b. os c. pynput d. plot
答案是:A
以下不属于Python扩展库 matplotlib 主要的绘图模块( )。 选择一项: a. pynput b. 以上全部不是 c. pyplot d. Pylab
答案是:A
如果有多个子图的话可以用来首先选择子图matplotlib.pyplot 的函数( ) 选择一项: a. gca () b. mean() c. var () d. plot()
答案是:A
键盘上某个键按下时触发的事件() 选择一项: a. button_release_event() b. button_press_event () c. key_press_event() d. draw_event()
答案是:C
在计算机科学中, CAP定理指出,对于一个分布式计算系统来说,不可能同时满足的三点中不包括下列哪一项?( ) 选择一项: a. 一致性 b. 扩展性 c. 可用性 d. 分区容错性
答案是:B
下面关于Python数据库的表述错误的选项是?( ) 选择一项: a. DB-API使用Cursor()创建连接 b. Pyhon DB-API的出现是为了解决各数据库之间的应用接口混乱的局面 c. Python所有的数据库接口程
答案是:A
MySQL是Web世界中使用最广泛的数据库产品,下列对其描述正确的是:( ) 选择一项: a. MySQL 是为服务器端设计的数据库,但不能承受高并发访问 b. MySQL服务器以独立的进程运行,并通过网络对外服务 c. SQLi
答案是:A
下列对非关系型数据库NoSQL的介绍错误的是:( ) 选择一项: a. 可以简便的进行横向扩展 b. 非关系型的数据库,就是相互之间没有关系的数据库管理系统 c. 数据存储不需要固定的模式 d. NoSQL用于超大规模数据的存储
答案是:B
事务机制可以确保数据一致性。不是事务具有的属性是:( ) 选择一项: a. 一致性 b. 持久性 c. 分散性 d. 原子性
答案是:C
下列对sqlite3 模块程序表述错误的选项是?( ) 选择一项: a. connection.cursor([cursorClass])表示创建一个Connect,将在 Python 数据库编程中用到 b. connection.t
答案是:B
下列对RDBMS和 NoSQL的描述错误的选项是:( ) 选择一项: a. RDBMS具有高度组织化结构化数据 b. NoSQL具有高性能,高可用性和可伸缩性 c. NoSQL追求ACID属性,而非最终一致性 d. RDBMS的
答案是:C
关系型数据库管理系统主要不包括下列哪一项?( ) 选择一项: a. MySQL b. Oracle c. Python d. SQL Server
答案是:C
下列关于关系型数据库表述正确的选项有哪些?( ) 选择一项: a. 不同数据库管理系统之间的SQL也是完全通用的 b. 所有的关系型数据库管理系统均支持SQL c. 关系型数据库的标准语言是SQL(结构化查询语言) d. SQL
答案是:C
下列对关系型数据库的表述错误的选项是?( ) 选择一项: a. 关系型数据库是一个数据集合,“关系”就是指各个表之间的关联 b. SQL关注关系型数据库系统,以及整个计算机系统 c. 需要在数据库上执行的大部分工作都由SQL语句完
答案是:B
关系模型的每个关系的数据结构是一个规范化的二维表。( ) 选择一项: 对 错
答案是:对
层次模型建立在严格的数学概念基础上,以二维表格的形式组织数据库中的数据,二维表由行和列组成。( ) 选择一项: 对 错
答案是:错
数据、数据库、数据库管理系统与操作数据库的应用程序,加上支撑它们的硬件平台、软件平台和与数据库有关的人员一起构成了一个完整的数据库系统。( ) 选择一项: 对 错
答案是:对
数据库是事务处理、信息管理等应用系统的基础。( ) 选择一项: 对 错
答案是:对
关系模型的一个结点可以有一个或多个父结点和子结点。( ) 选择一项: 对 错
答案是:错
层次模型结构简单,容易实现,对于某些特定的应用系统效率很高。( ) 选择一项: 对 错
答案是:对
一个关系数据库由若干个表组成。( ) 选择一项: 对 错
答案是:对
SQL的功能包括数据查询、数据操纵、数据定义和数据控制4部分。( ) 选择一项: 对 错
答案是:对
甲骨文公司的Oracle数据库所使用的SQL则是PL-SQL)。( ) 选择一项: 对 错
答案是:对
不同数据库管理系统之间的SQL完全通用。( ) 选择一项: 对 错
答案是:错
鼠标进入轴域时触发事件axes_enter_event 选择一项: 对 错
答案是:对
如果需要对特定的键盘或鼠标进行响应和处理,需要首先定义事件处理函数 选择一项: 对 错
答案是:对
figure_enter_event()是鼠标触发的事件 选择一项: 对 错
答案是:对
鼠标离开图形时触发事件figure_leave_event 选择一项: 对 错
答案是:对
折线图比较适合描述和比较多组数据随时间变化的趋势,或者一组数据对另外一组数据的依赖程度。 选择一项: 对 错
答案是:对
散点图比较适合描述和比较多组数据随时间变化的趋势,或者一组数据对另外一组数据的依赖程度。 选择一项: 对 错
答案是:错
绘制图形时触发事件button_release_event 选择一项: 对 错
答案是:错
如果需要对特定的键盘或鼠标进行响应和处理,不需要首先定义事件处理函数 选择一项: 对 错
答案是:错
figure_enter_event()不是鼠标触发的事件 选择一项: 对 错
答案是:错
图形窗口关闭时触发事件button_press_event 选择一项: 对 错
答案是:错
对于缺失值的处理操作有:()。 选择一项或多项: a. 重新录入数据 b. 不处理 c. 对可能值进行插补 d. 删除存在缺失值的记录
答案是:BCD
Python 主要统计绘图函数有( )。 选择一项或多项: a. plot() b. boxplot() c. hist() d. pie()
答案是:ABCD
平均水平指标是对个体集中趋势的度量,使用最广泛的是( )。 选择一项或多项: a. 中位数 b. 极差 c. 均值 d. 变异系数
答案是:AC
pandas 主要统计特征函数有( )。 选择一项或多项: a. mean() b. unique() c. corr() d. sum()
答案是:ACD
处理缺失值的方法可分为()。 选择一项或多项: a. 不处理 b. 添加数据 c. 数据插补 d. 删除记录
答案是:ACD
函数open的打开模式有多种,下列说法正确的是?( ) 选择一项或多项: a. ”r “表示以只读方式打开文件。文件的指针将会放在文件的开头 b. ”a “表示打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾
答案是:ABCD
Urllib是 Python 内置的 HTTP 请求库,它包含下列哪几个模块?( ) 选择一项或多项: a. Robotparser模块 b. error 异常处理模块 c. parse 工具模块 d. Request 请求
答案是:ABCD
关于函数open的打开模式,下列说法正确的是?( ) 选择一项或多项: a. ”wb+ “表示以二进制格式打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件 b. ”a+ “表示打开一个文件用于读写。如果
答案是:ACD
HTML和XML是两种典型的网页组织形式,下列表述正确的是?( ) 选择一项或多项: a. HTML即超文本标记语言是标准通用标记语言下的一个应用,也是一种规范,一种标准 b. 标准的HTML文件在各个浏览器下星现出的显示效果是一致
答案是:AC
HTML和XML是两种典型的网页组织形式,下列表述正确的是?( ) 选择一项或多项: a. HTML和XML是两种最常用的编程语言 b. HTML被设计用来显示数据,其焦点是数据的外观 c. HTML旨在显示信息,而XML旨在传输
答案是:BCD
以下哪个函数是计算数据样本的协方差矩阵?( )。 选择一项: a. mean() b. sum() c. cov() d. corr()
答案是:C
假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为:( ) 选择一项: a. 1.458 b. 1.224 c. 0.
答案是:D
对于定量变量而言,选择( )和是做频率分布分析时最主要的问题。 选择一项: a. “组频率”、“组频数” b. “组频数”、“组宽” c. “组数”、“组频率” d. “组数”、“组宽”
答案是:D
在3σ原则下,异常值被定义为一组测定值中与平均值的偏差超过( )倍标准差的值。 选择一项: a. 4倍 b. 3倍 c. 2倍 d. 1倍
答案是:B
某国国内生产总值2009年为2008年的109.01%,这是( )。 选择一项: a. 计划完成相对数 b. 动态相对数) c. 比较相对数 d. 比例相对数
答案是:B
目前为: 1/3 页  首页   上页  下页 尾页