国家开放大学大数据技术
系统抽样又称之为()? 【A.】随机抽样 【B.】等距抽样 【C.】分层抽样 【D.】类型抽样
答案是:B
下列不属于特征约简的步骤的是()? 【A.】搜索过程 【B.】填补过程 【C.】评估过程 【D.】分类过程
答案是:B
下列不属于数据约简策略的是()? 【A.】特征约简 【B.】样本约简 【C.】数值约简 【D.】文本约简
答案是:D
数据规范方法主要有最小最大规范法、z分数规范法和()? 【A.】极差规范法 【B.】小数定标规范法 【C.】模糊规范法 【D.】聚类方法
答案是:B
数据平滑方法主要有指数平滑法、移动平均法和()? 【A.】统计法 【B.】最短距离法 【C.】分箱平滑法 【D.】聚类方法
答案是:C
小数定标规范化方法中,其小数点移动的位数依赖于()? 【A.】最大绝对值 【B.】最小绝对值 【C.】均值绝对值 【D.】中位数绝对值
答案是:A
Z分数规范化方法中对于离群点,均值绝对偏差相比标准差()? 【A.】更有效 【B.】更平稳 【C.】更精确 【D.】更鲁棒
答案是:D
如果x的平均值和标准差分别为 54000和 16000。使用z分数规范化方法,x的值 73600被转换为()? 【A.】1.125 【B.】1.025 【C.】1.225 【D.】1.325
答案是:C
Z分数规范化方法依据的是原始数据的()? 【A.】均值和中位数 【B.】中位数和极差 【C.】极差和方差 【D.】均值和标准差
答案是:D
假定某属性x的最小值、最大值分别为12000和98000,将属性x映射到 [0, 1]中,根据最小最大规范化方法,x的值 73600(设定值)将转换为()? 【A.】0.716 【B.】0.616 【C.】0.516 【D.】0.8
答案是:A
下列不属于数据规范化的作用的是()? 【A.】加快学习速度 【B.】规范事物概念 【C.】避免单位的影响 【D.】呈现数据的集中程度
答案是:D
数据规范化是将原来的度量值转换为()? 【A.】无量纲的值 【B.】原来度量值的均值 【C.】原来度量值的方差 【D.】原来度量值的极差
答案是:A
下列不属于分箱平滑法参照的是()? 【A.】箱内数值的均值 【B.】箱内数值的中值 【C.】箱内数值的边界值 【D.】箱内数值的方差
答案是:D
下列不属于指数平滑法的适用范围的是()? 【A.】近期趋势预测 【B.】短期趋势预测 【C.】中期趋势预测 【D.】长期趋势预测
答案是:D
下列不属于指数平滑法的适用范围的是()? 【A.】稳定变化态势的时间序列数据 【B.】不稳定变化的时间序列数据 【C.】规则变化的时间序列数据 【D.】直线上升或下降趋势的时间序列数据
答案是:B
下列属于二次移动平均法的适用范围的是()? 【A.】水平变动的时间序列数据 【B.】长期变动趋势的时间序列数据 【C.】循环性变动的时间序列数据 【D.】直线上升或下降趋势的时间序列数据
答案是:D
下列属于一次移动平均法的适用范围的是()? 【A.】水平变动的时间序列数据 【B.】长期变动趋势的时间序列数据 【C.】循环性变动的时间序列数据 【D.】季节变动趋势的时间序列数据
答案是:A
下列不属于移动平均法的是()? 【A.】一次移动平均法 【B.】二次移动平均法 【C.】混合移动平均法 【D.】多次移动平均法
答案是:C
下列不属于数据平滑方法的是()? 【A.】移动平均法 【B.】最大最小值标准化 【C.】指数平滑法 【D.】分箱平滑法
答案是:B
下列不属于地图的构成要素的是()? 【A.】图形要素 【B.】价格要素 【C.】数学要素 【D.】辅助要素
答案是:B
噪声是指测量数据中的()? 【A.】随机误差 【B.】均值 【C.】方差 【D.】极差
答案是:A
下列不属于数据转换中适合平方根转换的数据是()? 【A.】泊松分布数据 【B.】轻度偏态数据 【C.】样本方差和平均数呈现正相关的数据 【D.】数值相差不大的数据
答案是:D
下列不属于数据转换中适合对数转换的数据是()? 【A.】部分正偏态数据 【B.】等比数据 【C.】等差数据 【D.】数值相差不大的数据
答案是:C
数据清洗算法的衡量标准主要包含 ( )、错误返回率和精确度。 【A.】冗余度 【B.】返回率 【C.】可用性 【D.】一致性
答案是:B
增量数据抽取方式只抽取()? 【A.】PB级数据 【B.】不变数据 【C.】变化数据 【D.】有价值数据
答案是:C
下列不属于文本相似度计算流程的是()? 【A.】文本排序 【B.】文本分词 【C.】统计词频 【D.】写出词频向量
答案是:A
下列不属于文本相似度计算的应用领域的是()? 【A.】信息检索 【B.】数据挖掘 【C.】文档修改 【D.】机器翻译
答案是:C
下列不会造成文本记录重复相似的是()? 【A.】插入 【B.】交换 【C.】等价表述 【D.】删除冗余
答案是:D
下列不属于数据清洗算法标准的是()? 【A.】返回率 【B.】错误返回率 【C.】正确返回率 【D.】精确度
答案是:C
下列不属于数据质量一致性的是()? 【A.】数据编码一致性 【B.】数据大小一致性 【C.】指标统计一致性 【D.】指标计算一致性
答案是:B
下列不属于数据质量的要素的是()? 【A.】准确性 【B.】完整性 【C.】异质性 【D.】及时性
答案是:C
下列不属于数据清洗的是()? 【A.】检查数据的完整性 【B.】修改数据 【C.】填补数据 【D.】消除重复
答案是:B
下列不属于MD5(消息摘要算法)的特点的()? 【A.】对源系统的倾入性较小 【B.】被动地进行全表数据的比对 【C.】性能优异 【D.】准确性不稳定
答案是:C
下列不属于基于时间戳的增量数据抽取方式的优点的是()? 【A.】性能优异 【B.】系统设计清晰 【C.】数据抽取简单 【D.】对业务系统无其他要求
答案是:D
时间戳是能表示一份数据在某个特定时间之前已经存在的、完整的、可验证的一个数据,其通常是()? 【A.】一个数据集 【B.】一个字符序列 【C.】一个日志文件 【D.】一段储存代码
答案是:B
下列不属于地域空间可视化展现的功能的是()? 【A.】认识功能 【B.】模拟功能 【C.】载负功能 【D.】学习功能
答案是:D
下列不属于增量数据抽取特点的是()? 【A.】抽取发生变化的数据 【B.】快捷 【C.】处理量更多 【D.】需要与数据装载时的更新策略相对应
答案是:C
下列不属于大数据抽取方式的是()? 【A.】同构同质数据抽取 【B.】异构同质数据抽取 【C.】同构异质数据抽取 【D.】文件型数据抽取
答案是:B
下列不属于数据库架构混合应用模式的是()? 【A.】OldSQL+NewSQL混合模式 【B.】OldSQL+NoSQL+ NewSQL混合模式 【C.】OldSQL+NoSQL混合模式 【D.】NewSQL+NoSQL混合模式
答案是:B
下列不属于NoSQL数据库的键值式存储的常见形式的是()? 【A.】临时型 【B.】附加型 【C.】混合型 【D.】永久型
答案是:B
下列不属于NoSQL数据库的存储方式的是()? 【A.】行式存储 【B.】键值式存储 【C.】图形式存储 【D.】文档式存储
答案是:A
下列不属于NoSQL数据库的特点的是()? 【A.】需预定义数据模型 【B.】支持透明横向扩展 【C.】将数据进行分区 【D.】保证最终一致性
答案是:A
下列不属于网络爬虫的数据抓取方式的是()? 【A.】预先给定的初始抓取种子样本 【B.】预先给定的网页分类目录和与分类目录对应的种子样本 【C.】通过用户行为确定的抓取目标样例 【D.】自行编写种子样本
答案是:D
下列不属于爬虫对抓取目标的定义原则的是()? 【A.】目标网页特征 【B.】目标数据量 【C.】目标数据模式 【D.】领域概念
答案是:B
下列属于浅聚焦网络爬虫的核心特点的是()? 【A.】数量巨大 【B.】范围较大 【C.】精准筛选 【D.】选定URL种子
答案是:D
下列属于聚焦网络爬虫的特点的是()? 【A.】数量巨大 【B.】范围较大 【C.】精准筛选 【D.】爬行速度慢
答案是:C
下列不属于通用网络爬虫的局限性的是()? 【A.】无用网页较多 【B.】对非结构化数据获取相对容易 【C.】难以支持基于语义信息的查询 【D.】有限的网络爬虫服务器资源与无限的网络数据资源之间的冲突
答案是:B
下列不属于网页的爬虫策略的是()? 【A.】深度优先搜索策略 【B.】精确选择搜索策略 【C.】广度优先搜索策略 【D.】最佳优先搜索策略
答案是:B
下列不属于通用网络爬虫的结构的是()? 【A.】页面爬行模块 【B.】页面分析模块 【C.】页面数据库 【D.】页面修改模块
答案是:D
下列不属于通用网络爬虫的特点及要求的是()? 【A.】数量巨大 【B.】范围较小 【C.】存储空间要大 【D.】爬行速度要快
答案是:B
下列不属于网络爬虫工作过程的是()? 【A.】获取网页 【B.】修改网页 【C.】解析网页 【D.】储存数据
答案是:B
下列不属于网站数据采集的数据的是()? 【A.】非结构化数据 【B.】半结构化数据 【C.】结构化数据 【D.】实验测试数据
答案是:D
下列不属于网站内部数据库中的数据的是()? 【A.】用户信息数据 【B.】野外实测数据 【C.】网站产品数据 【D.】网站运营数据
答案是:B
下列不属于空间数据的特性的是()? 【A.】定位 【B.】定量 【C.】定性 【D.】时空关系
答案是:B
下列属于意见建议类用户反馈的特点的是()? 【A.】反馈量大 【B.】反馈速度快 【C.】针对性强 【D.】传播快
答案是:C
下列不属于文本数据的获取特点的是()? 【A.】灵活度高 【B.】速度快 【C.】按需获取 【D.】易处理
答案是:D
下列不属于文本数据的是()? 【A.】广告 【B.】音频 【C.】杂志 【D.】图书
答案是:B
气泡图由什么演化而来是()? 【A.】直方图 【B.】条形图 【C.】散点图 【D.】折线图
答案是:C
下列属于大数据获取的特点的是()? 【A.】数据源单一 【B.】数据量较小 【C.】结构单一 【D.】包括结构化、半结构化和非结构化数据
答案是:D
下列不属于大数据获取的特点的是()? 【A.】数据源多种多样 【B.】数据量巨大 【C.】结构单一 【D.】结构化、半结构化和非结构化数据
答案是:C
下列属于传统数据获取的特点的是()? 【A.】数据源多种多样 【B.】数据量巨大 【C.】结构单一 【D.】结构化、半结构化和非结构化数据
答案是:C
下列不属于信息可视化的分类的是()? 【A.】一维信息可视化 【B.】三维信息可视化 【C.】截面数据可视化 【D.】时序信息可视化
答案是:C
下列不属于MapReduce模型的限制因素的是()? 【A.】任务要求 【B.】数据不可无限分割 【C.】通信开销 【D.】集群规模
答案是:A
MapReduce将计算过程分解的最大好处是()? 【A.】复杂化 【B.】快捷化 【C.】并行化 【D.】低成本
答案是:C
MapReduce模型适用场景的特点()? 【A.】数据可实时处理 【B.】任务不可分解 【C.】任务可分解 【D.】任务需要顺序执行
答案是:C
MapReduce模型的最大优点体现在()? 【A.】输入方便 【B.】分布式处理 【C.】各类型数据输入 【D.】算法简单
答案是:B
MapReduce模型将数据集的大规模操作分发给网络上的各节点,每个节点将已完成的工作和状态更新,周期性地报告给()。 【A.】作业 【B.】任务 【C.】作业服务器 【D.】任务服务器
答案是:C
文本数据是典型的()? 【A.】结构化数据 【B.】半结构化数据 【C.】非结构化数据 【D.】混合结构数据
答案是:C
下列不属于文本数据语义特征的是()? 【A.】词频 【B.】逻辑结构 【C.】动态演化规律 【D.】数据结构
答案是:D
Hadoop作业服务器不负责()? 【A.】接受用户提交的作业 【B.】任务的分配 【C.】执行具体的任务 【D.】管理所有的任务服务器
答案是:C
Reduce任务目标是()? 【A.】输入文件 【B.】输入数据 【C.】输入图表 【D.】将若干个Map任务生成的中间文件汇总到最后的输出文件
答案是:D
Hadoop开发环境部署内容不包括()? 【A.】安装SSH协议 【B.】Hadoop系统部署 【C.】伪分布式Hadoop环境部署 【D.】电脑断网
答案是:D
WordCount完成的功能是统计()? 【A.】按列分割文件数 【B.】输入文件中单词频数 【C.】按行分割文件数 【D.】输入文件中单词频率
答案是:B
下列不属于单词计数的Map过程的是()? 【A.】按列分割文件 【B.】分词处理 【C.】按行分割文件 【D.】排序与合并
答案是:A
Hadoop的核心是( )和MapReduce。 【A.】NTFS 【B.】GFS 【C.】HDFS 【D.】FS
答案是:C
在MapReduce模型编程中,不属于其步骤的是()? 【A.】遍历数据 【B.】映射键值 【C.】数据分组 【D.】数据插补
答案是:D
下列不属于Map任务的执行的子步骤的是()? 【A.】输入准备 【B.】输入修改 【C.】算法执行 【D.】输出生成
答案是:B
下列不属于一个作业的计算流程的是()? 【A.】作业开始 【B.】作业修改 【C.】Map任务分配 【D.】Reduce任务执行
答案是:B
在Hadoop中,作业服务器被称为()? 【A.】Job 【B.】Map 【C.】Master 【D.】Reduce
答案是:C
在Hadoop中,将每个作业拆分为若干个()? 【A.】文本 【B.】Map任务 【C.】数据集 【D.】Reduce任务
答案是:B
在Hadoop中,将每一次计算请求称为一个()? 【A.】文本 【B.】函数 【C.】数据集 【D.】作业
答案是:D
MapReduce以什么方式进行分布式计算()? 【A.】文本 【B.】函数 【C.】数据集 【D.】矩阵
答案是:B
下面不属于大数据在通讯行业的应用是()? 【A.】预测客户行为 【B.】市场监控 【C.】智能电表 【D.】市场预警
答案是:C
下面不属于企业大数据应用成功的考虑因素是()? 【A.】成本 【B.】客户满意度 【C.】附加收益 【D.】工人满意度
答案是:D
基于任务的定义和分类,下列不属于可视分析关注点的是()? 【A.】以用户价值为关注点 【B.】以用户意图为关注点 【C.】以同户行为为关注点 【D.】以软件操作为关注点
答案是:A
下面不属于判断大数据应用成功的指标是()? 【A.】创造价值 【B.】具备高速度 【C.】在本质上提高 【D.】低性能
答案是:D
下面不属于数据流技术应用的方式是()? 【A.】指定查询 【B.】模糊查询 【C.】即席计算 【D.】中间计算
答案是:B
下面不属于大数据计算模式的类型的是()? 【A.】批量计算 【B.】手动计算 【C.】流式计算 【D.】交互式计算
答案是:B
下面不属于流式数据的特点的是()? 【A.】实时性 【B.】层次性 【C.】易失性 【D.】突发性
答案是:B
下面不属于流式数据源的是()? 【A.】硬盘数据 【B.】传感器数据 【C.】图像数据 【D.】流媒体传输
答案是:A
下面仅属于大数据在线处理模式的是()? 【A.】批量计算 【B.】流式计算 【C.】手动计算 【D.】交互处理
答案是:B
下面不属于大数据处理模式的是()? 【A.】离线处理 【B.】在线处理 【C.】手动计算 【D.】交互处理
答案是:C
下面不属于大数据离线处理特点的是()? 【A.】数据保存时间短 【B.】数据不会发生改变 【C.】可进行复杂的批量计算 【D.】方便查询计算结果
答案是:A
下面不属于大数据的处理过程的是()? 【A.】数据获取、储存 【B.】数据清洗 【C.】数据分析 【D.】数据安全
答案是:D
下面属于结构化数据的是()? 【A.】表格数据 【B.】图形 【C.】图像 【D.】HTML文档
答案是:A
下面不属于大数据的特性是()? 【A.】数据量大 【B.】多样性 【C.】真实性差 【D.】具有价值
答案是:C
下面不属于互联网大数据的是()? 【A.】视频 【B.】图片 【C.】音频 【D.】心情
答案是:D
下面不是数据产品开发的特征的是()? 【A.】多样性 【B.】无竞争性 【C.】增值性 【D.】层次性
答案是:B
下面是数据科学的主要研究内容的是()? 【A.】数据泄露 【B.】数据交易 【C.】数据盗窃 【D.】数据分析
答案是:D
下面不是研究数据方法的是()? 【A.】统计学 【B.】机器学习 【C.】心理分析 【D.】数据挖掘
答案是:C
数据科学的研究对象是()? 【A.】药品成分 【B.】文学作品 【C.】数据界的数据 【D.】人类历史
答案是:C
可视分析是一种()? 【A.】交互式用户界面模型 【B.】结构化用户界面模型 【C.】非结构化用户界面模型 【D.】独立式用户界面模型
答案是:A
目前为: 3/3 页  首页   上页 下页 尾页