系统抽样又称之为()?
【A.】随机抽样
【B.】等距抽样
【C.】分层抽样
【D.】类型抽样
答案是:B
下列不属于特征约简的步骤的是()?
【A.】搜索过程
【B.】填补过程
【C.】评估过程
【D.】分类过程
答案是:B
下列不属于数据约简策略的是()?
【A.】特征约简
【B.】样本约简
【C.】数值约简
【D.】文本约简
答案是:D
数据规范方法主要有最小最大规范法、z分数规范法和()?
【A.】极差规范法
【B.】小数定标规范法
【C.】模糊规范法
【D.】聚类方法
答案是:B
数据平滑方法主要有指数平滑法、移动平均法和()?
【A.】统计法
【B.】最短距离法
【C.】分箱平滑法
【D.】聚类方法
答案是:C
小数定标规范化方法中,其小数点移动的位数依赖于()?
【A.】最大绝对值
【B.】最小绝对值
【C.】均值绝对值
【D.】中位数绝对值
答案是:A
Z分数规范化方法中对于离群点,均值绝对偏差相比标准差()?
【A.】更有效
【B.】更平稳
【C.】更精确
【D.】更鲁棒
答案是:D
如果x的平均值和标准差分别为 54000和 16000。使用z分数规范化方法,x的值 73600被转换为()?
【A.】1.125
【B.】1.025
【C.】1.225
【D.】1.325
答案是:C
Z分数规范化方法依据的是原始数据的()?
【A.】均值和中位数
【B.】中位数和极差
【C.】极差和方差
【D.】均值和标准差
答案是:D
假定某属性x的最小值、最大值分别为12000和98000,将属性x映射到 [0, 1]中,根据最小最大规范化方法,x的值 73600(设定值)将转换为()?
【A.】0.716
【B.】0.616
【C.】0.516
【D.】0.8
答案是:A
下列不属于数据规范化的作用的是()?
【A.】加快学习速度
【B.】规范事物概念
【C.】避免单位的影响
【D.】呈现数据的集中程度
答案是:D
数据规范化是将原来的度量值转换为()?
【A.】无量纲的值
【B.】原来度量值的均值
【C.】原来度量值的方差
【D.】原来度量值的极差
答案是:A
下列不属于分箱平滑法参照的是()?
【A.】箱内数值的均值
【B.】箱内数值的中值
【C.】箱内数值的边界值
【D.】箱内数值的方差
答案是:D
下列不属于指数平滑法的适用范围的是()?
【A.】近期趋势预测
【B.】短期趋势预测
【C.】中期趋势预测
【D.】长期趋势预测
答案是:D
下列不属于指数平滑法的适用范围的是()?
【A.】稳定变化态势的时间序列数据
【B.】不稳定变化的时间序列数据
【C.】规则变化的时间序列数据
【D.】直线上升或下降趋势的时间序列数据
答案是:B
下列属于二次移动平均法的适用范围的是()?
【A.】水平变动的时间序列数据
【B.】长期变动趋势的时间序列数据
【C.】循环性变动的时间序列数据
【D.】直线上升或下降趋势的时间序列数据
答案是:D
下列属于一次移动平均法的适用范围的是()?
【A.】水平变动的时间序列数据
【B.】长期变动趋势的时间序列数据
【C.】循环性变动的时间序列数据
【D.】季节变动趋势的时间序列数据
答案是:A
下列不属于移动平均法的是()?
【A.】一次移动平均法
【B.】二次移动平均法
【C.】混合移动平均法
【D.】多次移动平均法
答案是:C
下列不属于数据平滑方法的是()?
【A.】移动平均法
【B.】最大最小值标准化
【C.】指数平滑法
【D.】分箱平滑法
答案是:B
下列不属于地图的构成要素的是()?
【A.】图形要素
【B.】价格要素
【C.】数学要素
【D.】辅助要素
答案是:B
噪声是指测量数据中的()?
【A.】随机误差
【B.】均值
【C.】方差
【D.】极差
答案是:A
下列不属于数据转换中适合平方根转换的数据是()?
【A.】泊松分布数据
【B.】轻度偏态数据
【C.】样本方差和平均数呈现正相关的数据
【D.】数值相差不大的数据
答案是:D
下列不属于数据转换中适合对数转换的数据是()?
【A.】部分正偏态数据
【B.】等比数据
【C.】等差数据
【D.】数值相差不大的数据
答案是:C
数据清洗算法的衡量标准主要包含 ( )、错误返回率和精确度。
【A.】冗余度
【B.】返回率
【C.】可用性
【D.】一致性
答案是:B
增量数据抽取方式只抽取()?
【A.】PB级数据
【B.】不变数据
【C.】变化数据
【D.】有价值数据
答案是:C
下列不属于文本相似度计算流程的是()?
【A.】文本排序
【B.】文本分词
【C.】统计词频
【D.】写出词频向量
答案是:A
下列不属于文本相似度计算的应用领域的是()?
【A.】信息检索
【B.】数据挖掘
【C.】文档修改
【D.】机器翻译
答案是:C
下列不会造成文本记录重复相似的是()?
【A.】插入
【B.】交换
【C.】等价表述
【D.】删除冗余
答案是:D
下列不属于数据清洗算法标准的是()?
【A.】返回率
【B.】错误返回率
【C.】正确返回率
【D.】精确度
答案是:C
下列不属于数据质量一致性的是()?
【A.】数据编码一致性
【B.】数据大小一致性
【C.】指标统计一致性
【D.】指标计算一致性
答案是:B
下列不属于数据质量的要素的是()?
【A.】准确性
【B.】完整性
【C.】异质性
【D.】及时性
答案是:C
下列不属于数据清洗的是()?
【A.】检查数据的完整性
【B.】修改数据
【C.】填补数据
【D.】消除重复
答案是:B
下列不属于MD5(消息摘要算法)的特点的()?
【A.】对源系统的倾入性较小
【B.】被动地进行全表数据的比对
【C.】性能优异
【D.】准确性不稳定
答案是:C
下列不属于基于时间戳的增量数据抽取方式的优点的是()?
【A.】性能优异
【B.】系统设计清晰
【C.】数据抽取简单
【D.】对业务系统无其他要求
答案是:D
时间戳是能表示一份数据在某个特定时间之前已经存在的、完整的、可验证的一个数据,其通常是()?
【A.】一个数据集
【B.】一个字符序列
【C.】一个日志文件
【D.】一段储存代码
答案是:B
下列不属于地域空间可视化展现的功能的是()?
【A.】认识功能
【B.】模拟功能
【C.】载负功能
【D.】学习功能
答案是:D
下列不属于增量数据抽取特点的是()?
【A.】抽取发生变化的数据
【B.】快捷
【C.】处理量更多
【D.】需要与数据装载时的更新策略相对应
答案是:C
下列不属于大数据抽取方式的是()?
【A.】同构同质数据抽取
【B.】异构同质数据抽取
【C.】同构异质数据抽取
【D.】文件型数据抽取
答案是:B
下列不属于数据库架构混合应用模式的是()?
【A.】OldSQL+NewSQL混合模式
【B.】OldSQL+NoSQL+ NewSQL混合模式
【C.】OldSQL+NoSQL混合模式
【D.】NewSQL+NoSQL混合模式
答案是:B
下列不属于NoSQL数据库的键值式存储的常见形式的是()?
【A.】临时型
【B.】附加型
【C.】混合型
【D.】永久型
答案是:B
下列不属于NoSQL数据库的存储方式的是()?
【A.】行式存储
【B.】键值式存储
【C.】图形式存储
【D.】文档式存储
答案是:A
下列不属于NoSQL数据库的特点的是()?
【A.】需预定义数据模型
【B.】支持透明横向扩展
【C.】将数据进行分区
【D.】保证最终一致性
答案是:A
下列不属于网络爬虫的数据抓取方式的是()?
【A.】预先给定的初始抓取种子样本
【B.】预先给定的网页分类目录和与分类目录对应的种子样本
【C.】通过用户行为确定的抓取目标样例
【D.】自行编写种子样本
答案是:D
下列不属于爬虫对抓取目标的定义原则的是()?
【A.】目标网页特征
【B.】目标数据量
【C.】目标数据模式
【D.】领域概念
答案是:B
下列属于浅聚焦网络爬虫的核心特点的是()?
【A.】数量巨大
【B.】范围较大
【C.】精准筛选
【D.】选定URL种子
答案是:D
下列属于聚焦网络爬虫的特点的是()?
【A.】数量巨大
【B.】范围较大
【C.】精准筛选
【D.】爬行速度慢
答案是:C
下列不属于通用网络爬虫的局限性的是()?
【A.】无用网页较多
【B.】对非结构化数据获取相对容易
【C.】难以支持基于语义信息的查询
【D.】有限的网络爬虫服务器资源与无限的网络数据资源之间的冲突
答案是:B
下列不属于网页的爬虫策略的是()?
【A.】深度优先搜索策略
【B.】精确选择搜索策略
【C.】广度优先搜索策略
【D.】最佳优先搜索策略
答案是:B
下列不属于通用网络爬虫的结构的是()?
【A.】页面爬行模块
【B.】页面分析模块
【C.】页面数据库
【D.】页面修改模块
答案是:D
下列不属于通用网络爬虫的特点及要求的是()?
【A.】数量巨大
【B.】范围较小
【C.】存储空间要大
【D.】爬行速度要快
答案是:B
下列不属于网络爬虫工作过程的是()?
【A.】获取网页
【B.】修改网页
【C.】解析网页
【D.】储存数据
答案是:B
下列不属于网站数据采集的数据的是()?
【A.】非结构化数据
【B.】半结构化数据
【C.】结构化数据
【D.】实验测试数据
答案是:D
下列不属于网站内部数据库中的数据的是()?
【A.】用户信息数据
【B.】野外实测数据
【C.】网站产品数据
【D.】网站运营数据
答案是:B
下列不属于空间数据的特性的是()?
【A.】定位
【B.】定量
【C.】定性
【D.】时空关系
答案是:B
下列属于意见建议类用户反馈的特点的是()?
【A.】反馈量大
【B.】反馈速度快
【C.】针对性强
【D.】传播快
答案是:C
下列不属于文本数据的获取特点的是()?
【A.】灵活度高
【B.】速度快
【C.】按需获取
【D.】易处理
答案是:D
下列不属于文本数据的是()?
【A.】广告
【B.】音频
【C.】杂志
【D.】图书
答案是:B
气泡图由什么演化而来是()?
【A.】直方图
【B.】条形图
【C.】散点图
【D.】折线图
答案是:C
下列属于大数据获取的特点的是()?
【A.】数据源单一
【B.】数据量较小
【C.】结构单一
【D.】包括结构化、半结构化和非结构化数据
答案是:D
下列不属于大数据获取的特点的是()?
【A.】数据源多种多样
【B.】数据量巨大
【C.】结构单一
【D.】结构化、半结构化和非结构化数据
答案是:C
下列属于传统数据获取的特点的是()?
【A.】数据源多种多样
【B.】数据量巨大
【C.】结构单一
【D.】结构化、半结构化和非结构化数据
答案是:C
下列不属于信息可视化的分类的是()?
【A.】一维信息可视化
【B.】三维信息可视化
【C.】截面数据可视化
【D.】时序信息可视化
答案是:C
下列不属于MapReduce模型的限制因素的是()?
【A.】任务要求
【B.】数据不可无限分割
【C.】通信开销
【D.】集群规模
答案是:A
MapReduce将计算过程分解的最大好处是()?
【A.】复杂化
【B.】快捷化
【C.】并行化
【D.】低成本
答案是:C
MapReduce模型适用场景的特点()?
【A.】数据可实时处理
【B.】任务不可分解
【C.】任务可分解
【D.】任务需要顺序执行
答案是:C
MapReduce模型的最大优点体现在()?
【A.】输入方便
【B.】分布式处理
【C.】各类型数据输入
【D.】算法简单
答案是:B
MapReduce模型将数据集的大规模操作分发给网络上的各节点,每个节点将已完成的工作和状态更新,周期性地报告给()。
【A.】作业
【B.】任务
【C.】作业服务器
【D.】任务服务器
答案是:C
文本数据是典型的()?
【A.】结构化数据
【B.】半结构化数据
【C.】非结构化数据
【D.】混合结构数据
答案是:C
下列不属于文本数据语义特征的是()?
【A.】词频
【B.】逻辑结构
【C.】动态演化规律
【D.】数据结构
答案是:D
Hadoop作业服务器不负责()?
【A.】接受用户提交的作业
【B.】任务的分配
【C.】执行具体的任务
【D.】管理所有的任务服务器
答案是:C
Reduce任务目标是()?
【A.】输入文件
【B.】输入数据
【C.】输入图表
【D.】将若干个Map任务生成的中间文件汇总到最后的输出文件
答案是:D
Hadoop开发环境部署内容不包括()?
【A.】安装SSH协议
【B.】Hadoop系统部署
【C.】伪分布式Hadoop环境部署
【D.】电脑断网
答案是:D
WordCount完成的功能是统计()?
【A.】按列分割文件数
【B.】输入文件中单词频数
【C.】按行分割文件数
【D.】输入文件中单词频率
答案是:B
下列不属于单词计数的Map过程的是()?
【A.】按列分割文件
【B.】分词处理
【C.】按行分割文件
【D.】排序与合并
答案是:A
Hadoop的核心是( )和MapReduce。
【A.】NTFS
【B.】GFS
【C.】HDFS
【D.】FS
答案是:C
在MapReduce模型编程中,不属于其步骤的是()?
【A.】遍历数据
【B.】映射键值
【C.】数据分组
【D.】数据插补
答案是:D
下列不属于Map任务的执行的子步骤的是()?
【A.】输入准备
【B.】输入修改
【C.】算法执行
【D.】输出生成
答案是:B
下列不属于一个作业的计算流程的是()?
【A.】作业开始
【B.】作业修改
【C.】Map任务分配
【D.】Reduce任务执行
答案是:B
在Hadoop中,作业服务器被称为()?
【A.】Job
【B.】Map
【C.】Master
【D.】Reduce
答案是:C
在Hadoop中,将每个作业拆分为若干个()?
【A.】文本
【B.】Map任务
【C.】数据集
【D.】Reduce任务
答案是:B
在Hadoop中,将每一次计算请求称为一个()?
【A.】文本
【B.】函数
【C.】数据集
【D.】作业
答案是:D
MapReduce以什么方式进行分布式计算()?
【A.】文本
【B.】函数
【C.】数据集
【D.】矩阵
答案是:B
下面不属于大数据在通讯行业的应用是()?
【A.】预测客户行为
【B.】市场监控
【C.】智能电表
【D.】市场预警
答案是:C
下面不属于企业大数据应用成功的考虑因素是()?
【A.】成本
【B.】客户满意度
【C.】附加收益
【D.】工人满意度
答案是:D
基于任务的定义和分类,下列不属于可视分析关注点的是()?
【A.】以用户价值为关注点
【B.】以用户意图为关注点
【C.】以同户行为为关注点
【D.】以软件操作为关注点
答案是:A
下面不属于判断大数据应用成功的指标是()?
【A.】创造价值
【B.】具备高速度
【C.】在本质上提高
【D.】低性能
答案是:D
下面不属于数据流技术应用的方式是()?
【A.】指定查询
【B.】模糊查询
【C.】即席计算
【D.】中间计算
答案是:B
下面不属于大数据计算模式的类型的是()?
【A.】批量计算
【B.】手动计算
【C.】流式计算
【D.】交互式计算
答案是:B
下面不属于流式数据的特点的是()?
【A.】实时性
【B.】层次性
【C.】易失性
【D.】突发性
答案是:B
下面不属于流式数据源的是()?
【A.】硬盘数据
【B.】传感器数据
【C.】图像数据
【D.】流媒体传输
答案是:A
下面仅属于大数据在线处理模式的是()?
【A.】批量计算
【B.】流式计算
【C.】手动计算
【D.】交互处理
答案是:B
下面不属于大数据处理模式的是()?
【A.】离线处理
【B.】在线处理
【C.】手动计算
【D.】交互处理
答案是:C
下面不属于大数据离线处理特点的是()?
【A.】数据保存时间短
【B.】数据不会发生改变
【C.】可进行复杂的批量计算
【D.】方便查询计算结果
答案是:A
下面不属于大数据的处理过程的是()?
【A.】数据获取、储存
【B.】数据清洗
【C.】数据分析
【D.】数据安全
答案是:D
下面属于结构化数据的是()?
【A.】表格数据
【B.】图形
【C.】图像
【D.】HTML文档
答案是:A
下面不属于大数据的特性是()?
【A.】数据量大
【B.】多样性
【C.】真实性差
【D.】具有价值
答案是:C
下面不属于互联网大数据的是()?
【A.】视频
【B.】图片
【C.】音频
【D.】心情
答案是:D
下面不是数据产品开发的特征的是()?
【A.】多样性
【B.】无竞争性
【C.】增值性
【D.】层次性
答案是:B
下面是数据科学的主要研究内容的是()?
【A.】数据泄露
【B.】数据交易
【C.】数据盗窃
【D.】数据分析
答案是:D
下面不是研究数据方法的是()?
【A.】统计学
【B.】机器学习
【C.】心理分析
【D.】数据挖掘
答案是:C
数据科学的研究对象是()?
【A.】药品成分
【B.】文学作品
【C.】数据界的数据
【D.】人类历史
答案是:C
可视分析是一种()?
【A.】交互式用户界面模型
【B.】结构化用户界面模型
【C.】非结构化用户界面模型
【D.】独立式用户界面模型
答案是:A
目前为:
3/3
页
首页 上页 下页 尾页