()是大数据运用的基础。
A.隐私问题
B.有用的数据
C.数据统计有效性
D.覆盖率
答案是:ABCD
关于搜索引擎步骤中分词的说法正确的是()
A.分词的准确性决定了搜索结果的相关性排序
B.用户的查询和内容的理解都是基于分词
C.分词的准确性决定了搜索结果是否让用户满意
D.中文分词的准确性对搜索引擎的结果没有任何影响
答案是:ABC
Spark产生的原因包括()
A.MapReduce具有很多的局限性
B.Spark只能进行交互式计算
C.现有的各种计算框架各自为战
D.Spark不适合交互式处理
答案是:AC
以下哪些指标是衡量大数据应用成功的标准?
A.速度更快
B.成本更低
C.风险更低
D.质量更高
答案是:ABCD
属于社交网络的表达形式()
A.网论
B.点阵论
C.矩阵论
D.图论
答案是:CD
中心性研究的意义是在于衡量节点的()
A.约束力
B.影响力
C.权力
D.控制力
答案是:BCD
数据挖掘常用的工具有()
A.R
B.Photoshop
C.Gephi
D.Clement
答案是:AC
传统研究中数据采集的方法包括:()
A.网络监测
B.对面访谈
C.电话访谈
D.线上互动
答案是:BCD
大数据是描述()所发生的行为。
A.未来
B.实时
C.过去
D.现在
答案是:CD
大数据的预测价值体现在:()
A.预测热卖品及交易额
B.预测经营趋势
C.评价
D.预测用户的偏好、流失
答案是:ABD
当前大数据技术的基础包括()
A.关系型数据库
B.分布式数据库
C.分布式文件系统
D.分布式并行计算
答案是:BCD
大数据有哪些价值?
A.生产数据的价值
B.用户身份识别
C.预测价值
D.实时价值E.描述价值
答案是:ABCD
大数据的价值体现在()
A.大数据助力智慧城市提升公共服务水平
B.大数据给思维方式带来了冲击
C.大数据的发力点在于预测
D.大数据为政策制定提供科学论据
E.大数据实现了精准营销
答案是:ABCDE
以下属于能产生大数据,即大数据的源头的有()
A.社交网络
B.游戏
C.互联网电视
D.搜索引擎
E.移动互联网
答案是:ABCDE
按照服务目的不同,数据流通平台可分为()
A.数据废气交易市场
B.政府数据开放平台
C.数据研发市场
D.企业数据开放平台
E.数据交易市场
答案是:BE
当前,大数据产业发展的特点是()
A.增速缓慢
B.增速很快
C.规模较小
D.规模较大
E.多产业交叉融合
答案是:BDE
下列各国大数据发展路径的描述中,对应关系正确的是()
A.日本:走尖端IT路线
B.澳大利亚:原则先行、谨慎发展
C.韩国:重视基础、首都先行
D.英国:视大数据为新的自然资源
E.印度:以IT外包转型为突破口若悬河
答案是:ABCE
以下属于推荐系统算法的是()
A.CF协同过滤算法
B.聚类及相似度算法
C.基于知识推理算法
D.关联规则算法
答案是:ABCD
医疗大数据特点:除了包含了大数据4个“V”的特点之外还有()
A.多态性
B.时效性
C.不完整性
D.冗余性
答案是:ABCD
数据变换的方法有()
A.光滑
B.聚集
C.数据泛化
D.规范化
答案是:ABCD
交通数据分析可用于:
A.交通流量实时分析
B.合理进行道路规划
C.信号灯智能调度
D.实时路况查询播报
答案是:ABCD
一个HDFS集群由一个()和()构成。此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。
A.一个名字节点
B.若干个名字节点
C.一个数据节点
D.若干个数据节点
答案是:AD
层次方法可以分为()
A.K均值算法
B.K中心点算法
C.凝聚法
D.分裂法
答案是:CD
下列属于传统统计学展示方法的是()
A.柱状图
B.饼状图
C.曲线图
D.网络图
答案是:ABC
大数据智能感知层:主要包括()及软硬件资源接入系统
A.数据传感体系
B.网络通信体系
C.传感适配体系
D.智能识别体系
答案是:ABCD
可使用(),(),()进行光滑。
A.最大值
B.箱中位数
C.箱边界
D.箱均值
答案是:BCD
医疗领域如何利用大数据
A.临床决策支持
B.个性化医疗
C.社保资金安全
D.用户行为分析
答案是:ABCD
云计算是(),(),()的发展,是虚拟化、效用计算、IaaS(基础设施即服务)、PaaS(平台即服务)、Saas(软件即服务)等概念混合演进并跃升的结果。
A.流计算
B.分布式计算
C.并行计算
D.网络计算
答案是:BCD
可视化工具包括()
A.Excel
B.GoogleChart
C.Gephi
D.ppt
答案是:ABC
KNIME是一个对用户友好的、智能、开源的平台。该平台包括了()、()、()、()。
A.数据集成
B.数据处理
C.数据分析
D.数据挖掘
答案是:ABCD
百度大数据引擎主要包含三大组件()
A.开放云
B.数据工厂
C.百度大脑。
D.以上都不对
答案是:ABC
离群点检测的应用包括()等。
A.欺诈检测
B.入侵检测
C.故障检测
D.疾病的不寻常模式
答案是:ABCD
大数据在社交网络中的应用
A.用户偏好、情感、社交网络结构
B.用户画像、精准推荐
C.舆情监控、突发事件预警
D.预测外部趋势
答案是:ABCD
在网络爬虫的爬行策略中,应用最为基础的是()。
A.深度优先遍历策略
B.广度优先遍历策略
C.高度优先遍历策略
D.反向链接策略
E.大站优先策略
答案是:AB
支撑大数据业务的基础是()。
A.数据科学
B.数据应用
C.数据硬件
D.数据人才
答案是:B
万维网之父是()。
A.彼得·德鲁克
B.舍恩伯格
C.蒂姆·伯纳斯-李
D.斯科特·布朗
答案是:C
下列关于大数据的分析理念的说法中,错误的是()。
A.在数据基础上倾向于全体数据而不是抽样数据
B.在分析方法上更注重相关分析而不是因果分析
C.在分析效果上更追究效率而不是绝对精确
D.在数据规模上强调相对数据而不是绝对数据
答案是:D
下列国家的大数据发展行动中,集中体现“重视基础、首都先行”的国家是()。
A.美国
B.日本
C.中国
D.韩国
答案是:D
下列关于聚类挖掘技术的说法中,错误的是()。
A.不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别
B.要求同类数据的内容相似度尽可能小
C.要求不同类数据的内容相似度尽可能小
D.与分类挖掘技术相似的是,都是要对数
答案是:B
下列关于计算机存储容量单位的说法中,错误的是()。
A.1KB<1MB<1GB
B.基本单位是字节(Byte)
C.一个汉字需要一个字节的存储空间
D.一个字节能够容纳一个英文字符,
答案是:C
下列关于网络用户行为的说法中,错误的是()。
A.网络公司能够捕捉到用户在其网站上的所有行为
B.用户离散的交互痕迹能够为企业提升服务质量提供参考
C.数字轨迹用完即自动删除
D.用户的隐私安全很难得以规范保护
答案是:C
在数据生命周期管理实践中,()是执行方法。
A.数据存储和备份规范
B.数据管理和维护
C.数据价值发觉和利用
D.数据应用开发和管理
答案是:B
当前社会中,最为突出的大数据环境是()。
A.互联网
B.物联网
C.综合国力
D.自然资源
答案是:A
下列关于舍恩伯格对大数据特点的说法中,错误的是()。
A.数据规模大
B.数据类型多样
C.数据处理速度快
D.数据价值密度高
答案是:D
美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的()。
A.在数据基础上倾向于全体数据而不是抽样数据
B.在分析方法上更注重相关分析而不是因果分析
C.在分析效
答案是:B
大数据的最显著特征是()。
A.数据规模大
B.数据类型多样
C.数据处理速度快
D.数据价值密度高
答案是:A
智慧城市的构建,不包含()。
A.数字城市
B.物联网
C.联网监控
D.云计算
答案是:C
下列关于大数据的说法中,错误的是()。
A.大数据具有体量大、结构单一、时效性强的特征
B.处理大数据需采用新型计算架构和智能算法等新技术
C.大数据的应用注重相关分析而不是因果分析
D.大数据的应用注重因果分析而不是相关分析
E
答案是:AD
大数据人才整体上需要具备()等核心知识。
A.数学与统计知识
B.计算机相关知识
C.马克思主义哲学知识
D.市场运营管理知识
E.在特定业务领域的知识
答案是:ABE
传统数据密集型行业积极探索和布局大数据应用的表现是()。
A.投资入股互联网电商行业
B.打通多源跨域数据
C.提高分析挖掘能力
D.自行开发数据产品
E.实现科学决策与运营
答案是:BCE
按照涉及自变量的多少,可以将回归分析分为()。
A.线性回归分析
B.非线性回归分析
C.一元回归分析
D.多元回归分析
E.综合回归分析
答案是:CD
数据再利用的意义在于()。
A.挖掘数据的潜在价值
B.实现数据重组的创新价值
C.利用数据可扩展性拓宽业务领域
D.优化存储设备,降低设备成本
E.提高社会效益,优化社会管理
答案是:ABC
下列关于数据重组的说法中,错误的是()。
A.数据重组是数据的重新生产和重新采集
B.数据重组能够使数据焕发新的光芒
C.数据重组实现的关键在于多源数据融合和数据集成
D.数据重组有利于实现新颖的数据模式创新
答案是:A
智能健康手环的应用开发,体现了()的数据采集技术的应用。
A.统计报表
B.网络爬虫
C.API接口
D.传感器
答案是:D
()反映数据的精细化程度,越细化的数据,价值越高。
A.规模
B.活性
C.关联度
D.颗粒度
答案是:D
根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是()。
A.数据管理人员
B.数据分析员
C.研究科学家
D.软件开发工程师
答案是:C
大数据的起源是()。
A.金融
B.电信
C.互联网
D.公共管理
答案是:C
下列关于脏数据的说法中,正确的是()。
A.格式不规范
B.编码不统一
C.意义不明确
D.与实际业务关系不大
E.数据不完整
答案是:ABCDE
下列关于基于大数据的营销模式和传统营销模式的说法中,错误的是()。
A.传统营销模式比基于大数据的营销模式投入更小
B.传统营销模式比基于大数据的营销模式针对性更强
C.传统营销模式比基于大数据的营销模式转化率低
D.基于大数据的营
答案是:AB
下列关于数据生命周期管理的核心认识中,正确的是()。
A.数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段
B.在不同的数据存在阶段,数据的价值是不同的
C.根据数据价值的不同应该对数据采取不同的管理策略
D.数据生命周期
答案是:ABC
当前大数据技术的基础是由()首先提出的。
A.微软
B.百度
C.谷歌
D.阿里巴巴
答案是:C
当将局部E-R图集成为全局E-R图时,如果同一对象在一个局部E-R图中作为实体,而在另一个局部E-R图中作为属性,这种现象称为_________。
A.属性冲突
B.命名冲突
C.结构冲突
D.语义冲突
答案是:C
一个事务执行过程中,其正在访问的数据被其他事务所修改,导致处理结果不正确,这是由于违背了事务的何种特性而引起的()
A.隔离性
B.一致性
C.原子性
D.持久性
答案是:A
数据库的_________是指数据的正确性和相容性。
A.恢复
B.安全性
C.并发控制
D.完整性
答案是:D
关于BC式下列说确的是_________。
A.如果R∈3NF,则R一定是BCNF
B.若R∈3NF,且不存在主属性对非码的函数依赖,则其是BCNF
C.如果R∈BCNF,则R∈3NF
D.以上说法都不对
答案是:B
SQL的集合处理方式与宿主语言单记录的处理方式之间用______来协调。
A.游标
B.SQLCA
C.存储过程
D.触发器
答案是:A
从E-R模型关系向关系模型转换时,一个M:N联系转换为关系模式时,该关系模式的码是_________。
A.M端实体的码
B.N端实体的码
C.M端实体码与N端实体码组合
D.重新选取其他属性
答案是:C
在数据库设计中数据流图(DFD)和数据字典(DD)主要用来描述结构化方法中的_________阶段的工具。
A.概念结构设计
B.需求分析
C.可行性分析
D.逻辑结构设计
答案是:B
SQL语言中的“视图(VIEW)”对应于数据库系统三级模式结构中的_________。
A.模式
B.外模式
C.模式
D.都不对应
答案是:B
以下是信息世界的模型,且实际上是现实世界到机器世界的一个中间层次的是_________。
A.数据模型
B.E-R图
C.关系模型
D.概念模型
答案是:D
在数据库中,产生数据不一致的根本原因是____。
A.数据存储量太大;
B.没有严格保护数据
C.未对数据进行完整性控制
D.数据冗余
答案是:D
DB、DBMS和DBS三者之间的关系是_________。
A.DBS与DB和DBMS无关
B.DB包括DBMS和DBS
C.DBS包括DB和DBMS
D.DBMS包括DBS和DB
答案是:C
在数据库中存储的是_________。
A.数据
B.数据模型
C.信息
D.数据以及数据之间的联系
答案是:D
下面关于关系数据库式的描述中,错误的是。_________
A.关系满足的式越低,则更新操作的代价就越高
B.关系满足的式越高,则更新操作的代价就越低
C.关系满足的式越高,则查询操作的代价就越高
D.关系满足的式越低,则查询操作的
答案是:D
SQL的GRANT和REVOKE语句主要用来维护数据库的_________。
A.安全性
B.完整性
C.可靠性
D.一致性
答案是:A
数据库的完整性是指数据的________和________。(1)正确性(2)合法性(3)不被非法存取(4)相容性(5)不被恶意破坏
A.(1)和(3)
B.(2)和(5)
C.(2)和(4)
D.(1)和(4)
答案是:D
SQL语言中,条件年龄BETWEEN18AND30表示年龄在18至30之间,且_________。
A.包括30岁但不包括18岁
B.包括18岁和30岁
C.包括18岁但不包括30岁
D.不包括18岁和30岁
答案是:B
SQL的视图是从_________中导出的。
A.基本表
B.视图
C.数据库
D.基本表或视图
答案是:D
在下列关于规化理论的叙述中,不正确的是_________。
A.任何一个关系模式一定有键。
B.任何一个包含两个属性的关系模式一定满足3NF。
C.任何一个包含两个属性的关系模式一定满足BCNF。
D.任何一个包含三个属性的关系模式
答案是:D
在关系代数运算中,五种基本运算为_________。
A.并、差、选择、投影、连接
B.并、交、选择、投影、笛卡尔积
C.并、差、选择、投影、笛卡尔积
D.并、除、投影、笛卡尔积、选择
答案是:C
构成E—R模型的三个基本要素是_________。
A.实体、属性值、关系;
B.实体、属性、联系;
C.实体、实体集、联系;
D.实体、实体集、属性;
答案是:B
自然连接是构成新关系的有效方法。一般情况下,当对关系R和S使用自然连接时,要求R和S含有一个或多个共有的__________。
A.行
B.属性
C.记录
D.元组
答案是:B
设有关系R和S,关系代数表示的是_________。
A.R∩S
B.R―S
C.R÷S
D.R∪S
答案是:A
数据库系统的基本特征是_________。
A.数据的统一控制
B.数据共享性和统一控制
C.数据共享性、独立性和冗余度小
D.数据共享性和数据独立性
答案是:C
若事务T对数据对象A加上S锁,则()。
A.事务T可以读A和修改A,其它事务只能再对A加S锁,而不能加X锁。
B.事务T可以读A但不能修改A,其它事务能对A加S锁和X锁。
C.事务T可以读A但不能修改A,其它事务只能再对A加S锁,而不
答案是:C
若系统在运行过程中,由于某种硬件故障,使存储在外存上的数据部分损失或全部损失,这种情况称为()
A.事务故障
B.系统故障
C.介质故障
D.运行故障
答案是:C
事务的原子性是指()。
A.一个事务内部的操作及使用的数据对并发的其他事务是隔离的
B.事务一旦提交,对数据库的改变是永久的
C.事务中包括的所有操作要么都做,要么都不做
D.事务必须是使数据库从一个一致性状态变到另一个一致性状态
答案是:C
在合并分E-R图时必须消除各分图中的不一致。各分E-R图之间的冲突主要有三类,即属性冲突、命名冲突和结构冲突,其中命名冲突是指()。
A.命名太长或太短
B.同名异义或同义异名
C.属性类型冲突
D.属性取值单位冲突
答案是:B
在数据库设计中,将E-R图转换成关系数据模型的过程属于()
A.需求分析阶段
B.物理设计阶段
C.逻辑设计阶段
D.概念设计阶段
答案是:C
关系规范化中的删除操作异常是指()
A.不该删除的数据被删除
B.不该插入的数据被插入
C.应该删除的数据未被删除
D.应该插入的数据未被插入
答案是:A
学校数据库中有学生和宿舍两个关系:学生(学号,姓名)和宿舍(楼名,房间号,床位号,学号)假设有的学生不住宿,床位也可能空闲。如果要列出所有学生住宿和宿舍分配的情况,包括没有住宿的学生和空闲的床位,则应执行()
A.全外联接
B.左外联接
答案是:A
在关系代数中,对一个关系做投影操作后,新关系的元组个数()原来关系的元组个数。
A.小于
B.小于或等于
C.等于
D.大于
答案是:B
设有关系模式EMP(职工号,姓名,年龄,技能)。假设职工号唯一,每个职工有多项技能,则EMP表的主码是()
A.职工号
B.姓名,技能
C.技能
D.职工号,技能
答案是:D
数据的逻辑独立性是指()
A.内模式改变,模式不变
B.模式改变,内模式不变
C.模式改变,外模式和应用程序不变
D.内模式改变,外模式和应用程序不变
答案是:C
数据库的网状模型应满足的条件是()
A.允许一个以上结点无双亲,也允许一个结点有多个双亲
B.必须有两个以上的结点
C.有且仅有一个结点无双亲,其余结点都只有一个双亲
D.每个结点有且仅有一个双亲
答案是:A
数据库管理系统能实现对数据库中数据的查询、插入、修改和删除等操作的数据库语言称为()
A.数据定义语言(DDL)
B.数据管理语言
C.数据操纵语言(DML)
D.数据控制语言
答案是:C
数据库系统与文件系统的主要区别是()
A.数据库系统复杂,而文件系统简单
B.文件系统不能解决数据冗余和数据独立性问题,而数据库系统可以解决
C.文件系统只能管理程序文件,而数据库系统能够管理各种类型的文件
D.文件系统管理的数据量
答案是:B
目前为:
2/2
页
首页 上页 下页 尾页