奥鹏作业答案-谋学网-专业的奥鹏在线作业答案辅导网【官网】

 找回密码
 会员注册

微信登录,扫一扫

手机号码,快捷登录

VIP会员,3年作业免费下 !奥鹏作业,奥鹏毕业论文检测新手作业下载教程,充值问题没有找到答案,请在此处留言!
2022年5月最新全国统考资料投诉建议,加盟合作!点击这里给我发消息 点击这里给我发消息
奥鹏课程积分软件(2021年最新)
查看: 1323|回复: 3

[南开大学]《大数据导论》19秋期末考核(资料参考)

[复制链接]
发表于 2020-3-26 19:41:57 | 显示全部楼层 |阅读模式
谋学网
奥鹏】-[南开大学]《大数据导论》19秋期末考核, ~0 Z' J% ~9 h: t: U! ^( h# Z( k
试卷总分:100    得分:100- w+ k! T6 K: x% A& i
第1,以下不是数据仓库基本特征的是()
( U1 q! Q" e1 ]5 l" y7 jA、数据仓库是面向主题的
, O5 F, ]0 A5 NB、数据仓库是面向事务的! o( M" r: p# q( O& i5 a
C、数据仓库的数据是相对稳定的
! @- d5 ~/ \* [  Z) rD、数据仓库的数据是反映历史变化的  s' S! g! W3 P. n( M& K  U; T
正确资料:
( ?" n( k% r/ x. D( E1 @3 ~
, S9 h0 N/ Z4 C8 f2 ^2 D  l+ Y+ C/ w# _. a; N$ T
第2题,()是Microsoft Office的核心组件
8 O- J. p$ {# ]4 X2 r8 Q& rA、SQL
! R) {  \% J$ I: mB、WORD9 @; j8 p0 ^+ y& G0 ?
C、PPT* R/ e3 m$ ^2 e$ ~+ [6 i
D、EXCEL$ L( N4 _8 g# r- Y3 f) @$ F
正确资料:
% R5 E  _/ S9 I# f! }% y4 H. ~- }& h# j- ^# V+ X3 b) {; `
8 p6 U" v& B8 f/ z/ @) w
第3题,数据清洗的方法不包括
1 J8 C* L' P7 Q' x8 Y9 n) `A、缺失值处理1 ]% {8 P; r& t* j
B、噪声数据清除* Y. \- ?& S7 g) o
C、一致性检查3 n& O2 o$ W4 |
D、重复数据记录处理
; q9 t! J# n0 `5 k" W1 ^正确资料:
/ |/ J( `/ o% W/ N+ b$ q- L  Y0 X, N9 t- a! j
' U, }; n$ y% n2 z1 B$ d6 B
第4题,数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段(  )。
2 Z9 Y! s: W+ G) S- _3 a1 _) ZA、运营式系统阶段
  T0 P' F9 E$ JB、用户原创内容阶段
4 A8 K/ Q2 V5 tC、感知式系统阶段3 f; {8 {1 ^& [5 |& f  N5 i8 ^
正确资料:* @0 z  d0 |% h2 g0 J& K

0 t  a9 j7 @8 P3 [3 D
" o7 {" |4 W  b- k  d第5题,下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()
4 t) a/ X; X! c9 QA、ggplot2
7 s" |4 @1 i$ x% v: ^B、network
" u! ]! ]+ H6 |2 ^" AC、ggmaps% z* v" s5 K- H1 [# x" H
D、animation7 y) N0 l- M6 j( w9 o
正确资料:
6 x/ \& t3 t+ K) Q7 r- q. C5 \+ f5 E

2 n  j1 M0 ~8 u4 O第6题,下列不属于Google云计算平台技术架构的是()
3 |5 q5 A& |7 G' zA、并行数据处理MapReduce) C; J) j( t/ X, K5 C/ n/ y
B、分布式锁Chubby4 F! u- ]) R6 I6 D
C、结构化数据表BigTable( T! n4 j) u, R' z$ N6 G
D、弹性云计算EC20 e0 w; f  n5 q9 x1 ?3 t
正确资料:5 S# F9 x& ?9 b0 D/ T. x

/ B# o/ o* _  W+ v; D
# ~) c4 Z. s5 X; u7 ^7 a第7题,大数据的最显著特征是() 。0 x' ?- M3 [9 o
A、数据规模大
' P& s9 C0 D% f* X) PB、数据类型多样/ Q" a/ ~! g- M0 Q* T
C、数据处理速度快
9 G6 x* t+ |$ VD、数据价值密度高
% c: }; A6 p+ s& j正确资料:* q5 [6 t" }8 i: W7 ~* }* Y/ d
( N& `: S& I$ s; x0 O5 T( y8 \) @

3 {4 ]" A2 ~( o" w  p2 L第8题,IaaS是()的简称4 V+ ^8 z0 N. {
A、软件即服务9 r1 E) t4 W9 @) s2 k
B、平台即服务# x. H+ p% A% o( f
C、基础设施即服务
# w' e3 u" f" o! F. V& B; oD、硬件即服务8 i! Q6 J& }, N, W) I, m
正确资料:
& d% w9 W+ R7 a3 ]6 v$ w
. H0 I7 F3 V- x! N$ y; }5 a% ?. a' ]% ?
# Z5 A' P" x8 }! A第9题,基础设施即服务的英文简称是/ u2 c# T6 B1 Y0 Z8 P# O  s
A、IaaS3 z* c  Q: d5 q. l8 b3 S
B、PaaS+ G* M9 N" T7 Z8 s( o
C、SaaS* T% g3 l1 |9 p% O
正确资料:6 X' ?2 S& i3 c0 S' {* ^
$ {, \7 J* [. q/ e7 j

6 ~" w0 ~. O& H第10题,下列哪个工具常用来开发移动友好地交互地图()9 x4 E" d2 i: L& O  X* W6 Y  e' U
A、Leaflet: g8 O5 u# S3 c: H2 a
B、Visual.ly
$ Z- ^/ _+ t- I& QC、BPizza Pie Charts+ c1 O. K$ b* s2 c0 r+ K& u* E. b# m
D、Gephi% ]( Z. e3 N1 h- V
正确资料:. X+ _' f+ e/ D- E8 {
9 m% I0 R& o) ]2 H+ q& V2 B
8 Y% C& H5 |) @* h/ x
第11题,数据归约(Data Reduction)主要有()
* q4 ~5 O& t1 [2 EA、维度规约9 b# Q0 X# i' z7 p8 {1 [
B、样本规约
+ v2 G" Y! ^% N/ m* n. c. U7 UC、数据聚集
8 X- B; h" O' UD、离散化概念分层
& Q' g. N+ h4 p# t) B" ~5 F& h8 j正确资料:,B,C,D# t+ M) D( E) b7 X

8 y5 H( n% Q& h/ i
. f9 Q. b, x: x0 [第12题,以下可以用于数据可视化的是()。9 K6 X$ m1 P/ j( Z$ m# |1 M
A、R语言
0 w# G3 r9 G. A3 J4 tB、Excel3 k+ N0 A, l! W4 h; S, q
C、RapidMiner
5 f0 z% i- S! K* F9 HD、Weka
  W: d6 F8 K' U正确资料:,B,C,D% |: D8 C" x: a7 {% r

: G# M4 v2 a! ~2 ^. {) ?
6 Z0 w7 A2 t! A# ]第13题,医疗大数据特点:除了包含了大数据4个"V" 的特点之外还有()# [9 \6 w( ~3 W6 O
A、多态性
1 J! [; o+ m9 B& ~5 c3 ?, d- B* i% qB、时效性
0 J0 G. L; E$ ]0 \C、不完整性9 i5 |7 |; X/ g( H8 [/ \: O( ~" x
D、冗余性
; `% U1 j  ]7 {' d, ~正确资料:,B,C,D* V' O6 t# M* h
. R0 E' y0 E7 D/ v
3 H. R! W" I/ B! P
第14题,大数据存储的特点与挑战有()
8 R! E' b, M2 ]+ lA、容量问题
1 D& ]9 \) s  [9 Z+ }B、延迟问题
% B  m, R( n. |C、安全问题
' ~$ k% y/ Q9 L' o% G/ UD、成本问题
1 J. n. z, n" H' ]/ h' n) ~% T( e正确资料:,B,C,D9 c* e$ D: C4 o" }7 f( _

* \: ^; D6 A+ L
1 y/ K5 t' A9 [, W第15题,大数据智能感知层:主要包括()及软硬件资源接入系统: n2 t. C! h& t6 _; E# k& p) U3 M
A、数据传感体系
$ b- S) G  _  s0 l1 QB、网络通信体系% J; \/ B0 i/ M* Z& F- ]5 t4 r
C、传感适配体系! P8 _! v9 c0 G% R3 L1 [: I" c
D、智能识别体系( O6 u) q6 T( x8 m1 r  y/ Q4 X
正确资料:,B,C,D8 o# f1 Q2 K* w( M) b/ L# m

/ m, M4 y( K* N! ^( c% g" B( `+ `5 V( O. m0 Q
第16题,数据预处理的过程主要是5 `6 X9 H0 J) X2 }/ L- n) Y) l
A、数据清洗
- M, l5 d1 B- a8 S3 [" Z. oB、数据集成3 `3 Y. p2 `. {/ `/ X! m2 N9 ^
C、数据变换5 p- f9 C5 b' ^) {" i, x
D、数据规约9 z; z0 u7 R+ }7 S1 s6 A- j
正确资料:,B,C,D! @* Q+ Z, f5 z

! W4 j8 n) S9 s# d6 [) C' |# Q
% J: w# f8 M1 y& w+ S- C第17题,交通数据处理包括以下几个步骤()
* X/ T9 P0 c2 Q* f! c  BA、数据清洗
6 d6 z; U, ^% w- o% }. r, bB、数据映射3 f8 _: r. h) l3 W
C、数据组织
$ S1 m/ }* r: _* ID、数据聚类
! {* h9 d( ]8 L) z7 c正确资料:,B,C,D- H: E( `5 t: |7 E# l' \8 f* v
5 I2 Q* D. F0 [" ^' g( f# P
- [# C& v( z# ~% ?
第18题,数据工厂包括
+ ^% Z  g! t% V0 B: R. P7 h6 {/ ~A、低能耗数据中心5 d9 _. F$ K% w4 V5 @
B、超大规模讲分布式架构& C8 @* p4 ?% \) F
C、新一代智能自动化运维
, \7 f4 e, r% gD、超强云安全
1 [( o- y6 P1 f& a# @* O正确资料:,B,C,D
4 {' W9 B+ \/ z8 Z2 f  J! p" V. J( a- V0 n# X  s# v2 Z/ b* m
$ d: Q* c) L. u$ O7 n' C1 K
第19题,可视化工具包括()# J) P6 c! z4 a# y" P5 a
A、Excel* G0 z# T+ Z0 w* C- K
B、Google Chart1 `, H) }$ v: {( L+ y
C、Gephi
, I$ ~1 t8 K$ g9 vD、ppt( W* n3 K( j* s% q. I5 o2 _
正确资料:,B,C
, D* \; j, G# H. _* o: Z) @9 B* @5 O3 x9 ?1 ]9 A! q. W

! I) Q" d* Q8 ]% e第20题,去除噪声使得数据光滑的技术主要有:* h- \3 f, x3 j9 n0 ]# l+ b( }* A
A、分箱
9 m% s+ _+ g4 g8 t+ ]  eB、回归
5 [. t/ m1 R  qC、离群点分析' w3 i7 A( U" W% f) |
正确资料:,B,C
. s. n5 ~% }( R" m4 z; P& \) O! h, E1 F: N; `7 i* [' d

) o1 K/ n/ F) j6 Q第21题,在未来掘金社交数据的道路上,一方面要为用户提供更加精准便捷的良好服务,另一方面也要注重对用户隐私的保护。只有符合用户需求和用户安全的商业利益,才能成为可持续的商业利益。
" ]7 d/ q% k. K! ]T、对' V8 g. y9 ]5 S- @
F、错
" k- ]1 T8 A. U* _0 S$ i- _正确资料:T
9 g  x4 J4 Z; H) G) C* `( A; @+ ]/ w3 |# A4 Q
% o( k6 p! [# G6 o; A- U' m$ T$ s
第22题,每个簇的质心(centroid)是该簇中所有数据对象的均值。( B! Q. i( T6 C; x6 {6 Q
T、对2 X, u# I8 n" l' o
F、错1 T$ s6 k/ [* q! I
正确资料:T3 [/ v% Z* h; j8 I% }$ |# ]
2 L' ~1 V0 E2 h* m, k

4 y) z5 x' Y: P! @9 V4 \第23题,数据存储要表现出静态数据的特征,反映的是系统中静止的数据。
7 y3 J; `% e7 k8 M! [1 ZT、对' o- `; |7 f( F6 t4 m1 F7 y
F、错
; a. f, e9 a% g3 _8 z正确资料:T
1 r* F& p1 s$ \. j+ v" s( w" @; ]& u# w
: K9 @" V; `5 t" Z5 U' b9 Z. G0 Y8 v
第24题,不同类型的大数据可以揭示一个区域或城市的活动以及人口分布状态( )
' |- N' C, q* }9 ?2 k1 L) pT、对' L0 J3 ^! G! B/ y; R
F、错
5 J( i3 Y, ]6 O, X正确资料:T
. N' d/ o3 H. W' R% |+ J# Z8 o6 W, u7 y3 I2 g' `

4 L, ]! i0 F8 Y8 ~0 q第25题,Gartner研究机构给出的大数据定义是大数据一般会涉及两种或两种以上的数据形式,它需要收集超过100TB的数据,并且是高速实时数据流;或者是从小数据开始,但数据每年增长速率至少为60%。+ ~7 m3 C0 A* |& s- A
T、对
1 q/ l7 X2 Q  BF、错
5 w% W1 p/ y8 b- R  _7 L正确资料:F
0 h* \( O" Y: ]$ g$ U& {( }9 Z) B6 m3 V  h; B4 b

) x/ c, Z; T% x' a+ w6 }  c第26题,未来考验零售企业的是如何挖掘消费者需求& P2 \/ L1 d4 i' W2 P
T、对1 k1 A- z' {, q) e
F、错' t. }; r1 E7 r- i4 l* n
正确资料:T5 b8 ^* y% h* A

7 }  G4 V1 O4 w% D+ a1 a( t1 E. k$ P* {* R$ Q& G( E" p! I
第27题,减少已分配但未使用的存储容量的浪费,在分配存储空间时,系统按需分配存储空间。8 a7 g1 w$ A4 p& N( s- A7 R
T、对) j) P/ Q# T8 F8 e* E
F、错
, s& t; w$ q' {1 E" p正确资料:T1 [9 _- W4 o2 U+ s6 g5 k( f3 [

. K; @/ _8 Q& Y
9 M# \3 ]; d! q& r+ `第28题,数据存储是数据流在加工过程中产生的临时文件或加工过程中需要查找的信息。
! H/ _. w2 ^9 j* j$ ET、对- X3 t1 j* g+ [/ P- x
F、错% d5 |0 t* v6 [. q6 G
正确资料:T
& E/ b" K% Z5 g& c4 v; E" z. h5 K+ S( V. o$ R9 Z, f/ x( Y- D3 v- e
1 b7 d# c$ y# B5 t# O
第29题,Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。3 W1 B6 @7 G, z- Y! R
T、对' H& @7 ^/ w: M7 ]3 Q1 R+ q" p! W
F、错
% F0 }! M5 w. A* Y! s$ R正确资料:T
4 Z" a" K* w) q3 H8 q0 L1 x- ]1 }0 D

1 ]6 X' l" _+ G( i9 p. u( C第30题,FP算法比Apriori算法慢
1 G# M# _, Q7 hT、对
4 T5 U7 z- L8 M+ C- d3 `# T; S/ K5 jF、错
6 d" \. y) b$ {" K) F  W1 P& v( D5 B正确资料:F4 Q! `# D6 o' h
# u5 a- w( B4 B* f

6 B/ S9 M9 u# ~; p; b2 L2 _第31题,轨迹数据包含空间和时间属性,并且通常规模巨大且维度高  ~, G, d5 O( b' A5 a0 G4 @1 P
T、对
2 u+ H+ X; K7 N6 `' v% RF、错3 \5 p0 k: D$ t9 I" t
正确资料:T
2 f4 V: S7 W. P! `; b6 I3 f4 b; O3 i5 i, O& a
3 f3 R8 y  Q: b) W2 x, o8 Q
第32题,Apriori算法扫描数据库的次数等于最大频繁项集的项数。/ b  J5 K3 u8 H
T、对2 X. m0 ?4 s; A+ K( w8 v4 d5 R
F、错3 ?( m$ Q2 e7 R4 Q  s
正确资料:T
) O  x  |, a; Z$ v5 F+ L
( U; ^0 Y0 w/ K; U4 [( _1 N( U7 I2 t1 ?9 {% O% C/ d
第33题,Facebook积累了超过12亿全球用户,其存储了大量的用户数据,这使它成为一个巨大的"数据乐园"。人们越来愈倾向于在Facebook上表达自己的情绪。
0 u8 r; E' t( |- JT、对' L$ B: a2 m7 G' ^3 ?4 ~
F、错% g0 h" Y+ T; ]
正确资料:T8 C& K; S. f5 D3 y
1 Q7 `, y# ]  n3 N: ]& E& ~
3 p# k/ H( B- c+ H) t) ~' e: {
第34题,大数据处理的关键技术主要包括:数据采集和预处理、数据存储、数据计算架构、数据分析和挖掘、数据可视化展示等。$ ]( r" n+ w7 B4 a
T、对  g  w( j: g0 g3 r
F、错1 g7 ?3 s9 y  H
正确资料:T) T) e+ {2 R1 T8 w& I8 i& B: l; ^

" m0 W9 d% S2 `: k2 }; o4 |" D5 k6 z+ S9 f& |; b+ L# L
第35题,R是一种开源编程语言和软件环境,用于数据挖掘、数据分析和可视化。
( \( ?0 g( A6 Z6 |& G" I4 @T、对
# a3 E. [2 P3 x% }F、错
$ M2 z( w1 o) \2 B4 M$ h正确资料:T
: J9 W* n. C. `$ D0 Q4 v, l9 C$ Z" I3 j% o" j: l: V& y

* P5 g: z3 q/ Q/ L& l第36题,简述数据可视化的流程和步骤。
" H* M0 q! b1 {/ W5 R3 X& q# A8 H正确资料:5 u( C: R; i/ u  ^

/ V% V3 R! V, V2 k; J: h; L/ T( Q1 `& j( a
第37题,简述网络大数据的一般采集过程。7 {% L; b2 g: \1 _+ V2 d
正确资料:5 k" X/ Q6 n: |) m, X; d

) T: d9 e1 [8 Z+ _  X$ O
* m/ C2 F# [% z2 M" U3 ?: j第38题,NoSQL
3 h1 |% R; R8 U正确资料:* F6 T5 I$ o* v6 H6 O

$ A% U) N; E/ I0 C6 Y9 `0 B$ f+ \  L7 c9 \$ }: m0 a% ?
第39题,批处理
1 g/ u, y2 B1 C7 Y  Z# w& A. `/ n+ s2 z正确资料:) a7 y2 y# e! j$ y  d0 ]/ m! f) _

4 b; n) R( X8 c) O9 C6 p" M' A4 C5 c# P; m+ [, ~7 ]' g
第40题,数据清洗' B- H" V$ w2 b5 T+ S/ O, w" J
正确资料:
/ E! Y9 R) H/ `8 Y0 z+ n
+ \& q7 N! b/ ?! \" A3 a: Y* n/ @/ {. V
第41题,结构化数据
% y, [1 @2 F; L  ]1 p正确资料:. w6 ]4 k- d1 y; }  l0 ^

- G% t' j* {* x; a% F1 `9 }8 i
8 B* @% a0 _* G( q$ Q% u$ i4 x5 D. c; |/ b3 N5 x3 [# u' K0 D; y
. T! T7 [# v, O" Q7 o4 b
7 U' g2 J' Q& y, R

9 E  s% P5 h6 M" n6 a) k: G5 ?& T! `2 y+ O1 q4 W6 h

' C0 e9 U2 x3 _, o+ n+ A+ x; l8 a- U5 m7 l7 f8 s
- H! F5 T: `/ J3 \( @
, U! N, D4 K1 H% T: u/ g

9 \5 {, E* S2 K; F& Y2 Z
- W, u, J2 g4 l* [+ K! ?
$ j3 Q5 x6 O. |0 ?' x# X8 _# v

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?会员注册

×
奥鹏作业答案,奥鹏在线作业答案
发表于 2020-3-26 19:43:58 | 显示全部楼层
奥鹏作业答案,奥鹏在线作业答案
回复

使用道具 举报

发表于 2020-3-28 23:22:52 | 显示全部楼层
奥鹏作业答案,奥鹏在线作业答案
回复

使用道具 举报

发表于 2020-3-28 23:47:05 | 显示全部楼层
奥鹏作业答案,奥鹏在线作业答案
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

 
 
客服一
客服二
客服三
客服四
点这里给我发消息
点这里给我发消息
谋学网奥鹏同学群2
微信客服扫一扫

QQ|关于我们|联系方式|网站特点|加入VIP|加盟合作|投诉建议|法律申明|Archiver|小黑屋|奥鹏作业答案-谋学网 ( 湘ICP备2021015247号 )

GMT+8, 2024-4-25 22:48 , Processed in 0.100055 second(s), 17 queries .

Powered by Discuz! X3.5

Copyright © 2001-2023 Tencent Cloud.

快速回复 返回顶部 返回列表