奥鹏作业答案-谋学网-专业的奥鹏在线作业答案辅导网【官网】

 找回密码
 会员注册

微信登录,扫一扫

手机号码,快捷登录

VIP会员,3年作业免费下 !奥鹏作业,奥鹏毕业论文检测新手作业下载教程,充值问题没有找到答案,请在此处留言!
2022年5月最新全国统考资料投诉建议,加盟合作!点击这里给我发消息 点击这里给我发消息
奥鹏课程积分软件(2021年最新)
查看: 1632|回复: 3

[南开大学]《网络爬虫与信息提取》19秋期末考核(资料参考)

[复制链接]
发表于 2020-3-26 20:14:47 | 显示全部楼层 |阅读模式
谋学网
奥鹏】-[南开大学]《网络爬虫与信息提取》19秋期末考核/ r8 r+ e; l; B- J/ g
试卷总分:100    得分:100
' z0 K/ V! ]+ J& D+ v" G第1,如果很多爬虫同时对一个网站全速爬取,那么其实就是对网站进行了()攻击5 g8 O) j  y- O- a9 Y3 i
A、XSS% v1 _6 R! }- M8 U
B、DOS& V( k" G1 p% W# b8 p8 O3 _
C、DDOS
5 h; a# ~0 D2 ^6 @, Q4 A! C0 }D、跨域" S) }$ s$ {  U) w
正确资料:
' J& N6 E* w8 B% K3 Q% |( C8 |; ~
$ t) b3 C, i8 |2 v! R5 X3 |% L; {3 g
第2题,以下哪个HTML标签表示分区或节()' g3 ^4 P! |* g4 z' G) W' r+ |
A、
2 O& A# Y) S/ `6 Q3 l3 T" l! pB、. x; h2 j' e; C4 p
C、
6 R3 G( n  `  O: zD、
0 z' K7 f4 g; i7 _9 k正确资料:
/ ~- ~2 U6 @# M+ A5 g- d! i, ]$ O$ e9 B5 ?
- ]$ P  U9 y7 W9 ^% X! r5 r. T( }$ U
第3题,使用UI Automator获取屏幕上显示的文本内容的操作是得到相应控件后使用命令(). `# H% h9 B/ W& m: [1 A
A、content
! T0 w, [' O, j3 ^% F# \, t8 e( MB、text5 Y: V: g7 r7 s  \
C、title
2 b2 t' D8 R  r: D1 n( I& DD、body
, W9 f4 W% B5 j7 ?, x5 `/ `正确资料:2 n6 R) c: [2 h9 ~
) w7 P! g" v  ^0 d: @; x0 K% v

3 z/ b9 _6 a0 B! I5 C5 f; H& _第4题,Python操作CSV文件可通过()容器的方式操作单元格
  J0 H5 K- w1 q; q) D( aA、列表
( d; G7 M2 t! y' Q5 QB、元组
1 U" R  n' M  ~7 ]C、字典
" j/ h3 P& r+ k+ BD、集合! I, r" _$ d$ {
正确资料:
8 d2 L( h7 j2 F. C; y. k" s2 s( H+ r# N2 U; k
1 Z1 {+ I* D8 e6 _5 n
第5题,Python中Object=(1, 2, 3, 4, 5),则Objcet是()
7 H" K+ o& A4 i( gA、列表1 Q. K( i* v9 s2 J+ T' ?; v
B、元组2 \3 M! s# N& ?  I% J1 @) ?
C、字典
. n: g9 k# ^$ d! C# U' `D、集合5 U7 U4 k+ B) {# Z
正确资料:
3 P; t0 S  `3 W1 ^  d+ i$ c- o1 r# F0 m) v& P. |7 q* p$ H- g

: h$ ^4 ~  m" v2 w# M第6题,HTTP常用状态码表明服务器正忙的是()! F2 ?5 l! V( j
A、500" z! P: S7 p/ P7 E5 ~
B、503
/ [8 u% i: C5 \3 iC、403& z" H$ \/ N8 K
D、404+ f! }7 {4 m4 N+ R7 j. M
正确资料:
' P$ A) A* |9 Q3 }! s5 f/ P( i+ N0 ?8 L" h, P) R, A% E9 G

- J) |' s5 g* D: S$ _第7题,使用UI Automator打开微信的操作是获取相应图标后使用命令()+ z+ P& [! @  P$ k6 g
A、touch: X- h* Z% V; q+ I9 g& v, A
B、click+ P% s- x6 c) H5 K
C、push
5 R% v9 l- Q- o  k% c. G3 L* }D、hover
4 u( V+ f" Q: i7 B7 x正确资料:
) Z6 C% V, T5 V  z/ M% M: g4 b$ [5 @- u6 ^9 z
: X1 Z9 n) }' [2 {9 F; q' v
第8题,Python中Object={'obj_1':'1','obj_2':'2'},则Objcet.get('boj_1','3')是()8 Y' Y* B) e. l; r$ p6 p& ^
A、1
# i2 E' D9 ~5 m( a# W) W$ w0 K. f6 ~: kB、28 l& A2 B9 c, B' P
C、3
; ?0 s# p9 C: kD、无输出
$ @( ^* l& G9 J  a9 g正确资料:0 z  _6 q2 {/ o# I. o/ @4 b
4 `  n& c& N& u
! d. M( q4 l0 c* ?6 I$ R" Z
第9题,采用以下()技术可以实现异步加载
  v8 K+ i* _. w3 N! AA、HTML
/ z0 @: ]! D0 D: G/ F7 jB、AJAX7 V! S. {# m# x1 U. A7 m& E
C、CSS
" {. T( t/ G! }" D, {& ND、HTTP
3 V; k5 w8 L( A9 \* U" M正确资料:
/ T- N5 [9 R0 E; P+ h( R: |8 F! K1 P% k. A8 T" P4 ?
% X( K1 \2 x  x. b3 }
第10题,网站根目录中哪个文件里面的内容会告诉爬虫哪些数据是可以爬取的,哪些数据是不可以爬取的()。' x- g& R. \/ |8 D( R
A、robot.txt" Z2 k' s( ~1 {. A5 i
B、robot.html. h& \1 k* j+ Q2 y# G# @5 v
C、robots.txt
5 H; C  ]+ m% @6 `' C1 L# F6 JD、robots.html* `3 N4 f9 W/ o5 F- u, p
正确资料:
0 H5 U. N0 O8 y8 Q$ p' }! n2 l$ \# h5 d; P

/ r) E# ?% ]& c第11题,Chrome的开发者工具中哪个选项可以查找到cookies6 I3 ^/ {/ W& n4 W, V8 k
A、Elements- U0 j& O( |! c% Q& ~6 s# m8 {2 x
B、Sources- `7 C& w$ B8 [  [( \$ X" `
C、Network' _5 u( t- h: a" z0 ^
D、Peformance
+ ~* @. t5 X9 X正确资料:
& Y+ _# ]2 n7 g' S& \" d0 t( G- e0 T6 u2 {' f
6 z) F) u# |& [% k( }
第12题,以下哪个命令是linux下解压缩命令()+ N9 G: H4 ?2 D: L3 U
A、curl$ z1 N; K; I0 @
B、tar -zxvf
6 ^" \0 n" M! Q* P* |C、mkdir4 Y& a& v4 t6 k, h8 V. `- K* `
D、cp
" D  ^( O) n0 e0 G# N, e$ G正确资料:, j" ?& P- o3 @5 s1 J* o

/ W$ s; }6 X3 X! k- ~& p. M7 ]! v: r6 z7 @+ C7 V( p
第13题,MongoDB中数据存储的形式类似于()( Y. X3 @2 P. j0 m7 F
A、列表' i% v; Z; `$ ?# C& H) o
B、元组
6 i; q, u2 j/ p8 Z4 Y, _C、字典
4 ^, J: b9 y$ I9 J3 d# }D、集合
+ f- {5 ?; z8 `  ?) L4 ^3 ~' s正确资料:3 J4 `- `2 _0 y' m# ^9 J& c5 f

1 j9 S. L9 O1 B  U
2 P" Q  h3 U- M/ d第14题,以下哪个HTML标签表示定义列表项目()
- H5 M) U# J, ]. _5 U6 e% MA、
- H( z' w0 v" t$ e" j, OB、$ V; }" d$ H% `" I/ X: {
C、
* |4 k2 h* w' N2 F% k3 |6 w! r: }D、
" L  d0 [9 e; [0 W正确资料:& K- a1 f" t" K+ j# a
- n' A' q% q9 `2 j  Q
0 ?3 C. x; c5 a' e6 r
第15题,python中可以用来将图片中的文字转换为文本的第三方类库是
% q7 z0 w- C/ ^% y* ~: YA、lxml
- x0 K: j" M/ t" r. M8 CB、requests+ t( H6 h& E4 @
C、beautifulsoup4 m' b- n$ b3 Y* {3 r8 K9 E" r9 `
D、pytesseract
1 m3 z' o% H" n( J  i( o正确资料:' Y3 }& }" }7 J9 ~0 a

7 C/ J+ [0 Y' y' A, z: N' G5 i6 H2 J5 ]0 a
第16题,下列哪项不是HTTP的请求类型(). P5 k- i1 e8 R/ w# V# v8 J% E
A、GET* I' P% f! b& o$ A* ~- g
B、POST7 d  o! a9 q( p% F% A: v( p
C、PUT
. L+ T  {( M1 Y% a$ M4 GD、SET
; S, W' F+ \9 s$ C- P8 K4 d正确资料:; ^, r+ [1 \( h% Z( O" Z
  w( I0 W5 u+ @6 S) ^! s

* `4 j2 O# n. g- \. X+ x6 g6 u第17题,以下哪个HTML标签表示定义 HTML 表格中的标准单元格()
0 x1 K, X( X. x4 s. g/ e. I- l" IA、
6 y. R  w/ }9 h- J0 OB、: _" }. S) o# c( ~' v
C、
& V+ r$ o  c0 kD、. u6 t# O! I$ i$ e* e
正确资料:
0 T  [4 J3 |" _- j# S$ @6 `) h. C# j) ^/ l2 s. F' s

; N6 [7 @. ^4 A  h第18题,当爬虫创建好了之后,可以使用"scrapy()" 命令运行爬虫。
7 A/ i2 V2 o! V/ `2 d2 @3 m$ RA、startup
3 ]' }7 X2 }9 ?$ v; WB、starwar. h' Y2 z( t$ v
C、drawl
; E& f# O2 z$ o" p- a, }D、crawl) L  P  l% M2 w# J, d. v" U
正确资料:1 E6 _2 u2 k8 d9 H2 i: }4 T
" Y! c2 R, h$ u! L; A: x

6 q: O2 C& j+ N5 Q  [第19题,参数headers=(),把请求头添加到Scrapy请求中,使爬虫的请求看起来像是从浏览器发起的。0 [2 u1 ~7 X7 C/ A
A、HEADER
$ \7 H5 k  s2 k+ ^$ A5 @7 cB、HEADERS; j+ `9 `' u) q; x
C、HEAD
* [' J6 s. ?2 K6 QD、BODY( Z+ i3 G2 ^; q1 X$ B( p& c
正确资料:
7 y7 X- U* x! ~6 v# i- V3 {8 }* V' u
) {5 u6 `1 _. `1 H3 B5 K! x# y+ Q
第20题,以下哪个命令是利用URL语法在命令行下工作的文件传输工具()
  O% F2 `, k2 c  K4 N% N' `A、curl$ C/ F+ F* `# ?* C9 ]3 o
B、tar -zxvf3 k7 O0 _0 G$ Q0 K
C、mkdir- j! L7 K  P- u4 f4 I+ l' D
D、cp* ]6 X$ U, Z. N1 n/ a! R" n0 Y
正确资料:
; B  i4 C  G% O1 S' U1 E+ Y" A; X( e& [) I' A/ f. \6 V

4 X: k1 `0 a# u8 m& G第21题,MongoDB中获取名字为db的库的语句为()3 D6 o4 F0 B3 o9 H8 `
A、client.db* a6 Z, w" O5 M! v: `( T/ A! M1 ~' o
B、client('db'): S$ z: V: v. b3 I% c
C、client['db']
5 m. `; t( O+ F2 @/ G( \1 \D、client{'db'}
2 C$ u5 c- q- i1 V& g3 f" X3 w正确资料:,C$ t7 }- e% i+ P% z( F8 x% w
' Z+ a6 b0 S3 K/ h- u- s4 `
0 j# Y, T4 M0 \6 P. K! B3 ]: e# C
第22题,以下哪些方法属于Python写CSV文件的方法()7 K0 z5 J, X3 {- p: w1 T& p
A、writeheaders
3 k* d5 w$ Z& A' T3 Q) Z, @B、writeheader3 F6 w+ U% L; @2 }" S6 a( p$ _4 g
C、writerrows
7 M* ]  t5 Q, _% s7 D& L) hD、writerow/ ~7 L* U/ W  V+ z9 X
正确资料:,C,D
! u) V, j) `/ w9 o) d' o+ ]0 u9 |$ A8 W' [
8 `6 s4 L" l& V( B  ^' L5 h
第23题,下载器中间件的作用有哪些?
$ Y& p- w. x. r& rA、更换代理IP6 ~/ k) {+ u1 d. P+ Z2 |
B、更换Cookies
% J/ [0 \6 }3 ^) i) m4 U) wC、更换User-Agent
4 r9 ?+ ^6 I1 Q# }D、自动重试
8 l0 u$ a( m) f4 p& k7 w4 F  a, I* l正确资料:,B,C,D
) Q, k/ t; x: v4 e) |1 p# i+ A1 J

: i) M5 `  j" {  E第24题,如果爬虫爬取的是商业网站,并且目标网站使用了反爬虫机制,那么强行突破反爬虫机制可能构成()
2 f* B1 ?7 T4 f4 W6 \2 `A、非法侵入计算机系统罪
' V2 i1 {) G7 w5 k, [% fB、非法获取计算机信息系统数据罪0 D$ m3 A, o  l1 T+ @" Z
C、非法获取计算机数据罪
$ _( A* c, y( K5 d( X3 X  K3 JD、非法获取系统罪9 D# v; M9 Y! g: c' c6 {2 `1 e
正确资料:,B& f1 _/ P9 b# n- P

- }2 c) Y# f& k( o* ]* h  m
0 U# s1 b) s- e. a) ~% |7 Z* L- I第25题,Python中()容器有推导式' w0 O! P/ U$ |. E, |2 l% J- y
A、列表
: j! ]' i1 }2 z: f: A; p; }B、元组1 j# c# ]; K; z0 O) _
C、字典  d$ l7 N$ E; v5 v. ~! i7 ?( a
D、集合- G" J+ C- p3 E; L, n: Z# O
正确资料:,C,D
5 p! w' z3 S' c" ^1 A, ]: _9 g' }, l7 g) ^: ?1 l5 B
3 K: C$ k5 i/ T
第26题,通用网络爬虫通常采用串行工作方式1 a' ~% F2 S# V
T、对
) ~$ k8 z1 ^6 U' ~7 _0 h0 ZF、错: E) q1 @1 P+ d* ?* m- _6 Q
正确资料:F8 W% t7 f: p8 M9 g0 t6 q- q% Y

! d1 q& [7 Q# O% D5 F7 G# h
6 f  \# I9 u" U( h2 {" R第27题,需要登录的网站一般通过GET请求就可以实现登录。  S5 \2 z, G) r2 O; O
T、对
- ^3 f7 P4 N8 z- |5 G& _. q" gF、错
1 t# R5 P3 @; D+ N# M正确资料:F
* S$ h0 D& ]9 t% _; c2 H& @0 [6 R; x

4 B* a  B9 ?( Y* J1 C第28题,代理中间件的可用代理列表一定要写在settings.py里面
; a! w* z; v, ]/ Z$ \: N7 m5 R" nT、对( l0 s- T8 B0 Y+ _8 m% {
F、错
3 \0 [. G, d# K- e正确资料:F
4 m' F& m  n/ ?/ x8 J/ h1 ~
, `! W. X6 g$ K0 U. E, o" d- h# I7 c' b3 g& @% o4 H5 ^9 G: ~6 G$ w
第29题,requests中get请求方法的使用为requests.get('网址', data=data)4 K$ F* \0 ~0 v
T、对
& Y  k/ b0 C" X2 NF、错
9 H6 t  k( {# O/ f正确资料:F
% x" ^9 }% |( a+ d/ y1 n3 G, u* V) J6 V4 M
) j6 \3 j! {! L- W5 J; A/ I% X
第30题,所有的异步加载都会向后台发送请求+ B; B6 q: `- ]  K
T、对
4 j. i: i# K+ b6 t$ lF、错
  i* P  X- V4 N& Q9 \正确资料:F' b, |3 N; b  C& `" h+ Y3 J7 Z3 ]1 K' t

* P( g5 p  @+ h2 ]; M; A7 p4 J2 H, `% t
第31题,在MacOS下若要运行Redis可以运行解压以后的文件夹下面的src文件夹中的redis-server文件启动redis服务- \2 S  v8 \( B; T# o4 u4 C, {
src/redis-server. X7 l8 c' C; d% h
T、对' g& s1 u: _+ B6 Q7 i- \
F、错
9 v9 g0 E! \# U5 g4 _正确资料:F3 c4 l* F% R! `& X, X- @
7 d& X: B# C5 Y
  B$ G2 a( @# x0 ^
第32题,爬虫文件无法从Pycharm运行和调试,只能通过命令行的方式运行。! b, X: y, g5 p* Q
T、对
% U6 E" m, n6 y4 P9 xF、错
" Q, D- Y  C$ Y) r, J/ ]正确资料:F/ j+ f/ Z6 k" Z1 T

4 F. ]& C8 L: P9 t  ?/ U' ~7 v
+ N" \$ n8 Z. y4 P. J第33题,爬虫中间件的激活需要另外写一个文件来进行
, d; p7 ?6 w/ E+ Z: g! d3 i* vT、对' L% H+ s  q9 j. C5 @6 m
F、错
. H+ v* u: }4 `" I) |- V正确资料:F
# j+ e0 `) d  a6 [" {9 m) @5 W7 b) I; P" L& x, H

, ]" I1 Y! X+ e% J& H; b第34题,已经创建好的Scrapy爬虫*.py文件可以直接通过Python来运行
- D, _6 K# ?3 r( ZT、对
3 b2 q- h+ u9 A/ ?F、错7 [+ y  l' ?7 |9 b7 D- K0 S
正确资料:F( [- O. n: t7 s
$ b6 m0 M4 c/ w. {' P/ F

9 P" m4 C9 t% C6 }9 B" ?% ?第35题,Linux环境中,Virtualenv创建的虚拟Python环境中,执行pip命令安装第三方库就不需要使用sudo命令了。5 U3 z8 r  t* `. o! ], ^; ~7 g
T、对2 C, `9 H2 m2 W/ ^$ w
F、错
/ g) J1 P' x! Q& p2 p5 t: d正确资料:T
0 z4 y. V$ j4 L' Y2 ~( y) T+ M8 V8 [7 d9 T

0 t8 P4 J, L* p7 ]第36题,在Scrapy的依赖库文件中,pywin32和Twisted的底层是基于##开发的。
1 c* q5 [6 s! @/ E0 F正确资料:
0 W, _7 ?6 Z# ^3 Z, I8 |
% `* L3 p) U8 D. }  e& B+ u/ j& _, f4 a$ g2 q$ o
第37题,爬虫中间件scrapy.spidermiddlewares.urllength.UrlLengthMiddleware的顺序号是##+ f/ P  ~2 e: Z9 O! t2 e
正确资料:
: k! \7 k& y  z- D4 x
" q: g( X  X( C
6 G/ c: i. i; B4 ?+ D第38题,在Windows下运行Redis命令为##redis.windows.conf6 g5 n) j, \' d. c. ]  k: T
正确资料:
6 V7 `2 q4 ?( S" }. p1 u5 z5 B' W; c: O' F  n( p

2 m6 O4 v3 w2 |+ V8 V- W  \8 s第39题,MongoDB如果需要从外网访问数据库,那么需要修改安装MongoDB时用到的配置文件##+ h" ?+ e+ r. R3 I% z; I! S; h
正确资料:
  c2 ^; g/ M2 O7 U/ j) L5 @+ ^7 \) F
& f& F4 c, N6 ]  H" o
第40题,lxml库中etree模块的etree.tostring()方法是做什么用的
! X7 A, N* o) l正确资料:: p8 q% R7 d4 n8 v( M6 G1 q
) x& }1 M& r/ e# z4 \/ r: d

0 m2 o, U6 j# A8 ~4 {第41题,请描述爬虫中的深度优先搜索过程
0 O* O4 j% [/ D  G/ A* B  T0 x4 A5 z正确资料:2 u2 {% G0 n0 h

! m( h$ M, y5 \0 T5 ?4 a9 _/ B

' y2 A* b. M* P/ M2 _+ {! F$ R; s, q
& M$ w+ O: B. ]: M! w

2 K5 q. g' x' e7 k. D# w* [: x* ^3 G3 N4 m3 ^
  F0 v5 f  c1 w6 _

3 L2 v, K# \, q7 X
4 _+ r/ Y% c* T& q2 r2 E5 B& D, F1 P% B; O& B: S0 [

: e8 f+ B* b2 `# z- W7 Q: m8 N  }0 H/ M; @
. `, M  Q3 h" a& A' D

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?会员注册

×
奥鹏作业答案,奥鹏在线作业答案
发表于 2020-3-26 20:16:14 | 显示全部楼层
奥鹏作业答案,奥鹏在线作业答案
回复

使用道具 举报

发表于 2020-3-28 06:02:01 | 显示全部楼层
奥鹏作业答案,奥鹏在线作业答案
回复

使用道具 举报

发表于 2020-3-28 06:30:16 | 显示全部楼层
奥鹏作业答案,奥鹏在线作业答案
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

 
 
客服一
客服二
客服三
客服四
点这里给我发消息
点这里给我发消息
谋学网奥鹏同学群2
微信客服扫一扫

QQ|关于我们|联系方式|网站特点|加入VIP|加盟合作|投诉建议|法律申明|Archiver|小黑屋|奥鹏作业答案-谋学网 ( 湘ICP备2021015247号 )

GMT+8, 2024-4-26 22:24 , Processed in 0.102607 second(s), 17 queries .

Powered by Discuz! X3.5

Copyright © 2001-2023 Tencent Cloud.

快速回复 返回顶部 返回列表