奥鹏作业答案-谋学网-专业的奥鹏在线作业答案辅导网【官网】

 找回密码
 会员注册

微信登录,扫一扫

手机号码,快捷登录

VIP会员,3年作业免费下 !奥鹏作业,奥鹏毕业论文检测新手作业下载教程,充值问题没有找到答案,请在此处留言!
2022年5月最新全国统考资料投诉建议,加盟合作!点击这里给我发消息 点击这里给我发消息
奥鹏课程积分软件(2021年最新)
查看: 1103|回复: 3

[南开大学(本部)]《网络爬虫与信息提取》20春期末考核(参考资料)

[复制链接]
发表于 2020-9-3 14:55:48 | 显示全部楼层 |阅读模式
谋学网
资料来源:谋学网(www.mouxue.com)-[南开大学(本部)]《网络爬虫与信息提取》20春期末考核
8 ?/ |+ v% D  j( G试卷总分:100    得分:100
- r8 b9 m1 \9 u第1,如果使用Python的数据结构来做类比的话,MongoDB中文档相当于一个()
. O8 U( A( n4 a! e7 G! J- CA、列表
. b6 V" R5 ~' R- a. h; _: B0 A% yB、元组
( M9 q6 x: q0 _( G' D% p$ f, EC、字典
) B' o3 i4 k# L' TD、集合
% Q. M5 ^) P8 I$ G4 q' Y% ]: ~正确资料:* I' A: ]" B& J7 l9 K
5 _- n0 e2 s0 u- {& n! {
. q5 h; R. v( l+ X3 G
第2题,使用UI Automatorr输入文字的操作是得到相应控件后使用命令()8 z- i. {( E9 p/ m6 v* }
A、settext
. w, f: Y& x* m4 }B、set
" c' J6 m* O2 A6 u5 Q% ], V3 EC、set_text
! d5 l! H) z7 d; ~D、text
7 }( y! i% S* F4 ~* N正确资料:' i  J% |2 T! K0 x

+ g2 ^% S" |/ g4 s, y9 g9 h& f
8 J8 [( D; o/ p6 n' p. }& j第3题,在Scrapy的目录下,哪个文件负责存放爬虫文件?()
6 X; W; D4 i! K% V' XA、spiders文件夹
( V1 I9 `) G# b7 Q7 VB、item.py- O$ O1 U) C* e4 _6 H
C、pipeline.py& z, x/ _. Z' `8 Q9 L' G+ k" ]4 [
D、settings.py2 U+ w( T. }4 K1 {: X7 R
正确资料:
6 f$ I2 H5 n( N% t$ b& \5 J: N: @6 I5 {" e' K
1 G5 f* i$ c; u0 e' p
第4题,HTTP常用状态码表明服务器正忙的是()
) G4 U9 `0 a3 n4 ?& BA、500
# M4 p) d3 S; z0 mB、5035 m/ d& o; T8 a9 f: d  u
C、403
& @9 B" p8 b( o) A2 ?D、4049 r3 O' b2 u* P3 W. E! R
正确资料:7 t& P! t( Z6 V' h9 s% @$ x
2 Z2 v& z( Q7 x1 _4 ~8 n9 C
6 g5 k' p( E+ q' `% `/ g
资料来源:谋学网(www.mouxue.com),如果很多爬虫同时对一个网站全速爬取,那么其实就是对网站进行了()攻击
$ b& ~: R2 ]' W; Z) yA、XSS
0 Z6 s8 D1 v' A! I  f, yB、DOS: Q( T- ]0 q* R
C、DDOS
/ N: x* _( a$ j$ `7 ^" A. j. O. h: iD、跨域6 v: O. p8 G' g! h$ e: G
正确资料:, [$ G2 O+ a  `/ m  F
5 V& J0 H( N& Q" o8 J6 M

0 `- ^. y/ _" \5 ?) c& X第6题,使用UI Automatorr判断元素是否存在的操作是得到相应控件后使用命令()0 @& y- a& v7 v+ {+ {
A、exist
0 D! H1 N. i/ vB、exists/ o/ l( }9 _, S0 d0 M7 O# _* V
C、isnull
5 U. V. j0 d3 M2 h) d# z$ WD、contains, N, Q) f& _7 D' T4 D7 U
正确资料:
( T. N# i" J( ?: \, u# h
! v8 }* N, ^; k' e# ]; @3 ]" I8 N
# U/ ~9 v7 p+ z5 M+ b. m第7题,带上通过Chrome浏览器从评论页面复制而来的()再发起请求,可以减少爬虫被网站封锁的概率
% U' T# y4 q. I  Z. E7 u& T" x* `A、Cookie
5 i9 f5 m/ N) T6 ?. d2 @B、Html  J; N2 G5 Q+ Q
C、Headers. M; ~+ \. \( p6 q/ M0 ~* h! L
D、CSS
* T4 F$ x# ?9 L$ W' E. D正确资料:
. t. r, s$ E4 x( ?7 X$ S9 {" z2 z, @5 K: p1 q
* w' J1 \  [2 f3 I7 E$ }  k- `
第8题,Redis中查看一个列表长度,使用关键字()
+ e9 d7 |  s9 C7 N4 V1 G% m* R: YA、len$ ^" v3 B+ N4 W) G; g
B、length
. X& q- ], b; L, ]# b: i7 FC、llen% m7 Q4 g/ \3 H. y, c" q; B2 \
D、count
7 P  M, {. I$ j8 q正确资料:
9 |0 M+ W+ S2 L& D8 s; I: j
6 _) w! j+ ^6 N# s8 h' o" ~8 Q( Q/ ?( \7 H! S
第9题,使用Xpath获取文本使用()
) ]- p6 u! B5 V) f, _A、text
( M) e7 I# h! w8 M5 _B、text(). c- I9 |2 Q, R  Z, ?% k
C、content* l; W" A8 d  A" O
D、content()
. N' t0 }8 w; y* O- ~正确资料:
6 E+ {( Q# V. N) e5 l
2 w4 }9 y+ i5 p6 C. f! r8 b# _5 w3 |) Z, w% v
资料来源:谋学网(www.mouxue.com),使用python定制mitmproxy,下面的语句请求的是()。{req.headers["User-Agent"]}: h7 T1 ?- w% E, _
A、headers6 Q6 ^) K9 Z( f% [+ ]
B、文本内容: J2 J. B/ |7 P& a- U& L
C、目标网站
; [& y0 I& i8 K5 u* F$ uD、user-agent7 b6 U& e: }( n9 q. c9 Q$ D2 H
正确资料:
; V3 l% R& S9 Z7 ]5 D; D2 f/ S
" l! t1 L# G- g5 R- u( [- @; ^
: j0 `. V- R+ d8 H5 G第11题,Python中Object={1, 2, 3, 4, 5},则Objcet是()9 D' C4 P' i$ I1 n
A、列表" e$ Q. E9 y4 z  ~1 t
B、元组
; K* g& ?- p/ P: I' _/ b  ^. fC、字典; I. g. V7 o: H$ H
D、集合0 Y/ Q$ A' {" {9 H  I2 O/ |
正确资料:4 G- n+ X& [! z# o' o" ~

, g% t6 ~* I* M# ~
" v$ V0 P# Y9 A  ?- A+ B% \$ x资料来源:谋学网(www.mouxue.com),在Scrapy的目录下,哪个文件负责存放爬虫的各种配置信息?()* \- e4 {; _# Q( ^. r+ d
A、spiders文件夹
  p% K  I  I. kB、item.py$ Q  e3 S3 k/ r
C、pipeline.py/ @, v& L. \3 K6 P) H5 O3 s9 p
D、settings.py& L" f9 H9 ?, p5 [
正确资料:
* v$ i& |& A5 a: l6 K- W- X& f
  S4 U/ R0 e  M% f3 U9 @
6 V- J& o0 t2 s' B9 e$ y) A第13题,Redis是一个开源的使用()语言编写+ M* Z- [/ ?) ~7 [: O/ m
A、ANSI C. o% {6 ^( R$ s; J; j9 J1 D
B、C++
9 X1 h4 Z* @0 l# m. n% ~8 m$ ~. nC、JAVA
/ A3 e+ d# N! N8 c4 l2 JD、Python
' z+ d* G) v# _, ?, T' S5 ~* e正确资料:
' T. U5 {" y$ ^8 g7 K9 L( H8 x0 [4 b- F$ i4 t% k% ]6 J  d5 E

8 t, i& X8 z2 [' [第14题,某些网站在发起Ajax请求时会携带()字符串用于身份验证
9 t  {4 B$ O9 }3 Q8 y+ N  _A、Token: j7 m0 V/ _! k" T. T
B、Cookie
, q" v6 A" \2 F; D& MC、ReqTime( |0 `: E9 S* i( }/ S% V3 I
D、sum- Z+ f( h) o' I0 o
正确资料:3 h! G0 x8 m# u% B3 x3 F2 H
) `4 M4 w+ q, m+ j/ A& f2 T* q

* U- o* s" S. T& X, ]8 A4 f" [. i资料来源:谋学网(www.mouxue.com),使用UI Automatorr点亮屏幕的操作是得到相应控件后使用命令()
+ }7 h" G" M9 E3 ~7 Q) d- t. dA、wakeup1 b7 d" N9 P- X1 Y) n; Y4 U
B、light
7 q! I5 G0 u# MC、bright  L+ }- p  S& O4 N) h& D
D、sleep4 m% `" |1 p( E1 G% L% r) F
正确资料:1 X9 W6 n, x) I4 S

9 @& ~& I1 J& f* \$ y4 o$ I- I6 t0 {* m" p
第16题,Chrome的开发者工具中哪个选项可以查找到cookies8 O1 b  O3 g9 b' Q' l5 ~! S
A、Elements  r1 e4 z9 l' ]
B、Sources
2 ^/ G1 z- x+ l+ B2 v/ _; u! RC、Network0 H3 A2 f  y! C- n; G) h. R8 R& Y* [
D、Peformance
" s! M6 S0 V0 A3 J& |2 j正确资料:# {9 u4 C, j9 e; U1 C

; s# w7 q7 P2 P
) E# u2 v( m5 \2 j第17题,Scrapy中使用Xpath获得的结果调用了.extract方法,结果以()形式生成$ f/ v1 H. p! t3 `
A、列表0 n3 Y0 K* K( O0 J) {8 y1 p
B、元组" C2 B; W( Q# E
C、字典7 _% w" a8 y9 `
D、集合( ~; ?- m3 t) H2 R( E
正确资料:
, L3 ^/ Y% j# J  N# W
( g$ J# Q- A. W9 _/ `
) Y% g0 K/ l: u第18题,以下哪个命令是创建文件夹命令()1 Y. k+ L, i" l
A、curl- p8 @6 F1 e8 P, b
B、tar -zxvf
& H: K7 Y6 }* h% nC、mkdir7 c" w' ]/ j' D. r' C3 B# E
D、cp: Z3 S1 I2 a" F) q; c; C
正确资料:( K- W8 h: z3 \% ]6 F1 e. }

+ z4 Y1 m: n& j  [) p
( |3 A  s7 A; p7 h; p第19题,可以通过()绕过网站登录。: c( _* w+ I* }# r( ]8 y' m
A、session
' r6 H& M  c' {* V& ZB、cookies
$ t6 M! m) r0 o3 ~% D3 ]C、moonpies5 Q* H  m( o) S) V8 v# i
D、localstorage; d9 e. L6 y3 P/ f6 s, ?( B' U
正确资料:# f% p& y  k) s7 e0 [: @
! M) B. s6 I$ O  E* a( P8 i
' ^0 e+ Z. W4 B# g- c# {
资料来源:谋学网(www.mouxue.com),Python中把列表转换为集合需要使用##函数' D2 B- _. ]* w7 V
A、set
" E9 r4 z8 X: q- ~; U+ c, Q. K+ j: Z2 QB、list7 d! B3 \7 G/ y/ b
C、convert
+ V# o! V+ ]0 j, y1 S" \D、change
7 z4 d8 }8 T& i1 S* t* f+ b5 r正确资料:
. o3 @5 O  h8 g3 U
7 g3 \/ C6 X7 [( u9 B
) r: Y4 O; v3 k% R第21题,Python中的容器有()0 P- U, N9 E5 s0 q) _, Z
A、列表
4 J% i- N; D( f- ^/ SB、元组7 W2 K2 P4 y5 n7 v. Q2 n
C、字典- Y, g( |" I" E. x4 g! Q/ v
D、集合9 m- C9 V- q. M# f6 G/ f
正确资料:,B,C,D
& `0 b4 a+ _7 m4 g3 B3 ~- R; G  \$ l# u5 W! Z! W9 q

8 g9 H0 @$ p- b9 K第22题,HTTP常用状态码表明表明服务器本身发生错误的有()
  t; }! Z- K: M* i# A! @( a5 ~( n: J' MA、403
- s, @1 A) g; J' A3 n' [" O: j  bB、404/ n8 p0 U# m, ~6 g
C、500
- L. G, ~* z4 PD、5034 i$ D. n: ]3 s3 U* v
正确资料:,D! R& x: m  j! W+ S- @4 \7 Q
0 o1 v+ w3 z, s! `# ]! @# P& T

; [7 r- ~2 x4 P! f& o# c第23题,Python中哪种容器生成后可以修改内容
1 a* U6 E# C' o7 _9 ?; {' z. lA、列表. k8 ~; R6 A) i
B、元组
. r& O# E* a& S  B; zC、字典
6 q0 }" e" X  Y: BD、集合
! u4 F) z7 R$ q& D" q, B正确资料:,C,D! y$ i. b% ]) T* J, x2 v% Y2 {

: a& M2 k+ M6 C  k3 J9 r4 }
; ^5 N1 q/ D' N. }7 C第24题,最常见的HTTP请求类型有()
; R, t/ v7 z/ Y+ f) YA、GET
+ _- S' a" Z: ZB、POST
9 K" L3 h4 _4 q9 d* @) J8 l6 [8 ]C、SEND
) L; g! g2 J& E( A! T( }D、RECEIVE2 @+ c/ V+ |( j1 x9 U1 l- y9 E
正确资料:,B, C- m3 j) R& V) X7 U$ n
% N$ l" U; v% U1 n; k& q3 q
# p8 w+ l& ]0 T$ p! ?  h& \
资料来源:谋学网(www.mouxue.com),BS4可以用来从()中提取数据
2 E" D8 q" m3 i' @1 l$ h8 ^A、HTML3 e# S7 j/ m3 L2 G- j2 C: D
B、XML2 X: v0 r0 F* L! \: R0 r/ K9 p3 A
C、数据库
# A2 C  ~' D$ x0 H9 b1 hD、JSON
( `& `2 E  d8 y' L  R2 q1 w正确资料:,B
& x. H2 x' [/ Q; n) H- p
8 o+ [. c/ y- A) n% v! f) [; P  H* q: \4 g5 ~) X. q. Z; R
第26题,在Linux的终端使用apt-get命令安装一系列依赖库时,其中如果存在有已经安装的库,会覆盖掉之前的库重新安装0 o* Z/ {5 i/ D6 `- l6 z4 S
T、对
. r; w6 [5 M0 S( H  N2 u' W1 fF、错' a! r; U% F4 H' e
正确资料:F
! b# z+ k  x# e  ?# ~  i: ?! m
5 n* ^( _. h6 ~; A
# l7 p5 d! A# G" i3 w* m第27题,使用Nginx反向代理到Scrapyd以后,Scrapyd本身只需要开通内网访问即可,不许经过输入密码
1 z. u4 i" P( h, kT、对
' W4 ~5 H5 |# j) l1 GF、错- D+ }5 `& v- |, O
更多资料下载:谋学网(www.mouxue.com
) H: c/ B. w3 \' `% L4 Y0 |  p3 [* `) w6 O( V0 @

) m1 a1 Z3 z# G0 _: C) l( S第28题,process_spider_output(response, result, output)是在下载器中间件处理完成后,马上要进入某个回调函数parse_xxx()前调用
0 H4 Q  @& Y, U: P: z5 WT、对
, I4 `- e# \, |, iF、错& o$ D8 D, |/ [! f$ b( j. p# C. f
正确资料:F
: o8 N- F# H% m5 @0 c/ g) G" ^' O, ~) G& e& T2 D# p
2 V  H; v# w  _& B
第29题,Robo 3T与RoboMongo是完全不一样的软件
# _+ `5 Q3 J5 xT、对2 `* C% m8 Z8 T. b- {. s
F、错' L, F- r* o+ S0 S/ r2 ]( [" g
正确资料:F8 U* E  T# k$ c  K8 d

1 L9 }( ]9 U) }6 }( Y
2 W: }5 D1 g6 M* p资料来源:谋学网(www.mouxue.com),Python正则表达式中".*?"是非贪婪模式,获取最短的能满足条件的字符串。+ B6 S8 V% }2 p, k- N$ @
T、对
" c7 l7 R( t" k5 d" SF、错
) B7 F$ Y" T5 F更多资料下载:谋学网(www.mouxue.com, A  B$ s. X# Q5 \: s
+ Z6 M7 m7 C9 b/ d& l

; F" a3 C4 x2 N; a: k: _: G第31题,Redis插入数据都是插入到列表右侧,因此读取数据也是从右侧读取
5 h7 Z! d8 S4 f1 O- e* BT、对
/ [" [- [: ^. `- l( aF、错
% f) [! H0 K" o) B* |0 |+ @正确资料:F0 z+ w$ q3 C2 K$ ~" K- A4 l

& t8 L. H; w. m+ i* x
0 k0 ~- h5 f7 ~" S* J2 F9 V第32题,爬虫登录需要识别验证码可以先把程序关闭,肉眼识别以后再重新运行
1 K! i' ]- F8 N- ~  \T、对
/ @6 {6 P9 o* b" ^1 W! eF、错
) O& C* X1 u: A正确资料:F
. A. ^" \& [6 `3 R* B; S- m% h8 I2 ?" ?+ g

# v7 y4 s7 A" f2 m# W" U第33题,在Ubuntu下若要运行Redis可以使用CMD进入解压以后的文件夹并运行命令redis-server.exe redis.windows.conf启动Redis1 v4 v; z* T: u% V$ w+ }
T、对$ o/ \% i' v7 W# W8 e
F、错
) p+ q% @. I1 |7 u* \9 `正确资料:F9 `" a8 w# q$ G
4 K) r# t) G' ^8 d7 Y$ U

6 m7 Z9 k: d- V4 d# l1 u第34题,middlewares.py是下载器中间件; i$ T& P+ C# h
T、对( Y6 P6 Q; w5 V% z3 W
F、错
  h. u/ ~/ P1 W5 |正确资料:F# b2 q5 l7 l, s  x

+ v) F& E7 u# O3 P8 r# y2 `4 i/ O) A
第35题,在charles中使用CTRL+F搜索,JSON里面的中文是可以直接搜索到的。
. }. g" ^. Z& c* k4 S0 dT、对6 V; D9 U5 n0 {
F、错& T% X& C( O# x( Z4 y6 A
正确资料:F
+ Y1 N4 j5 K( [0 i
* g# i( I: `+ u# x0 |, q
3 l3 i) R# C' H# s, u第36题,使用了RedisSpider作为爬虫的父类以后,爬虫会直接监控##中的数据,并不读取start_urls中的数据。
# s8 D7 A" _8 [" ~6 a: b0 y正确资料:1 p: h' J+ E7 ~5 |3 w+ Y

& e7 X* V+ A8 V  |5 i3 S0 j( \% A! u* u$ z+ k
第37题,一般通过##表达式来解析网页数据
" m, L6 Q" w9 X, T0 k! F正确资料:
& W3 n1 T. O3 S9 L8 ?& _- B5 v! o7 c, X) h; F7 [0 _  @
* Q' ~9 q  D) w1 }! d, U
第38题,实现异步加载需要利用##技术6 K* \1 z8 l8 |# u+ C, E8 l
正确资料:
8 ~" `; ]- w+ S; i5 D, A- `5 u( ~  F: P4 N3 E# a! ~
5 D( }; ~) E, B5 O& X
第39题,Python中定义函数关键字为##' P$ ]  J# A6 f2 s8 `  o4 d
正确资料:
6 v# |0 I6 h( q5 d3 w( ^: C" \% E- D3 f

' H3 l: F# t- Z6 h, n; I第40题,Python正则表达式中search和findall方法比较
# N. r4 |) h/ ]' D% G& T+ x/ a( B9 N正确资料:  b9 F! @) J6 d. a
3 d6 G8 R0 s) z! I) B  s

. B( b$ l. A* }5 i; e0 p第41题,在MacOS下安装Scrapy,当pip的网络受到干扰导致安装的速度很慢时,应该如何应对?# B2 J; |/ b9 d+ e, d, E
正确资料:2 h& y( G* ]9 E% P0 l" a. F4 b
* {$ B' u' v  v# p. E
9 A/ P6 D" N( u7 J# r2 i
第42题,multiprocessing0 K  @6 y# i+ q6 |; [
正确资料:
& k8 q* `4 h, `3 ~- w7 E
+ z" _1 X' r6 x+ l: d& R) y5 u# ~* ]9 Q7 J- ]2 I5 P
第43题,URI
3 E* A8 h2 [: x- K. i8 x9 r+ t3 D正确资料:
4 a# M& \5 _2 A3 x# G! S
6 p" s7 Q: w. j  ]! P) W4 n: C
( A: f7 I$ @5 i' e0 b! t  G: J第44题,CSS4 {1 w) ]3 A' H  L6 f
正确资料:
8 W1 c& b3 i2 E& j! H. }' Z: P; D. R- ]; @  i
/ J) w6 Y: Z5 A$ H6 L* c
第45题,HTML( Y. }) ^4 i# P/ X, R, Y
正确资料:
2 n( E8 g0 M6 s5 R1 b" r& h) i/ u- K/ D/ A' \9 d
" d: o! }/ e$ l8 G7 Y* \, w3 N

; p* t9 S: ?; T! M0 c& {3 Q2 D; z3 ]9 M: `9 e! ^' O

/ e' ?5 c8 A# N$ }: }
( z9 E& `4 c8 ]9 Y0 ]
' l7 J/ n! `$ C0 g2 [1 F
0 f+ t4 |" ~6 `% L& ?# q) i# }) ?( Z0 [/ O8 Q& @
- k1 s& _5 ]# H! ~4 {1 q
# [$ l, x' T9 `# V$ s) A2 c+ M

6 i+ Y, `2 |+ Z6 L
( I& ]) \: P4 m% v4 A
0 m$ e+ o* f/ k# l+ M* _+ u

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?会员注册

×
奥鹏作业答案,奥鹏在线作业答案
发表于 2020-9-4 10:35:01 | 显示全部楼层
奥鹏作业答案,奥鹏在线作业答案
回复

使用道具 举报

发表于 2020-9-4 10:55:12 | 显示全部楼层
奥鹏作业答案,奥鹏在线作业答案
回复

使用道具 举报

发表于 2020-9-4 11:29:35 | 显示全部楼层
谋学网
老师说谋学网可以下载资料,原来是真的!
奥鹏作业答案,奥鹏在线作业答案
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

 
 
客服一
客服二
客服三
客服四
点这里给我发消息
点这里给我发消息
谋学网奥鹏同学群2
微信客服扫一扫

QQ|关于我们|联系方式|网站特点|加入VIP|加盟合作|投诉建议|法律申明|Archiver|小黑屋|奥鹏作业答案-谋学网 ( 湘ICP备2021015247号 )

GMT+8, 2024-4-19 08:49 , Processed in 0.107021 second(s), 17 queries .

Powered by Discuz! X3.5

Copyright © 2001-2023 Tencent Cloud.

快速回复 返回顶部 返回列表