奥鹏作业答案-谋学网-专业的奥鹏在线作业答案辅导网【官网】

 找回密码
 会员注册

微信登录,扫一扫

手机号码,快捷登录

VIP会员,3年作业免费下 !奥鹏作业,奥鹏毕业论文检测新手作业下载教程,充值问题没有找到答案,请在此处留言!
2022年5月最新全国统考资料投诉建议,加盟合作!点击这里给我发消息 点击这里给我发消息
奥鹏课程积分软件(2021年最新)
查看: 1057|回复: 3

[南开大学]《网络爬虫与信息提取》20春期末考核(参考资料)

[复制链接]
发表于 2020-9-3 13:54:37 | 显示全部楼层 |阅读模式
谋学网
资料来源:谋学网(www.mouxue.com)-[南开大学]《网络爬虫与信息提取》20春期末考核
7 E( t/ J/ d( G! b7 e4 U试卷总分:100    得分:100( f5 |: f5 y8 I8 N7 f& V$ D( \0 E) ^
第1,如果使用Python的数据结构来做类比的话,MongoDB中文档相当于一个()7 b5 i1 i! I+ p9 |/ k" d
A、列表
7 L1 Z; X7 l+ H+ _; _B、元组
% k0 d" @0 d/ W! F  H+ L% G! FC、字典
* d# H/ A( I8 T3 [& [- dD、集合
* R; r8 {/ N# l, q) n3 g: P正确资料:
1 J' {' ?! R  o5 g
3 s- E* _' n3 A9 I% `3 O8 N
* Y2 ?& c! e8 q9 o第2题,使用UI Automatorr输入文字的操作是得到相应控件后使用命令()
+ ?; h) f: f7 fA、settext+ k3 y3 c. d  _% t
B、set
) z& J0 c2 Y/ v& \: ^+ Z& nC、set_text# M3 J; `$ i0 E  j5 r. a/ |( D
D、text- V4 q5 R8 Z" E% x9 W
正确资料:) C0 o* \1 J# S# {. e5 R( w2 H. P# D

% p4 \7 |. J6 A; t; b9 C$ D; g/ N7 \! H" C/ d
第3题,在Scrapy的目录下,哪个文件负责存放爬虫文件?()
' b' w* w. D6 CA、spiders文件夹" M' q% U1 L) V  L* p7 J6 M
B、item.py
: ?  f; p2 X5 P  HC、pipeline.py. w' L# k" g" X
D、settings.py, I, Z  m+ Q2 j" _* P. W
正确资料:; @) z" ?& g  H& v/ A! ?# M
5 ?) K% T6 g; m) ?5 S
- A/ i8 i. L1 d; g+ }; K/ i4 r4 M
第4题,HTTP常用状态码表明服务器正忙的是()
, o2 _; O4 m* O9 Z4 aA、500
% `1 ?+ X' P9 s4 S1 `3 `B、503; H0 p! m5 u! Z+ F. D- {7 v1 d( x
C、403
; F: E7 p; u5 c; B/ ID、404
( j& k0 M& t' f0 I" M2 R, W正确资料:8 [# |, s& B1 m3 i8 |: i3 ]& ~: }0 X
4 ~9 ^1 F" f4 G, d$ N" o0 B
* P  s- e, `, D4 K2 S; G
资料来源:谋学网(www.mouxue.com),如果很多爬虫同时对一个网站全速爬取,那么其实就是对网站进行了()攻击+ O/ j1 U; S% S# e+ L1 d7 ?# c
A、XSS
8 J2 X: a5 W0 e1 }3 MB、DOS
& {& H- u, }( r* D- JC、DDOS$ i' T0 T8 r( I7 ?, W' Z
D、跨域
+ x  P) f/ K: |# \& \/ w  k) `% F" Q正确资料:
$ N3 ^# D, n% s3 R6 e6 v9 V: Y5 N2 D5 H  d$ l* T  y0 [$ k

2 T& Y( M! l9 x( p* |第6题,使用UI Automatorr判断元素是否存在的操作是得到相应控件后使用命令()3 N2 U7 T# E1 q8 c
A、exist, t) l" Q& K* d9 c, t( S$ Y
B、exists/ k/ O9 B/ W( \
C、isnull
% \3 ]" @+ V! H( ?# p3 T9 P# R, ~D、contains/ D) {; G: Y- W9 b3 S
正确资料:
+ d+ e% X! q  `' L( x, b/ f. K! |& f+ u- i" Y& K6 s7 j
, I' ?2 X9 x! r+ \% i9 A3 l7 c
第7题,带上通过Chrome浏览器从评论页面复制而来的()再发起请求,可以减少爬虫被网站封锁的概率5 x3 h! o3 W1 o4 u
A、Cookie- F) u  T/ v+ i& Z4 v; z+ ?
B、Html. G' K4 m! |# ~: \- Z& d
C、Headers
  J3 E  q9 d- G6 ]4 I' tD、CSS; d  n4 h( W% X% l8 t
正确资料:# `2 ~9 q# P5 R  s5 L. Z7 h% }
  E9 K# v' n6 q

* w" ?( h( N& b! ~第8题,Redis中查看一个列表长度,使用关键字()9 y1 v6 ~, ]1 y
A、len
, ^. l# d# r$ \1 BB、length7 z4 w/ k; n2 ^0 K1 N9 z. f3 o
C、llen, I0 @7 g6 @8 D. q/ ?* v
D、count/ c! i  `0 [  O
正确资料:
- b! o# }" ]( H" v& v. ~3 h
& K$ M: `% C3 k# Q( ~2 Q
& w  b' `; W1 K  A第9题,使用Xpath获取文本使用()- O8 \; I8 y/ ^" `- E; l
A、text: ^6 b. j$ l7 z; X4 t
B、text()
" R4 r$ ?/ y# O) K$ ^C、content9 u4 }5 K4 D- t  [. [4 s+ h& ]2 A
D、content()
. q! g' g3 S3 a5 E正确资料:
3 \  {) z# A* {3 q4 j9 d& L8 b
* c" p- j% a- X6 K# Q) n  ]
7 x4 R4 c4 u3 U5 |资料来源:谋学网(www.mouxue.com),使用python定制mitmproxy,下面的语句请求的是()。{req.headers["User-Agent"]}
2 E  u8 M3 F; ]* g3 gA、headers7 }, G2 A1 G1 d; M3 w  ^1 Z# b$ y
B、文本内容
* i0 K" q) \& @/ g$ V$ Q! ~C、目标网站' K1 a. W1 @' a) [
D、user-agent
3 L5 m5 ~* C% o9 T% @) \* {& r" i正确资料:
6 `# j/ J* h2 i2 v: _3 }# L' y: _$ g8 h& @, O  G: Y
# g$ Q3 u  g. s2 K* `- p
第11题,Python中Object={1, 2, 3, 4, 5},则Objcet是()
. J  k- w& M# z+ h8 H1 G- `A、列表
" H8 r8 {; N/ Q8 k3 v; c3 H# }* w# AB、元组
' }! r+ Z+ K9 S; |! d, PC、字典/ M7 n; m* h7 c8 E  r
D、集合
$ ~& t- P9 ?; z6 w正确资料:) R6 A& ]) f7 ?0 L  j5 Q

7 o9 ]" a6 s# z( j, q' o8 j1 c! q' C. h3 {% h
资料来源:谋学网(www.mouxue.com),在Scrapy的目录下,哪个文件负责存放爬虫的各种配置信息?()
( A/ k- C, `1 f* j8 }A、spiders文件夹$ `0 a' W: e4 J5 f: q
B、item.py
& z7 R" ^$ l$ z2 wC、pipeline.py
3 B6 S3 |. ^. p+ E+ G$ J# G* `/ BD、settings.py4 \! g, e' Y. q( L4 y
正确资料:! g3 ^3 \; L0 K# S% w
0 L! `6 Y+ L7 `& d3 }
9 ~3 V6 S$ q  H. z
第13题,Redis是一个开源的使用()语言编写
9 V3 c( A! T2 P0 h$ I' @A、ANSI C: N7 [; F6 X% Y: l( b- g, Z$ H
B、C++9 B4 N# i. Y7 ^
C、JAVA
4 @& b  X8 @. A+ _D、Python
: r1 n, f) ~" N% X' b$ G, {) u3 t6 T& n正确资料:
+ {# o' H8 Q7 V5 Q8 n$ T9 d& C$ q% b6 q
# s& F/ ]. x9 L9 s/ a! b0 ?# a
第14题,某些网站在发起Ajax请求时会携带()字符串用于身份验证) K$ a, ~  L5 X, _
A、Token- p6 z8 T& N% H" o' B
B、Cookie- {, f0 O6 D  Y+ P
C、ReqTime* `' T7 ?/ j: t9 j( Y
D、sum
7 S  s3 }$ h0 h( @* b正确资料:
- f/ R3 t; x) |1 ]/ S! `; W
5 \3 Y: o$ S) r8 r; `( }
/ x& W6 n2 t4 b. t' ^资料来源:谋学网(www.mouxue.com),使用UI Automatorr点亮屏幕的操作是得到相应控件后使用命令(). h9 P5 }+ K# z. y* x
A、wakeup
# i: S/ P& y$ P! y3 t) }B、light, ]; L4 K6 ]0 l  V
C、bright1 t: B% F: g, p7 t
D、sleep
$ z2 p5 D) w; u2 K, }正确资料:
3 c/ a; R. ~+ D. q1 t, {) ^8 s0 ^5 q' L( S' d6 B' R% r! H) E

/ \# @8 X; S% d& m: [第16题,Chrome的开发者工具中哪个选项可以查找到cookies
+ D2 `  }7 G2 P0 H& OA、Elements
9 A4 U" C* I- L6 r- T; Q; D& EB、Sources
7 q: f8 u( L8 Q+ @6 K6 W# o+ tC、Network: K2 i+ Y  b  m, \% D; Y
D、Peformance
+ e& @3 k, m1 ^. y/ e+ V* z正确资料:
% q) k/ e+ W" a4 K: ~. h* z+ U  r9 a- R2 y

$ G( V/ c5 H4 v$ M6 }# B5 }  G第17题,Scrapy中使用Xpath获得的结果调用了.extract方法,结果以()形式生成3 _4 m; y* I; S4 K  ]2 k# {, L: x
A、列表0 H6 F  z, b3 }' S1 w* }% c
B、元组6 g) r: Z2 p+ Y5 u3 ^0 T
C、字典
7 g6 W% V2 T: \0 Q' e+ j) MD、集合
$ A) Y% u9 o, m* [; Y* U正确资料:1 k0 J; e/ v7 p, r
* v' V1 z9 A; G% J
. S. g5 A  D4 Y! ~
第18题,以下哪个命令是创建文件夹命令()
) S2 v/ s2 q# ]5 [) q+ r- {0 C0 Y5 NA、curl8 N" s7 \5 C, [% Q% J1 X8 X
B、tar -zxvf
1 X8 d3 w+ v( L& N9 }  b# p3 WC、mkdir$ z1 \1 j, A5 ~8 U% }
D、cp3 b0 m3 H1 b- M$ z# l: K3 D0 N
正确资料:
0 T# p, f7 o$ l0 L3 Q6 A+ E+ D" V; [
9 U" K. I0 A. Z3 _
第19题,可以通过()绕过网站登录。! U, \$ k' {1 {
A、session
, L* f6 N  Q9 U7 TB、cookies( ~# a" v$ U; z  P, t( m
C、moonpies2 K( k1 W& N2 Q7 v, f
D、localstorage8 E  I! b# J6 e5 o0 S" V& y; y
正确资料:
- [9 ?+ `' }& u& Z) f8 E6 I7 i: M. r  }. ~. ?6 m
; ^/ F7 e9 D) h# _" m
资料来源:谋学网(www.mouxue.com),Python中把列表转换为集合需要使用##函数6 ]1 n1 i/ f) o& s
A、set7 S" n7 p2 M8 D& T9 f; V
B、list
+ s9 K3 ]4 F3 Y9 b4 ?1 O7 |8 e2 vC、convert
/ G8 y% X; L# Q+ YD、change
: g# U/ w0 _( M6 ?+ q" f正确资料:4 o( a+ a* [* ~" [+ h

9 r% U( H7 s+ ~: ~
) X0 D; p" y# c' y4 q9 c第21题,Python中的容器有()# K4 j; ]4 p9 s5 b3 I2 Y
A、列表6 [. `6 ^: p) C
B、元组* m9 e7 V7 s+ Q
C、字典$ q5 W, Q! Z6 ~/ L. D! J
D、集合
' C2 }% s' o% P) _# s: u9 C2 R正确资料:,B,C,D* J. Y: f, v. l% x4 l* v
% g0 i7 K3 [+ T) {

3 {. l& r. C* e( j& H, d7 I! \" J第22题,HTTP常用状态码表明表明服务器本身发生错误的有()8 X. O. `; p' g3 J# l
A、403
6 S# `& [6 I& v4 N' ?* LB、404
4 y& c7 F7 s+ D" s0 P; m( oC、500
) _1 j2 F% o$ b: QD、503! V6 O3 f  R/ U: h% h2 B
正确资料:,D3 m0 p* d. C& {. S
! Q9 N. a2 B: c3 }# ?

; E* l. c, }; Q第23题,Python中哪种容器生成后可以修改内容
/ a  v  _% E4 sA、列表
" w9 V* w7 o( m" J. r; A8 \B、元组
3 W; w/ ?) `0 [$ @9 I$ dC、字典' b( B' V3 ~9 O- u7 A7 P: v
D、集合6 `3 P' E% t* b  R
正确资料:,C,D0 _9 _& K2 t( W* l2 V
+ d- J( a4 R: L8 r3 R
( P: y1 m6 K5 U' [4 z0 g
第24题,最常见的HTTP请求类型有()
4 B4 I' k8 ?! t/ lA、GET
: y; v3 F* Q1 |0 RB、POST8 f8 f- L# @; f
C、SEND
  Q6 y; _; `6 p) a4 k0 U7 \. eD、RECEIVE) E% X0 j5 X- h; R/ L. W% y
正确资料:,B1 ^3 R" ]; Z: d5 R! L

% U& `- }3 u% k# H
4 z6 K4 k6 Q- M资料来源:谋学网(www.mouxue.com),BS4可以用来从()中提取数据' ]3 g7 P! ~# T9 P: y' n
A、HTML
) R) A7 S7 i$ P2 kB、XML; L9 r+ r5 |# R& H( p9 @
C、数据库
, G1 _2 A) W, @# U& K9 ]; J; n' pD、JSON* T5 x3 L5 ^" d
正确资料:,B
; x% b1 P6 f1 N9 ~$ u+ D$ U5 N& l( P+ e1 f) a

* b$ P5 _  k8 J3 W' \: n/ T1 q" n第26题,在Linux的终端使用apt-get命令安装一系列依赖库时,其中如果存在有已经安装的库,会覆盖掉之前的库重新安装
9 |5 x# R) r6 N! u' P. sT、对
8 B) l* m3 i- d: a. DF、错8 [& R, Y0 Z8 V, R
正确资料:F9 Y+ Y6 q& c1 v
, J" \5 x7 t  S  @& V* V# g' G
, b0 F8 c5 i/ G9 h' ]% F. l
第27题,使用Nginx反向代理到Scrapyd以后,Scrapyd本身只需要开通内网访问即可,不许经过输入密码
. r: M' f- o# [; N; ]- X( @( ~; iT、对, y7 T4 S% Q3 g: R! @- u
F、错! t8 L1 `& L0 O& Z6 r' P
更多资料下载:谋学网(www.mouxue.com
1 h" a7 B' C/ x7 W. `0 ?9 ~+ m0 K8 F: J) Z2 u
1 H* _! X' z; X4 V, L& R1 }
第28题,process_spider_output(response, result, output)是在下载器中间件处理完成后,马上要进入某个回调函数parse_xxx()前调用4 w$ Y: u; m% y" q) c
T、对
1 g* e4 L6 w7 r, H* ?F、错' [2 _1 m6 d- V6 x
正确资料:F( P$ ~5 l/ m. q* L6 T

" }% b  h' O- |0 _6 W) ~& p
6 @, l! A7 w- T' |5 F7 {/ L$ V第29题,Robo 3T与RoboMongo是完全不一样的软件
: J, k+ R$ p! b" G- YT、对# @8 V1 x6 }8 O/ H$ h5 r# W
F、错
! |5 [; Q) T3 a3 x0 e6 s正确资料:F: q, J" D+ N3 F% Y
7 c& T, S' L9 J9 g7 Q" A  m
2 x: D, K3 I  j" H4 k5 V8 z
资料来源:谋学网(www.mouxue.com),Python正则表达式中".*?"是非贪婪模式,获取最短的能满足条件的字符串。
& z9 Y# k2 H2 K% pT、对
0 S1 f0 @4 M& U- L8 }% mF、错( s/ w; F- G5 b( `6 p8 \
更多资料下载:谋学网(www.mouxue.com
% \' A5 [9 v! {, S1 C0 L) ^, C% N( ~6 e1 O' g: |

/ ]0 {) B5 c1 G4 X第31题,Redis插入数据都是插入到列表右侧,因此读取数据也是从右侧读取: G3 C8 ~% `# N- m& q; n; W
T、对
8 V1 h8 n) ^. k8 [7 C- e! `+ mF、错
. S1 a  v3 h7 s5 z正确资料:F
6 {8 h( l# D0 B) a9 x
, y) R2 s' L+ I' [' E+ K1 F
- {3 U: ^/ W9 E! m7 o第32题,爬虫登录需要识别验证码可以先把程序关闭,肉眼识别以后再重新运行2 l4 Q( |4 a2 ~# [7 U
T、对' l! ^8 x" k4 M
F、错' O1 S$ q% x, o, `1 V4 U# J/ V) F
正确资料:F
" Z  P* J5 a& R: R
% s3 y* [$ \. E1 I
. N& _6 R& F& |3 g第33题,在Ubuntu下若要运行Redis可以使用CMD进入解压以后的文件夹并运行命令redis-server.exe redis.windows.conf启动Redis
, a3 w* j. s5 WT、对+ P# ]1 x0 E! C( x. C1 @& E
F、错' `& J- I$ O8 F! k, [4 p
正确资料:F
2 n' Y6 p& S: T  H5 K# h& t/ v; n( ^5 ?2 J
4 T5 ?2 T; A" [! T
第34题,middlewares.py是下载器中间件
4 \  h. k, ~2 @% A( w1 ST、对
) j7 V0 Z; e! w$ _. \+ s) kF、错
' s, X' f* H5 F: Q) q正确资料:F
* ]: Z# m0 Y2 E- c! ?4 _0 A- ~# m7 ^: d. [# |

# Z0 D6 r! ]9 {1 U第35题,在charles中使用CTRL+F搜索,JSON里面的中文是可以直接搜索到的。+ f( q8 ^; [* ?7 G& u( r. m
T、对! w+ ]: L+ d# I8 H7 S' u" q
F、错
/ ]: J: J8 y" g. Q正确资料:F
, i, q( L% {9 V: \* E8 ^, L  Y% y$ b. S4 H8 E' C

$ c0 F7 P9 ^! T7 z第36题,使用了RedisSpider作为爬虫的父类以后,爬虫会直接监控##中的数据,并不读取start_urls中的数据。
: T7 m; K. }: ]. I正确资料:
6 m6 V) P' ^. @; x7 Q
. H# |/ W% _$ n9 j
% Y& e& q5 g* ^第37题,一般通过##表达式来解析网页数据2 ]: I$ c6 X2 f
正确资料:5 y. ^0 O* e. y1 u& o& a6 z+ i! U

# t7 G% F  L; O( q9 ^4 [; v0 y: P/ |7 M5 A' O% N; E
第38题,实现异步加载需要利用##技术
2 S0 m( m2 s2 p6 A* E) D正确资料:! z; I5 e1 L3 u. b: M. ?

/ j5 {7 F8 H( L7 l: A' x, n4 N3 v8 U- G* k; h1 i
第39题,Python中定义函数关键字为### y# \$ \) i( n( f. ^+ t
正确资料:9 I6 [1 v4 }8 {$ z
& H6 {# e+ w$ S( e) s5 t- @
. D  W( _" {( E7 j6 R9 f
第40题,Python正则表达式中search和findall方法比较
/ G  j  ?1 R3 _9 `, \正确资料:4 ^0 y4 d% V9 l- c% E  N/ E  Y

/ o( E+ g4 `$ @) W% j4 ^' b  [. z, A3 M8 a
第41题,在MacOS下安装Scrapy,当pip的网络受到干扰导致安装的速度很慢时,应该如何应对?
* G- g- Y- Q7 F2 q/ p7 j/ F, E" b$ h正确资料:
' f: ?5 }3 Z( h' O- V( R/ i# x! ?( Z' M2 M8 @2 }
5 d4 H8 p" X& K- E+ I
第42题,multiprocessing' C9 Y+ Y! j8 H* H/ r  b
正确资料:6 |/ u% J, P1 J1 y: F
, v7 H) ]3 l. e2 k
) n) E/ X- d$ d! q
第43题,URI7 r$ K* C  @6 J7 y! |
正确资料:5 |5 ~1 ~) n# o$ d5 t" b% E

1 Y+ q8 k/ @6 T" w( B+ N  x( w. |" v$ @" b- |
第44题,CSS  J/ i( `7 D- p/ J4 C5 K7 p
正确资料:- L7 \/ z5 q; C: F$ w; o9 A' F
4 \3 Z, H9 l* K0 P" ]6 \
. ?+ Z+ X- R* ?) N2 n) y6 p5 C
第45题,HTML
- J- K4 Z, t7 A3 d正确资料:  I' j! \  e9 ]+ ^( V

6 _$ L/ J6 L& G& a, `5 \6 G! d  ]: F( ?! S4 T" g0 v

9 ~: V5 {3 ]+ A# E& Z! v$ g
3 b, \4 a1 `) P; v; a4 g  Z
/ n, |7 U1 h0 v( ^/ b9 G1 G$ q
8 g" l) J: m7 }" R
  x$ R& L8 \$ `! I
2 G  a& k; u8 b$ D; N2 v* F3 l
# i9 u- }/ y9 ]6 N( w1 M# Y$ S, u$ F2 |4 Y( j. r
0 c8 s" ?$ i% e+ ]5 i4 v2 k
  k# T( F( x- `" D

$ k' w( M" ]$ r! |6 `5 q( ?( ?& Z! ~1 S3 `  j+ r5 b

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?会员注册

×
奥鹏作业答案,奥鹏在线作业答案
发表于 2020-9-5 07:35:13 | 显示全部楼层
奥鹏作业答案,奥鹏在线作业答案
回复

使用道具 举报

发表于 2020-9-5 08:31:54 | 显示全部楼层
奥鹏作业答案,奥鹏在线作业答案
回复

使用道具 举报

发表于 2020-9-5 09:28:32 | 显示全部楼层
奥鹏作业答案,奥鹏在线作业答案
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

 
 
客服一
客服二
客服三
客服四
点这里给我发消息
点这里给我发消息
谋学网奥鹏同学群2
微信客服扫一扫

QQ|关于我们|联系方式|网站特点|加入VIP|加盟合作|投诉建议|法律申明|Archiver|小黑屋|奥鹏作业答案-谋学网 ( 湘ICP备2021015247号 )

GMT+8, 2024-3-29 08:06 , Processed in 0.099534 second(s), 17 queries .

Powered by Discuz! X3.5

Copyright © 2001-2023 Tencent Cloud.

快速回复 返回顶部 返回列表