用wget命令的爬虫功能抓取网页到本地文件,再用grep命令分析文件
1.抓取网页到本地
选择一个网页,比如 ,用wget抓取到本地。
$ wget
--2016-12-09 9:20:48--
Resolving ()... 60.174.156.100
Connecting to ()|60.174.156.100|:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/html]
Saving to: ‘snippet_1391852_26067’
snippet_1391852_260 [ <=> ] 44.19K --.-KB/s in 0.1s
2016-12-09 9:20:49 (314 KB/s) - ‘snippet_1391852_26067’ saved [45251]
查看:
$ ls
snippet_1391852_26067
已经抓取到本地。
2.在文件中查找某单词
比如查找return:
$ grep -o return snippet_1391852_26067
return
return
return
return
return
return
return
return
return
return
return
return
3.输出文件中某单词个数
比如输出return的个数:
$ grep -c return snippet_1391852_26067
相关热词:
本站内容来源于网络,如有侵权请与我们联系,我们会及时删除,我们深感抱歉!
注:本站所有信息仅供用于网络技术学习参考,学习中请遵循相关法律法规!
本文地址: https://v30.fanwenzhu.com/server/ml/10191.shtml
相关文章
热门TAG
win10 ecshop 主机 阿里云 解决 配置 C# C++ 解析 SQL语句 命令 Go语言 方法 CSS3 HTML5 CSS win7 MSSQL 服务器配置 IIS7.5 IIS7 IIS6 IIS CentOS 7 Linux oracle数据库 oracle phpcms discuz discuz教程最新文章
-
这是另一个例子
时间:2021-01-15
-
请检查 official 这一列上是
时间:2021-01-14
-
方法是使用 ip route 命令:
时间:2021-01-14
-
%W 一年中的第几个星期
时间:2021-01-14
-
6.查看 USB 信息 $ lsusb 要查
时间:2021-01-14
-
ubuntu移植Tcpdump到Android平
时间:2021-01-14
-
可能现在听起来 /dev/zer
时间:2021-01-14
-
history命令使用方法详解
时间:2021-01-05
热门文章
-
绝不要用的Linux命令
时间:2020-12-22
-
如何使用date命令
时间:2020-12-22
-
检查系统和硬件信息的命令
时间:2020-12-22
-
Linux命令输出头(标题)、输出结果排序
时间:2020-12-24
-
Linux命令行工具使用小贴士及技巧(一)
时间:2020-12-24
-
容器监控的命令行工具cTop
时间:2020-12-22
-
Linux命令行文本加密的小技巧
时间:2021-01-05
-
解读ip命令展示的网络连接信息
时间:2020-12-22
-
不常见但是很有用的GCC命令行选项(二)
时间:2020-12-28
-
通过实例学习tcpdump命令
时间:2020-12-22
