秀人美女网爬虫<重构版>[Windows][23.05.25]

更新日志:
1.重写了部分通用代码
2.修复https证书错误
3.去掉错误警告信息
4.其他的问题,至于是什么我也忘了。
5.修复-p参数无效

参数:

C:\Users\obaby>F:\Pycharm_Projects\meitulu-spider\dist\xrmnw2.exe
****************************************************************************************************
       _           _             ____
  ___ | |__   __ _| |__  _   _  / __ \ _ __ ___   __ _ _ __ ___
 / _ \| '_ \ / _` | '_ \| | | |/ / _` | '_ ` _ \ / _` | '__/ __|
| (_) | |_) | (_| | |_) | |_| | | (_| | | | | | | (_| | |  \__ \
 \___/|_.__/ \__,_|_.__/ \__, |\ \__,_|_| |_| |_|\__,_|_|  |___/
                         |___/  \____/

秀人美女网爬虫<重构版>
Verson: 23.05.21
Blog: http://www.h4ck.org.cn
当前服务器地址:https://www.xrmnw.cc
Blog: http://oba.by
姐姐的上面的域名怎样啊?说不好的不让用!!哼!!
PS:另外当然是祝大家521快乐啊!!
****************************************************************************************************
USAGE:
spider -h <help> -a <all> -q <search>
Arguments:
         -a <download all site images>
         -q <query the image with keywords>
         -h <display help text, just this>
Option Arguments:
         -p <image download path>
         -r <random index category list>
         -c <single category url>
         -e <early stop, work in site crawl mode only>
         -s <site url eg: https://www.xrmnw.cc (no last backslash "/")>
****************************************************************************************************

重点提示:

1.先去搜索怎么运行命令行工具!!!或者直接看这个视频:https://weibo.com/u/2120123121?tabtype=newVideo&layerid=4673816364844552

2.请使用-p参数指定下载路径!请使用-p参数指定下载路径!请使用-p参数指定下载路径!

3.不要问为什么运行闪退!!

不要问为什么运行闪退!!

不要问为什么运行闪退!!

不要问为什么运行闪退!!

不要问为什么运行闪退!!

文件哈希:

名称: xrmnw_v2_win_20230525.rar
大小: 15513393 字节 (14 MiB)
CRC32: EEA26ACF
CRC64: 83438A639D0E2D75
SHA256: cd44c1d5dd642cdec234d662ce80878859bcc15df72ec9a6bfc31a00acd904d1
SHA1: a22454d1714cb9fcd272b0388983fca5b649f13d
BLAKE2sp: 0667dbe2024fd66eb610c12cd1123ff27894fdcafd8212f2bde9187e17bdcbbf

下载地址:

温馨提示: 此处隐藏内容需要发表评论,并且审核通过后才能查看。
(发表评论请勾选 在此浏览器中保存我的显示名称、邮箱地址和网站地址,以便下次评论时使用。
(请仔细检查自己的昵称和评论内容,以免被识别为垃圾评论而导致无法正常审核。)

最后当然是祝大家521情人节快乐啊!


分享文章:

猜你喜欢:

26 comments

    1. Google Chrome Google Chrome Windows Windows ReservedUnknown ip address 2408:8214:e11:ec40:*:*

      哈哈哈,让你发现了。情人节不送花,送小姐姐~~哈哈哈 rofl

    1. Google Chrome Google Chrome Windows Windows ReservedUnknown ip address 2408:8214:e11:ec40:*:*

      你说的是代码吗?其实很简单,没啥高级的。之所以重构是因为同样的代码太多了。之前发的各种爬虫,很多重复的代码,这次都给抽出来了。
      通用代码维护也方便一些,上次发的爬虫升级版,修复了https证书的问题,今天发现好几个都出现了证书问题。底层代码基本可以复用,于是就抽出来了。一次性把所有的问题都修复了。
      哎,也是当初偷懒,给自己后来又找了这些活。哈哈哈。

    1. Google Chrome Google Chrome Mac Mac China山东省 移动 ip address 223.99.*.*

      丑女喜欢看美女,哈哈哈。想变得跟他们一样身材好,脸蛋好。哈哈哈 rofl

  1. Firefox Firefox Windows Windows China黑龙江省哈尔滨市 联通 ip address 61.158.*.*

    用了 xxxxx\xrmnw2.exe -a -r -p d:\照片
    但是下载路径还是G盘,改不过来。大佬帮看看什么情况。
    G盘是U盘盘符。不能下U盘里啊。

    1. Google Chrome Google Chrome Mac Mac China山东省青岛市 移动 ip address 223.80.*.*

      哈哈哈,这个是bug了。等修复吧,重构引入的bug,丢人ing~~~ rofl

  2. Google Chrome Google Chrome Windows Windows China广东省广州市番禺区 电信 ip address 218.19.*.*

    爬虫只听说过,没用过,作者厉害。下载试试,可以指定下载的一部分吗

  3. Microsoft Edge Microsoft Edge Windows Windows China广东省深圳市宝安区 电信 ip address 59.40.*.*

    博主能否日后是否能搞个小程序,整理下载后的文件名。现在文件名基本是乱码,图集文件夹也不知是否完整

    1. Google Chrome Google Chrome Windows Windows China山东省青岛市 联通 ip address 39.65.*.*

      文件名乱码是为了一致性校验,防止同样的图片地址反复下载。
      完整性没法校验,依赖于服务器和你的网络环境。最简单的办法,多爬取几个网站进行数据合并。不然这个没什么好办法解决。

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注