秀人集爬虫 【22.1.20】【Windows】

参数说明:
****************************************************************************************************
USAGE:
spider -h <help> -a <all> -q <search>
Arguments:
         -a <download all site images>
         -q <query the image with keywords>
         -h <display help text, just this>
Option Arguments:
         -p <image download path>
         -s <site url eg: http://www.xiurenji.vip (no last backslash "/")>
****************************************************************************************************

更新日志:

22.1.18
1.兼容更新后的秀人集网站,支持搜索以及全站爬取。
2.修改默认域名为https://www.xiurenji.net(暂时可以不使用-s 参数)。
22.1.20
1.修复页面异常可能导致的异常终止

  下载地址:

温馨提示: 此处隐藏内容需要发表评论,并且审核通过后才能查看。
(发表评论请勾选 在此浏览器中保存我的显示名称、邮箱地址和网站地址,以便下次评论时使用。
(请仔细检查自己的昵称和评论内容,以免被识别为垃圾评论而导致无法正常审核。)

文件哈希:

xiurenji_20220118.7z

md5:57df7c4f0b48252f4207454d53dba9f0

sha256: 0eabd2b04388ae567e1321d832986d07141b5f6f8caf789cb1d664e9cf0cadfe

名称: xiurenji_20220120.7z
大小: 6571454 字节 (6417 KiB)
CRC32: E20E2F4D
CRC64: EEF9E5CCD07DAF03
SHA256: 0455dfa2cb817732aedd0ff086a09bf69dfce4c1b61e75c546f8cb92b0f13552
SHA1: b312e5aa4d72123dda5cebc80df14b59b88c230a
BLAKE2sp: 8ab209002739adcfebd8a3623089e5ddc3252575ede36b57cf006bdb4d41f38e

旧版本: http://h4ck.org.cn/2021/09/%E7%A7%80%E4%BA%BA%E9%9B%86%E7%88%AC%E8%99%AB-%E3%80%9021-9-21%E3%80%91%E3%80%90windows%E3%80%91/

☆版权☆

* 网站名称:obaby@mars
* 网址:https://h4ck.org.cn/
* 个性:https://oba.by/
* 本文标题: 《秀人集爬虫 【22.1.20】【Windows】》
* 本文链接:https://h4ck.org.cn/2022/01/9765
* 短链接:https://oba.by/?p=9765
* 转载文章请标明文章来源,原文标题以及原文链接。请遵从 《署名-非商业性使用-相同方式共享 2.5 中国大陆 (CC BY-NC-SA 2.5 CN) 》许可协议。


You may also like

145 comments

  1.  Level 2
    Microsoft Edge 97 Microsoft Edge 97 Windows 10 Windows 10 cn安徽省合肥市 移动

    ?好家伙,我刚刚在看你的其他文章,回来一看,竟然又多了一篇文章,感谢分享

  2. Level 3
    Microsoft Edge 97 Microsoft Edge 97 Windows 10 Windows 10 cn江苏省盐城市 电信/(盐都县)电信

    感谢大佬,真快!

  3. Level 3
    Google Chrome 97 Google Chrome 97 Windows 10 Windows 10 cn安徽省合肥市蜀山区 电信

    -q参数是否有问题?
    “`python
    Traceback (most recent call last):
    File “xiurenji.py”, line 387, in
    File “xiurenji.py”, line 380, in main
    File “xiurenji.py”, line 345, in search_crawler
    File “xiurenji.py”, line 324, in get_search_sub_pages
    File “xiurenji.py”, line 90, in log_text
    File “colorama\ansitowin32.py”, line 41, in write
    File “colorama\ansitowin32.py”, line 162, in write
    File “colorama\ansitowin32.py”, line 190, in write_and_convert
    File “colorama\ansitowin32.py”, line 195, in write_plain_text
    UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa0’ in position 94: illegal multibyte sequence
    [15952] Failed to execute script xiurenji
    “`

        1. 公主 Queen 
          Google Chrome 96 Google Chrome 96 Windows 10 Windows 10 cn山东省青岛市 联通

          搜索没问题,你版本不对吧?新版没有gbk编码

          C:\Users\obaby>F:\Pycharm_Projects\meitulu-spider\dist\xiurenji\xiurenji.exe -q 范冰冰
          ****************************************************************************************************
                 _           _             ____
            ___ | |__   __ _| |__  _   _  / __ \ _ __ ___   __ _ _ __ ___
           / _ \| '_ \ / _` | '_ \| | | |/ / _` | '_ ` _ \ / _` | '__/ __|
          | (_) | |_) | (_| | |_) | |_| | | (_| | | | | | | (_| | |  \__ \
           \___/|_.__/ \__,_|_.__/ \__, |\ \__,_|_| |_| |_|\__,_|_|  |___/
                                   |___/  \____/
          
          秀人集爬虫
          Verson: 22.1.20
          Blog: http://www.h4ck.org.cn
          ****************************************************************************************************
          ****************************************************************************************************
          [*] 2022-01-20 19:52:27 QRY: 范冰冰 开始搜索......
          ****************************************************************************************************
          [*] 2022-01-20 19:52:28 QRY: 搜索结果无分页。
          ****************************************************************************************************
          [*] 2022-01-20 19:52:28 QRY: 搜索完成,一共 0页。
          [*] 2022-01-20 19:52:28 QRY: 搜索完成,准备下载。
          ****************************************************************************************************
          [*] 2022-01-20 19:52:28 QRY: 范冰冰下载完成,
          ****************************************************************************************************
          
          C:\Users\obaby>F:\Pycharm_Projects\meitulu-spider\dist\xiurenji\xiurenji.exe -q 喵喵cyann
          ****************************************************************************************************
                 _           _             ____
            ___ | |__   __ _| |__  _   _  / __ \ _ __ ___   __ _ _ __ ___
           / _ \| '_ \ / _` | '_ \| | | |/ / _` | '_ ` _ \ / _` | '__/ __|
          | (_) | |_) | (_| | |_) | |_| | | (_| | | | | | | (_| | |  \__ \
           \___/|_.__/ \__,_|_.__/ \__, |\ \__,_|_| |_| |_|\__,_|_|  |___/
                                   |___/  \____/
          
          秀人集爬虫
          Verson: 22.1.20
          Blog: http://www.h4ck.org.cn
          ****************************************************************************************************
          ****************************************************************************************************
          [*] 2022-01-20 19:52:48 QRY: 喵喵cyann 开始搜索......
          ****************************************************************************************************
          [*] 2022-01-20 19:52:50 QRY: 搜索完成,一共 2页。
          [*] 2022-01-20 19:52:50 QRY: https://www.xiurenji.net/plus/search/index.asp?keyword=%E5%96%B5%E5%96%B5cyann&searchtype=title&p=1
          [*] 2022-01-20 19:52:50 QRY: 搜索完成,准备下载。
          ****************************************************************************************************
          ****************************************************************************************************
          [*] 2022-01-20 19:52:50 PAGE: 开始分析页面链接
          [*] 2022-01-20 19:52:50 PAGE: https://www.xiurenji.net/plus/search/index.asp?keyword=%E5%96%B5%E5%96%B5cyann&searchtype=title&p=1
          [*] 2022-01-20 19:52:50 DOWNLOAD: 开始下载:[WingS影私荟]Vol.022_嫩模喵喵cyann阳光下的私房美少女真空秀美乳极致诱惑写真52P    更新时间:2020-1-6
          [*] 2022-01-20 19:52:50 DOWNLOAD: https://www.xiurenji.net/WingS/1034.html
          [*] 2022-01-20 19:52:50 DOWNLOAD: 下载目录:[WingS影私荟]Vol.022_嫩模喵喵cyann阳光下的私房美少女真空秀美乳极致诱惑写真52P    更新时间:2020-1-6
          [*] 2022-01-20 19:52:51 IMG: 正在下载:https://www.xiurenji.net/uploadfile/202001/6/4004331897.jpg
          [*] 2022-01-20 19:52:51 IMG: 图片保存路径:G:/秀人集/[WingS影私荟]Vol.022_嫩模喵喵cyann阳光下的私房美少女真空秀美乳极致诱惑写真52P    更新时间:2020-1-6\80780bb215ec1e7c72d37ec10561c2b5.jpg
  4.  Level 1
    Google Chrome 97 Google Chrome 97 Windows 10 Windows 10 cn湖南省长沙市 电信

    大佬真强,又有新版本了,支持!

  5.  Level 1
    Microsoft Edge 97 Microsoft Edge 97 Windows 10 Windows 10 cn福建省宁德市 电信

    谢谢大佬,原来安卓上用的一个因为没有源码,在我多次修修改改后终于因为网站重构再也用不了了

  6.  Level 1
    Microsoft Edge 97 Microsoft Edge 97 Windows 10 Windows 10 cn福建省宁德市 电信

    这两版不用-p改地址的话,没有G盘的人都报错,好像默认写在G盘。

  7.  Level 1
    Microsoft Edge 97 Microsoft Edge 97 Windows 10 Windows 10 cn福建省宁德市 电信

    而且好像是单线程的,略有点慢。。不过还是谢谢楼主

回复 linghhd 取消回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注