文章列表 - Python 爬虫练习网站

Spiderbuf

C07 - JavaScript 逆向爬虫练习案例通关提示

发布日期：1747156612 阅读数：901

问题会遇到加密混淆的 JavaScript 代码的，Selenium 虽然不是真正的浏览器，但还是有办法的。混淆后的 JavaScript 很难调试，加密的数据也需要找到它的解密逻辑。好像一切都变难了，但其实之前都有遇到过。...

Python爬虫实战C04爬虫实战练习案例解析

发布日期：1746724791 阅读数：674

打开Python爬虫实战练习C04页面爬虫实战练习C04，页面上只有一个类似“我不是爬虫”的提示及勾选框，这种页面有点类似我们经常在网站上遇到的 Cloudflare Verify you are human 页面，勾选后会判断当前用户是否为机器人爬虫。 Cloudflare 这个验证码之所以流行是跟 Cloudflare 免费服务有关的，Cloudflare 是一家提供云服务器、VPS、数据存储、CDN加速、VPN、SSL证书、网络安全、DDos 防御和域名服务等服务的美国公司，而且它有很多服务是免费提供的，所以很多网站都接入了 Cloudflare 的服务，就连 DeepSeek 都接入...

C04-爬虫实战示例代码

发布日期：1746724743 阅读数：575

coding=utf-8 @Author: spiderbuf from lxml import etree from selenium import webdriver from selenium.webdriver import ChromeOptions, ActionChains from selenium.webdriver.common.by import By import time import random import numpy as np import re base_url = ‘https://spiderbuf.cn/web-scraping-prac...

深入解析 Go Gin模板渲染 Json 转义反斜杠问题及解决方案

发布日期：1746286305 阅读数：353

Go Gin 模板渲染遇到 Json 转义反斜杠问题使用 Golang 及其 Web 框架 Gin，结合 template 模板以及 htmx 能够很高效地渲染 html 网页及展示给用户。因为 htmx 的特性可以让后台直接返回 html 片段，所以对于个人开发者及偏后台的研发团队来说是一个非常高效的组合。能够快速地开发 MVP 并部署到生产服务器上。而且生成纯 html 的形式展示给用户也有利于 SEO 以及使用 CDN 加速。 Golang 在渲染模板时做了一些数据安全方面的处理，所以如果是通过模板的方式直接在 html 文件中嵌入一些 html 代码是会被转义的。但 Golang 的...

2025年爬虫部署最佳云服务器推荐

发布日期：1745850273 阅读数：432

2025年爬虫部署最佳云服务器推荐随着人工智能技术及应用的暴发，AI相关企业对数据的需求也在快速增长，特别是金融、法律咨询、电商及网络营销行业，对大数据的需求一直保持着旺盛的势头。一些公开数据的采集就离不开爬虫技术。在爬虫开发与数据采集领域，选择一款高效、稳定、安全的云服务器是非常关键的。尤其到了2025年，随着各大云服务商技术升级，市场上适合部署爬虫的VPS和云服务器种类越来越丰富，性能差异也越来越大。那么，爬虫部署应该优先考虑哪些因素？哪些云服务器值得推荐？本文将为你详细解析，并附上2025年最新精选云服务器推荐名单。为什么爬虫项目需要专门选择云服务器？与一般的Saas平台及网站...

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24