• 首页
  • 狐文
  • 狐图
  • About
狐窝
OvO
  1. 首页
  2. 未分类
  3. 正文

验证码破解技术四部曲之环境搭建篇(一)

2017年08月08日 68点热度 0人点赞 0条评论
Jun 28, 2016 from---http://nladuo.github.io/2016/06/28/%E9%AA%8C%E8%AF%81%E7%A0%81%E7%A0%B4%E8%A7%A3%E5%9B%9B%E9%83%A8%E6%9B%B2%E4%B9%8B%E7%8E%AF%E5%A2%83%E6%90%AD%E5%BB%BA%E7%AF%87/

前言

转眼就要变成大四狗了,大学期间做的比较深入的技术是爬虫,但是爬虫也有很多高级的技术没有涉及,比如说验证码的破解便是其中之一,再加上我对其非常感兴趣,于是乎,开始苦学图像处理、学习机器学习,验证码破解也有了些眉头。

以下是我破解的几种验证码。

1、最容易破解的验证码

basic
直接使用tesseract库识别。

2、download.csdn的验证码

CSDN
使用K近邻算法识别。

3、weibo.cn验证码

weibo.cn
使用卷积神经网络训练识别。

说明

项目源码:https://github.com/nladuo/captcha-break (可以帮我点个star(^__^) )
开发语言:python(编写爬虫),c++(编写图像处理部分以及机器学习算法)
开发环境:ubuntu 14.04
依赖库:
Python:PIL、BeautifulSoup4、requests
C++:boost、opencv2、tesseract-ocr

环境搭建

安装opencv 2.4.12

sudo apt-get install build-essential cmake libgtk2.0-dev pkg-config python-dev python-numpy libavcodec-dev libavformat-dev libswscale-dev
wget https://codeload.github.com/Itseez/opencv/zip/2.4.12
unzip opencv-2.4.12.zip
cd opencv-2.4.12 ; mkdir release ; cd release
cmake -D CMAKE_BUILD_TYPE=RELEASE -D CMAKE_INSTALL_PREFIX=/usr/local ..
make -j8
sudo make install

安装tesseract-ocr

sudo apt-get install tesseract-ocr tesseract-ocr-dev

安装boost

sudo apt-get install libboost-dev

安装python的PIL库

sudo apt-get install python-imaging

安装python的BeautifulSoup4、requests库

sudo apt-get install python-pip
sudo pip install bs4
sudo pip install requests

下载项目源码

git clone https://github.com/nladuo/captcha-break.git
标签: 暂无
最后更新:2017年08月08日

OvO

狐狸

点赞
< 上一篇
下一篇 >
最新 热点 随机
最新 热点 随机
钛备份或小米系统备份功能备份出来的APK无法正常还原 BBR安装启用 安装docker mitmproxy 调试方法 Android SDK 版本选择 Perdition Mail代理服务器配置 HAProxy SSL代理 Openssl 中间人SSL代理 Stunnel SSL to SSL代理 NGINX反代IMAP配置 各种设备User Agent Torrent下载工具推荐 用 rar2john+hashcat 破解 RAR 文件密码 2020最好的Linux发行版 关闭新版chrome工具栏上拼图图标 Office 下载、安装、激活,有它就够了! Android 非官方的发行版 openwrt添加autoconf-archive
NGINX反代IMAP配置Stunnel SSL to SSL代理Openssl 中间人SSL代理HAProxy SSL代理Perdition Mail代理服务器配置Android SDK 版本选择mitmproxy 调试方法安装dockerBBR安装启用钛备份或小米系统备份功能备份出来的APK无法正常还原
npm install 警告 [email protected] Win下必备神器之Cmder Window10上CLion极简配置教程 Tesseract-OCR 训练中文 如何隐藏windows 10 此电脑中多出来的 3D 对象 文件夹 如何在IntelliJ IDEA中快速配置Tomcat Linux安装bbr 关闭新版chrome工具栏上拼图图标 ZFS 调优指南 【微小说】上帝VS科学家 如何更改安卓屏幕分辨率? 推荐 15 款很棒的文本编辑器 nginx重写错误的调试 MyBatis批量插入数据 Linux系统下如何使用SSD固态硬盘 Caddy文件存储位置 〖最全〗pycharm+ipython notebook搭建(for mac) git fork后如何更新
标签聚合
下载 chromium 网卡 镜像 blog ssl git https 安装 docker e linux yum 路由 chrome 密码

COPYRIGHT © 2020 狐窝. ALL RIGHTS RESERVED.

THEME KRATOS MADE BY VTROIS