• 首页
  • 狐文
  • 狐图
  • About
狐窝
OvO
  1. 首页
  2. 未分类
  3. 正文

脑洞大开的自然语言验证码

2017年08月06日 222点热度 0人点赞 0条评论
2015-12-13 17:22 from---http://www.cnblogs.com/batsing/p/5043189.html

最近12306的验证码被网友们吐槽(hei)得一塌糊涂,由此我也对验证码这个东西产生了研究热情。现在的验证码有以下几种:
1、输入图片中的字母/数字/文字;
2、短信验证码(这个不一定能辨别机器人,主要是验证手机号码确实是你的);
3、语音验证码,有点击收听的,也有打电话过来叫你听的;
4、像12306(微触科技技术提供)这种的点击验证码;
5、像淘宝和极验验证的这种拖动验证;

然后我想到的验证码方式跟这些都不一样,源自于下面这句网语:
“研表究明,汉字序顺并不定一影阅响读。比如当你看完这句话后,才发这现里的字全是都乱的。”

这种打乱顺序的语句对人来说不会有阅读障碍,但对机器来说这样乱的语句非常难与词库作匹配得出正确的语义理解。下面开始讲如何利用(装逼):

1、后台随机抽取原语句,随机打乱词语及词语间的顺序,通常为邻近的字调换和隔一个字调换;

2、前端录音发送到后台,把语音转换成文字(有很多第三方平台可以做),与原语句进行对比;

3、正常人通常可以毫不费力理所当然地读出来,但机器非常艰难,现有的词库都是正常顺序,它需要对乱词进行重排,那怎么分词呢,依据什么来重排呢;

4、可以利用错别字互换,比如“竞”和“竟”等;

5、可以间中利用古诗词这种没有词组的语句来加大重组难度,比如“床前月明光,疑是上地霜”,但也很容易被模糊识别出整一首,慎用;

6、甚至可以考虑偶尔使用一些人们熟知的广告语,获取广告盈利,同样容易识别出整句,慎用。

甚至还可以加上这样的处理(图自贴吧)

最后,求大神可以尝试做一个DEMO出来,以及分析一下这种验证码的破解难度。

详细分析这种阅读现象可以看看这篇文章>>

标签: 暂无
最后更新:2017年08月06日

OvO

狐狸

点赞
< 上一篇
下一篇 >
最新 热点 随机
最新 热点 随机
brave编译打包时dump_syms报错Couldn't locate EXE or DLL file 使用Windows Kits创建PE 及精简镜像 Windows精简部署相关简易内容 APC UPS SUA1000ICH 踩坑记 TrueNAS SCALE虚拟机无法 Ping主机 TrueNas Scale libvirt-sock RDMA RoCE相关资料 Linux系统修改网卡名(eth0-3) Linux系统打开SRIOV 构建android内核时DTC工具中的多个定义错误 Windows 来宾系统提示“安全删除硬件” 修改jar的三种方法(反编译jar) 如何在 Debian 10上安装和配置 VNC Openwrt内SR-IOV网卡桥接问题 Linux下编译android 时报错loadlocale.c:130 windows 查看文件夹被那个进程占用 MongoDB中的多表关联 mongodb 学习记录
关于ubuntu循环依赖软件的删除 浅谈RAID和LVM VPS基本安全设置介绍 chmod只修改子目录或文件的权限 Linux VPS主机安全 用 rar2john+hashcat 破解 RAR 文件密码 使用Windows Kits创建PE 及精简镜像 TinyCore整合驱动及软件包 动态网页数据抓取踩坑分享 WebDriver中页面滚动(scrolling) 2019年的人们如何生成HTTPS证书 Android SDK 版本选择 根据mac地址获取生产厂商 linux指定nologin用户执行命令 浏览器about:相关链接 Android使用adb获得当前应用 activity堆栈信息 查看oracle数据库的编码及修改编码格式的方法 30个国外黑色网站设计欣赏
标签聚合
下载 linux docker 网卡 编译 https ssl android chrome 路由 e 密码 文件 http com git

COPYRIGHT © 2020 狐窝. ALL RIGHTS RESERVED.

THEME KRATOS MADE BY VTROIS