做了个论坛,被玩坏了,不知道怎么办了,给跪。 - V2EX
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
yhf

做了个论坛,被玩坏了,不知道怎么办了,给跪。

  •  
  •   yhf Jun 2, 2014 7327 views
    This topic created in 4362 days ago, the information mentioned may be changed or developed.
    用户输入不知道什么文字,然后就这样了,有大神能指点一下吗?



    还有,Django有什么办法限制频繁访问的ip?我用的是SAE,在自带的防火墙里设置了5分钟限制访问30次,可是没用啊,总有些ip在一直用脚本不停地刷新。

    还有,我把那个ip禁了以后,他又换一个ip,有什么办法应对吗?真是给跪了。
    48 replies    2015-10-20 11:50:44 +08:00
    rankjie
        1
    rankjie  
       Jun 2, 2014 via iPhone
    神奇的unicode…
    gracece
        2
    gracece  
       Jun 2, 2014
    这个字符串当时在微博火了一把
    lazycat
        3
    lazycat  
       Jun 2, 2014 via Android
    @gracece 求详细。。。
    Akiyori
        4
    Akiyori  
       Jun 2, 2014
    似乎是泰国语字符?
    cielpy
        5
    cielpy  
       Jun 2, 2014   2
    yhf
        6
    yhf  
    OP
       Jun 2, 2014
    @Akiyori 哎。。。
    yhf
        7
    yhf  
    OP
       Jun 2, 2014
    @cielpy 额。。没讲怎么限制啊。。
    palytoxin
        8
    palytoxin  
       Jun 2, 2014 via iPhone
    正则匹配过滤掉
    cielpy
        9
    cielpy  
       Jun 2, 2014
    @yhf 额,我也不知道这个,刚才搜了一下才搜到这个的。
    ChanneW
        10
    ChanneW  
       Jun 2, 2014
    没良心的说一句,挺好玩.
    ChanneW
        11
    ChanneW  
       Jun 2, 2014
    去找找有没有 IP 限制的 中间件
    VeryCB
        12
    VeryCB  
       Jun 2, 2014
    试一下 ..
    yhf
        13
    yhf  
    OP
       Jun 2, 2014
    @palytoxin 好吧。。。只有这样了。。。
    babytomas
        14
    babytomas  
       Jun 2, 2014
    限制 User-agent
    crll
        15
    crll  
       Jun 2, 2014
    之前也见过,不过没怎么关注。
    yhf
        16
    yhf  
    OP
       Jun 2, 2014
    @babytomas 不太懂,user-agent不是浏览器才有的吗?别人用脚本爬虫,这样也能防范吗?
    kevinv
        17
    kevinv  
       Jun 2, 2014 via iPhone
    获取ip信息和访问时间存到内存中,每隔几分钟清理一次。通过访问频率判断是否是正常请求。
    如果是机器请求可以用重定向来解决这个问题,因为机器请求是无法重定向页面的。
    babytomas
        18
    babytomas  
       Jun 2, 2014
    @yhf 正常访问都会带 UA 的,我不会 python,不过你如果可以生成日志的话、参照日志看看那个 IP 是否有 UA,没有的话你可以限制 ip 段、或者说根据访问特征(例如说referer)

    实在不行你可以反过来思考,例如说只允许有什么 UA 的人访问,然后组建自己的 UA 白名单啥的 。。
    yhf
        19
    yhf  
    OP
       Jun 2, 2014
    @kevinv 好的 谢谢 我试试
    yhf
        20
    yhf  
    OP
       Jun 2, 2014
    yangqi
        21
    yangqi  
       Jun 2, 2014
    限制没什么用吧, 关键是这个问题无法解决? 不能把那些unicode字符给过滤掉?
    elvba
        22
    elvba  
       Jun 2, 2014
    噗~脑补喵星人眼睛发光。
    jings
        23
    jings  
       Jun 2, 2014 via Android
    这种是用泰国文字发的 利用泰国语法漏洞写出来的字 可以随意叠加 要阻挡的话只能换字体了 在win7下 我们一般是可以看到文字满屏幕飞 在手机上或linux下看不出来 这种字体还有一种坏处 页面会卡号死。但目前很多大网站都没有去屏蔽它。一是技术问题,更多的是对这种表示乐观。你的小伙伴都玩得这么欢乐为何你要发愁呢,乐其乐才是我们的初衷。
    WildCat
        24
    WildCat  
       Jun 2, 2014 via iPhone
    对啊对啊,陪他一起玩!
    dong3580
        25
    dong3580  
       Jun 2, 2014 via Android   1
    原来是泰国文字,以前遇到一次,结果把数据库恢复了一下也就没管了
    loginv2
        26
    loginv2  
       Jun 2, 2014
    cameo
        27
    cameo  
       Jun 2, 2014
    可以做个div把每个人发的文字内容限制在框框里吧,这样乱写也只影响TA自己发的。
    yjsslab
        28
    yjsslab  
       Jun 2, 2014
    第一次发现有这么变态的东东。。。
    ................................................
    dant
        29
    dant  
       Jun 2, 2014
    试试
    overflow:hidden
    awsx
        30
    awsx  
       Jun 2, 2014
    学校的树洞?
    wuwuyun
        31
    wuwuyun  
       Jun 2, 2014
    yakiang
        32
    yakiang  
       Jun 2, 2014
    UA 也是可以伪造的啊
    ip 他也可以换,虽然不多
    我觉得加验证码就好了
    mlhorizon
        33
    mlhorizon  
       Jun 2, 2014
    这个好长啊:
    yhf
        34
    yhf  
    OP
       Jun 2, 2014 via iPhone
    @cameo 前端水平比较菜 请问怎样把字限制在div里呢?
    yhf
        35
    yhf  
    OP
       Jun 2, 2014 via iPhone
    @awsx 差不多吧 学校的秘密
    notcome
        36
    notcome  
       Jun 2, 2014
    干脆除了几个 tone 之外的 combing 全部拦截算了。
    jaylong
        37
    jaylong  
       Jun 2, 2014
    o( )o
    突破下限的颜文字
    blaboy
        38
    blaboy  
       Jun 2, 2014
    字符白名单。。
    xiawinter
        39
    xiawinter  
       Jun 2, 2014
    这个问题怎么谈的上 ip 呢, 难道不注册吗? 不注册就可以发帖?

    1. 注册的时候加验证码

    2. 发帖的时候也加上验证码

    3. 每次发帖的时候按照用户名统计发帖次数, 多长时间内禁止重发。 做的体验好一点,对发长贴的进行限制。 如果一旦发现一个, 丢到黑名单,永世不见天日;

    4. 其次删掉重复字符, 这样看起来就不美了. 即使只是 strip 掉 空格,应当就很难看了

    5. 最后过滤掉全部这种 unicode 字符就好了, 这个字符我也不认识 ...

    我估计不用到3 就没人和你玩了, 不用去搞 ip 这么复杂, 又不是 DDOS
    stonestyle
        40
    stonestyle  
       Jun 2, 2014
    .被玩坏的小伙伴
    imcczy
        41
    imcczy  
       Jun 2, 2014
    这不是西电网页版的秘密么,,学长你好。。
    xiaoai
        42
    xiaoai  
       Jun 2, 2014
    贴吧曾经也有过。这是泰文。接受代码为unicode的原因。
    yhf
        43
    yhf  
    OP
       Jun 2, 2014
    @imcczy 额。。。你也是西电的么
    winiex
        44
    winiex  
       Jun 2, 2014
    用 one time password 可以解决用脚本刷屏的问题:

    http://en.wikipedia.org/wiki/One-time_password

    这里的重点在于,你需要将前端的 js 脚本混淆一下防止让 spammer 找到 magic number。

    Python 上有现成的库:

    https://github.com/nathforge/pyotp

    希望能对你有用 :)。
    yhf
        45
    yhf  
    OP
       Jun 2, 2014
    thx a lot!
    pyshift
        46
    pyshift  
       Jun 3, 2014
    频繁发帖无非爬虫,检查UA只是一个方法,UA可以伪造,意义不大。检查同IP或者同账号在一段时间发帖太多就限制,需要输入验证码。搜搜防止爬虫的一些方法,自己模拟几个,大学网站自己人肯定不会去破坏,外人也没这个时间去破坏,所以稍微限制下就好了。恶意的破坏可以拉黑名单,虽然暴力了一点
    kafei0421
        47
    kafei0421  
       Jun 4, 2014
    @rankjie 么么哒打开就看到你哦
    nuaazdh
        48
    nuaazdh  
       Oct 20, 2015
    ................................................
    About     Help     Advertise     Blog     API   nbsp; FAQ     Solana     3074 Online   Highest 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 192ms UTC 15:03 PVG 23:03 LAX 08:03 JFK 11:03
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86