分享关于 URL 正则识别以及 URL 的可读写性的经验和体会 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Weakdancer
V2EX    正则表达式

分享关于 URL 正则识别以及 URL 的可读写性的经验和体会

  •  
  •   Weakdancer 2014-02-15 02:00:49 +08:00 2398 次点击
    这是一个创建于 4262 天前的主题,其中的信息可能已经有所发展或是发生改变。
    关于URL正则匹配的问题是个普遍问题。可以找到大量的例子,我从我自己的网站出发来分享一下关于正则的体会。
    首先是一个例子:
    http://www.rubular.com/r/YlWJbzVANT

    可以看到这个正则主要是利用用户自觉的在URL末尾加空格或者换行来识别的。这个思路似乎和V2EX现在使用的思路相似。

    就像我这里 http://www.v2ex.com/t/99515#reply12 提到的一样,似乎是有一个问题存在的,我暂时不能很好的表述,只提供一个现状供大家参考:

    http://myswap.sinaapp.com/wd/URL%E5%8F%AF%E8%AF%BB%E5%86%99%E6%80%A7
    http://myswap.sinaapp.com/wd/URL可读写性

    URL的可读写性应该是非英语国家的人的共同问题吧。
    不知我现在的做法是不是提供了一种解决途径呢?
    4 条回复    1970-01-01 08:00:00 +08:00
    binux
        1
    binux  
       2014-02-15 02:31:54 +08:00
    URL又不是没有标准,标准又是正则文法的,为什么要再创造?

    http://myswap.sinaapp.com/wd/URL可读写性
    在不同的编码的页面中是不同的URL,href可不要用这个
    binux
        2
    binux  
       2014-02-15 02:38:05 +08:00
    记错,直接点击时path部分以utf8编码,query部分视浏览器不同
    http://www.w3help.org/zh-cn/causes/HD9001
    Weakdancer
        3
    Weakdancer  
    OP
       2014-02-15 03:06:28 +08:00
    @binux 谢谢提供资料。
    我的需求是在书写文章的时候可以避免遇到不能读写的字符。

    确实存在很多问题的。
    Weakdancer
        4
    Weakdancer  
    OP
       2014-02-15 03:10:04 +08:00
    @binux
    比如你写文章的时候是不是做了一些手动工作来让:
    http://zh.wikipedia.org/zh-cn/HTTP%E7%8A%B6%E6%80%81%E7%A0%81
    变成可读的呢?
    我是想节省掉这部分工作。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2633 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 30ms UTC 12:48 PVG 20:48 LAX 05:48 JFK 08:48
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86