
1 buxianyu OP 网页主要是<table>构建,一个接一个的<table>,而且没有ID,部分<td>有Class。 我想删除网页的Banner图片和评论区(这个也是在<talbe>中)。 只想保留文章的正文部分(在<table>中,有class)。 因为没有ID,很难操作。 理论上,只保留有class的正文部分,删除其他部分,是一个方法。但如何实现? |
2 buxianyu OP 好像只有一个一个table地处理了。 |
3 yyfearth 2012-01-14 17:43:13 +08:00 我用过2个笨方法: 1、根据位置,比如table[2]->tr[3]->td[1] 2、正则表达式,比如/<td>用户名</td>\s*<td>(\w*)</td>/ |
4 MartianZ 2012-01-14 18:02:49 +08:00 楼主想优化铁路订票网站么? |
5 caomu 2012-01-14 18:08:21 +08:00 via Android to ls 只要是政府做的网站基本都是table的。。。 |
7 ytzong 2012-01-14 22:39:54 +08:00 插入jquery.js后再用jq提供的选择器操作 |
8 ytzong 2012-01-14 22:40:50 +08:00 也可以用css来搞,找到元素后隐藏 |