在使用urllib2抓取数据时, 对方是gbk编码先转编码
str=decode('gb18030').encode('utf8')
MySQLdb.escape_string(str)
其他无任何处理了
最后用utf8存入了mysql
但每几千条会碰到一个字符错误,不是a变成b,就是"号变为#号,由于是xml,就变得根本无法解析
请问问题出在哪里呢?
str=decode('gb18030').encode('utf8')
MySQLdb.escape_string(str)
其他无任何处理了
最后用utf8存入了mysql
但每几千条会碰到一个字符错误,不是a变成b,就是"号变为#号,由于是xml,就变得根本无法解析
请问问题出在哪里呢?
