如何将一个 txt 文件中的多个字段导入 mysql! - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
zmq175
V2EX    PHP

如何将一个 txt 文件中的多个字段导入 mysql!

  •  
  •   zmq175 2015-01-31 04:34:01 +08:00 5382 次点击
    这是一个创建于 3919 天前的主题,其中的信息可能已经有所发展或是发生改变。

    之前试了好几次都不成功。
    txt的一部分如下:
    a[ei, ]art.一个
    an[n, n]art.一个
    ability['biliti]n.能力,才干
    able['eibl]a.有才能的,能够的
    about['baut]prep.关于
    above['bv]prep.在…之上
    accident['ksidnt]n.意外;偶然事故
    according to[k:di tu:]依
    achieve['ti:v]vt.完成
    across['krs]ad.交叉;横过
    act[kt]n.行为;举动
    action['kn]n.行动;动作
    active['ktiv]a.活动的;活跃的
    actual['ktul]a.实际的;真实的
    adapt['dpt]vt.使适应;使适合
    add[d]v.增加
    addition['din]n.加;加起来
    address['dres]n.地址;住址
    admire[d'mai]vt.钦佩;赞美;赞赏
    admit[d'mit]vt.承认,供认
    advance[d'v:ns]n.前进;增进

    16 条回复    2015-01-31 19:21:21 +08:00
    zmq175
        1
    zmq175  
    OP
       2015-01-31 04:35:03 +08:00
    存入一个数据库表。。。
    里面有自增的id。
    英文,音标,解释个为一列。。。
    大一学生。。。表示搞不定!求助!
    haiyang416
        2
    haiyang416  
       2015-01-31 05:11:13 +08:00 via Android
    不要弄那么复杂,写个正则式匹配下就行。
    如果有能力,写状态机弄个词法分析也可以,
    你是在哪里出了问题?
    yfdyh000
        3
    yfdyh000  
       2015-01-31 05:16:00 +08:00   1
    [和]替换成,不就是CSV格式了吗(排除特殊情况),然后不难吧。
    vibbow
        4
    vibbow  
       2015-01-31 05:16:19 +08:00
    用navicat直接导入就行了。
    haiyang416
        5
    haiyang416  
       2015-01-31 05:18:43 +08:00 via Android
    推荐先用正则把整个文件按行分割成你需要的几个部分,最好另存到新文件,人工检查一下分割是否正确。
    然后读取分割后的文件写入数据库,文件大的话按行读,不要一次性塞内存。
    haiyang416
        6
    haiyang416  
       2015-01-31 05:31:43 +08:00 via Android
    如果对释义没什么格式要求就用这楼的方法 @yfdyh000
    DonaidTrump
        7
    DonaidTrump      2015-01-31 08:29:24 +08:00 via iPhone
    随便用一种语言读取txt,然后处理插入数据库
    tempdban
        8
    tempdban  
       2015-01-31 09:57:22 +08:00 via Android
    excel分列导出csv
    for8ever
        9
    for8ever  
       2015-01-31 09:58:10 +08:00
    <div>fff</div>
    zmq175
        10
    zmq175  
    OP
       2015-01-31 10:35:23 +08:00 via iPhone
    @haiyang416 就是导入的时候乱掉了
    xiaowu365
        11
    xiaowu365  
       2015-01-31 11:40:51 +08:00
    编码 注意下,CSV 导入应该没问题
    KnightChu
        12
    KnightChu  
       2015-01-31 11:47:44 +08:00
    @zmq175 用 Python 或者 Ruby 什么的处理一下,然后文件输出吧
    chunyang
        13
    chunyang  
       2015-01-31 13:30:14 +08:00
    把 txt 转化成用 tab 隔开的 csv,之所以用 tab,是因为数据中含有空格和逗号。

    可以用 GNU Awk 完成这一任务,即根据方括号(之前、之中、之后)把数据分成 3 组:单词短语、音标、解释:

    <script src="https://gist.github.com/xuchunyang/b293bd5f6c4465b9dd3c.js"></script>

    csv 导入 mysql 应该比较简单,我没用过 mysql,具体不了解。
    zmq175
        14
    zmq175  
    OP
       2015-01-31 14:53:55 +08:00
    最后打算用navicat了!!!谢谢大家
    zmq175
        15
    zmq175  
    OP
       2015-01-31 19:17:55 +08:00
    @chunyang 音标有少数出现了乱码的情况。。。编码是utf-8无误。。。
    chunyang
        16
    chunyang  
       2015-01-31 19:21:21 +08:00
    @zmq175 具体原因不清楚,可能音标中的字符成分比较复杂。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2548 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 34ms UTC 13:17 PVG 21:17 LAX 06:17 JFK 09:17
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86