用了 xml.dom.minidom,加载个 100M 的 XM 的文件用了 60s,好慢
![]() | 1 no1xsyzy 2021-05-12 15:28:10 +08:00 ![]() |
![]() | 2 wellsc 2021-05-12 15:29:01 +08:00 换语言 |
![]() | 3 imn1 2021-05-12 15:46:54 +08:00 ![]() 100M 的应该什么语言都用流式解析吧,整体加载 DOM 太大了,非常耗资源 找 xml parser 相关的库,例如 sax |
![]() | 4 abersheeran 2021-05-12 22:20:49 +08:00 via Android @no1xsyzy 提到这玩意儿。我想起来以前写一个页面解析的时候,用 docker 跑的,阿里云 Serverless 上 lxml 怎么都解析不出来,我本机次次跑都没问题,最后还是换了 html.parser 。 |
![]() | 5 ALLROBOT 2021-05-13 08:29:47 +08:00 用 C/C++最快 python 执行速度比它们慢多了 |
6 wohenfuyou OP 改用 c++ tinyxml2 了 就 2s 钟,差距也太大了 |