Java 遍历 list<map> 实现 left join 快,还是 MySQL left join 速度快

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

已注册用户请登录

请不要在回答技术问题时复制粘贴 AI 生成的内容

这是一个创建于 1474 天前的主题，其中的信息可能已经有所发展或是发生改变。

从 mysql 数据库中读出 a,b 表,得到两个 list<bean> listA,listB,对这两个 list 做遍历实现 left join,
还是直接 sql 语句 left join 从 mysql 中查询等到结果集,
在表数据很大的情况下,这里两种方式,哪种快

25 条回复 2021-12-17 18:23:10 +08:00

oxromantic

2021-12-16 18:26:37 +08:00

数据很大的话，显然不适合读到 list 里啊

assiadamo

2021-12-16 18:27:36 +08:00

表很大的情况下忽略网络因素应该是数据库快，如果自己做还要关注数据占用内存过多导致 GC 问题
数据量小的情况下 jooq 有专门的库做这个

HiShan

2021-12-16 18:29:31 +08:00

数据库更快，数据量很大的情况，把数据从磁盘上加载到内存中考虑到磁盘 IO ，网络传输，还不如在数据库就把数据聚合好再传输

RangerWolf

2021-12-16 18:30:53 +08:00

我感觉哪个都不快。。。。有科学计算库才快~
比如 python 的 pandas 实测比 MySQL join 快（只要内存扛得住）
https://www.flyml.net/2019/03/25/pandas 一个 pandas-vs-mysql-sql-的性能对比 /
以前的一个测试文章

很久没有用 JAVA ，提供一个参考思路，希望有帮助

ilylx2008

2021-12-16 18:31:32 +08:00

也得看情况，大部分情况，用 in(id)比 left join 好

RangerWolf

2021-12-16 18:31:34 +08:00

刚才的 url 裂开了，看起来不能 decode
https://www.flyml.net/2019/03/25/pandas%e4%b8%80%e4%b8%aapandas-vs-mysql-sql-%e7%9a%84%e6%80%a7%e8%83%bd%e5%af%b9%e6%af%94/

试试看这个 url

tmtstudio

2021-12-16 18:35:07 +08:00

用 redis 啊

rekulas

2021-12-16 18:36:27 +08:00

严格来说没有正确答案，无论数据量大小多少，取决于你的数据结构，索引、磁盘、网络等情况，都可能出现不一致的结果。
例如：按楼上朋友的看法反例，数据量少可能 java 快，但实际生产中本来很快的查询因为 join 一个不合理的数据集导致速度骤降的现象并不少见(即使结果数据不大)，这种情况把数据分别读出来处理反而更快

但设计合理的情况下，又可能 join 更快

所以没有标准答案