才意识到 sql 执行也会很浪费时间,以前做什么缓存、中间件节省的时间,还不如改一个 sql 语句效率明显 。
哪里找一些大量模拟数据来练习 SQL ,亿? 十亿? 数据少了跑 sql 语句效果不够明显。
或者有什么数据库用法可以观察到 sql 的执行效率

才意识到 sql 执行也会很浪费时间,以前做什么缓存、中间件节省的时间,还不如改一个 sql 语句效率明显 。
哪里找一些大量模拟数据来练习 SQL ,亿? 十亿? 数据少了跑 sql 语句效果不够明显。
或者有什么数据库用法可以观察到 sql 的执行效率
1 Itoktsnhc Dec 24, 2021 执行计划 |
2 zhensjoke Dec 24, 2021 社工库 |
3 LING97 Dec 24, 2021 啥数据库呢? Sql 效率无非就是索引吧,分析下走没走索引就行了,数据量少一样能学。如果数据量上十亿,还有查询需求的话,我们一般上搜索引擎,或者分表,或者离线表定时查。不头铁就行 |
4 milk97 Dec 24, 2021 via iPhone https://dev.mysql.com/doc/employee/en/employees-introduction.html 400 万数据,用来分析 SQL 执行效率配合 explain 应该是够了的 |
6 gavindexu Dec 25, 2021 via iPhone 官网上装的 好像已经带了一些数据。sakila |
7 noparking188 Dec 25, 2021 插一句,合理的 Schema 设计也很重要,优化半天 SQL 不如对表稍作修改 |
8 huaouo Dec 25, 2021 |
9 billly Dec 26, 2021 之前看 clickhouse 的时候,官网上有个几十 G 的数据集 |
10 hooopo Dec 26, 2021 想搞一个 |
11 fly0512 Dec 26, 2021 tpc 了解一下,可以自己按需生成模拟数据。 http://tpc.org/ |
12 silencefly Dec 26, 2021 @billly 搜了下 这个文件有 75G github-events https://clickhouse.com/docs/en/getting-started/example-datasets/github-events/ |
13 Joker123456789 Dec 27, 2021 数据自己插啊,循环 + insert 你总会写的吧? 执行效率 可以看执行计划 |
14 MoYi123 Dec 27, 2021 凭空想象一个场景,设计表结构,造数据, 然后去优化它 https://github.com/mmooyyii/mmooyyii/blob/master/docs/database/tiplist1.md |
15 VVValent Dec 28, 2021 我也想知道 |
16 likeunix Mar 12, 2022 推荐一个测试数据集的工具,一键生成各种数据类型,支持导出到 JSON 、SQL 、XML 等文件。官网地址: http://www.redisant.cn/da |