有没有一个类似 mysql 但支持百亿数据快速检索的数据库呢 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
dtgxx
V2EX    数据库

有没有一个类似 mysql 但支持百亿数据快速检索的数据库呢

  •  
  •   dtgxx 2022-01-01 14:55:20 +08:00 2517 次点击
    这是一个创建于 1448 天前的主题,其中的信息可能已经有所发展或是发生改变。

    更新很少,查询很多,大约百亿数据,十个列以内。期望可以通过任意的列去匹配数据。

    select * from table where anycolumn = 'xxxx'

    希望能支持 sql ,我使用 mongodb ,但是性能不够,使用了 clickhouse ,但只有 order by 的第一个字段性能比较高。

    11 条回复    2022-01-02 16:13:28 +08:00
    Livid
        1
    Livid  
    MOD
    PRO
       2022-01-01 15:26:21 +08:00   1
    能到这种量级的,多半也是 time series 类型的数据了。

    试试这个:

    https://www.timescale.com/
    mingl0280
        2
    mingl0280  
       2022-01-01 16:23:32 +08:00 via Android   1
    MSSQL 和 Oracle 肯定支持。
    SbloodyS
        3
    SbloodyS  
       2022-01-01 16:29:54 +08:00   1
    apache doris
    dtgxx
        4
    dtgxx  
    OP
       2022-01-01 16:36:32 +08:00
    @Livid @mingl0280 @SbloodyS 谢谢各位大佬,我去研究下。
    qaweqa
        5
    qaweqa  
       2022-01-01 16:43:37 +08:00   1
    clickhouse 和 doris 吧
    GM
        6
    GM  
       2022-01-01 16:58:22 +08:00   1
    试试 mariadb columnstore
    sadfQED2
        7
    sadfQED2  
       2022-01-01 16:59:20 +08:00 via Android   1
    ClickHouse 专为你这种场景准备的
    HunterPan
        8
    HunterPan  
       2022-01-02 00:56:19 +08:00 via iPhone   1
    任意列作索引,dorios 不行吧。
    dtgxx
        9
    dtgxx  
    OP
       2022-01-02 14:30:15 +08:00
    @qaweqa @sadfQED2 请教两位老哥帮帮忙,我用了 clickhouse ,建表语句通过 order by (column1,column2, ...),但是只有 where column1=xxx 性能高,where 其他字段的时候,就没性能了,也尝试通过 index 建立二级索引,也没效果。 是不是我的用法有问题,我应该怎么建索引呢,还是有其他的操作?
    Brentwans
        10
    Brentwans  
       2022-01-02 15:45:37 +08:00   1
    你这个是 anyColumn ,可以针对任意列进行过滤计算。索引几乎没用武之地的,,如果再有列的组合,类似 adhoc 的话,那就更没什么用了。因为索引只能预先定义好,并且要计算命中到才是有效的,没法满足任意列的。

    我不太清楚你们过滤后结果数据数量级是多少哈,感觉过滤下推可能更适合的,但是这对存储本身有一些要求。

    不过最推荐的还是看问题本身。如果从业务逻辑上可以进行优化,或者进行 etl 。例如将有效数据,优化成亿级别,那 clickhouse 速度硬算都很快的。

    如果上述都不可行,那加机器,什么都不需要就硬算。稍微注意避免数据倾斜,那过滤操作是可以水平扩展的。
    wanganjun
        11
    wanganjun  
       2022-01-02 16:13:28 +08:00   1
    建议关注 https://github.com/digoal/blog

    数据库是 PostgreSQL

    在文档里面涉及的主题比较全面,主题比较全面,在性能这一块,有索引、并发、任意字段查询。

    在大方向上强烈推荐你用多核 CPU ,利用 PostgreSQL 的并发能力,在参考 https://pgtune.leopard.in.ua 调整下数据库的设置
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     882 人在线       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 25ms UTC 19:51 PVG 03:51 LAX 11:51 JFK 14:51
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86