我写了一篇有关搜索引擎原理与架构的文章 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
gujianbo
V2EX    程序员

我写了一篇有关搜索引擎原理与架构的文章

  •  
  •   gujianbo
    gujianbo 2015-11-05 23:22:32 +08:00 4470 次点击
    这是一个创建于 3627 天前的主题,其中的信息可能已经有所发展或是发生改变。

    如下:
    http://gujianbo.1kapp.com/search-engine-intro/

    博客没有谁来看,没有什么流量,原本写博客的目的就是跟大家交流讨论,让大家给我提意见,让大家都有所进步。我当然是坚持原创的东西

    17 条回复    2015-11-06 18:02:50 +08:00
    jeffjade
        1
    jeffjade  
       2015-11-06 00:47:52 +08:00
    不错,赞一个。

    请教一个关于针对百度搜索的问题可以? 用百度搜索总会有这样的尴尬: 比如你想搜索:“李易封”三个字。然而它的“智能化”算法,给你的结果都是“李易峰”。可是如想要就是'李易封',怎么办?

    之前有看到文章说可以用半角英文引号将需要搜索的内容包裹起来搜索;可是刚才也试了试,并不能 很好的工作。额~ 百度如此搞起‘贴心’,真的好么?
    HentaiMew
        2
    HentaiMew  
       2015-11-06 03:02:24 +08:00   1
    临时收藏了,有时间看看。
    @jeffjade 其实谷歌也会这样。不过百度更蠢一些,以前经常是点击了 仍然搜索“ XX ” 以后继续给你搜索“纠正”后的结果 ... 再点击仍然搜索“ XX ”之后依旧如此往返... 不同时间段在手机百度上都出现过这种情况。虽然现在基本没了。。。
    Andy1999
        3
    Andy1999  
       2015-11-06 03:11:05 +08:00 via iPhone
    百度:有钱就是爷

    索引我博客一堆 但是文不对题 有个毛线用
    simon7
        4
    simon7  
       2015-11-06 07:48:39 +08:00 via iPhone
    I SsVpnsogf
    ryd994
        5
    ryd994  
       2015-11-06 08:22:42 +08:00
    亲爱的用户,我是你爹
    realpg
        6
    realpg  
    PRO
       2015-11-06 08:28:37 +08:00
    @jeffjade
    只要是你搜的那个词确实有结果,会提示
    已显示 XXX 的结果 仍然搜搜 YYY
    MeOO
        7
    MeOO  
       2015-11-06 08:48:23 +08:00
    楼主厉害!大赞!!
    aksoft
        8
    aksoft  
       2015-11-06 08:52:58 +08:00
    你是百度的?
    LittleLeopard
        9
    LittleLeopard  
       2015-11-06 09:11:30 +08:00
    没法评论,总是提示 微博登陆后 再评论。。
    jeffjade
        10
    jeffjade  
       2015-11-06 09:49:45 +08:00
    @aksoft 楼主是 Tencent 的(博客中 about 中有提到)。
    hitmanx
        11
    hitmanx  
       2015-11-06 09:59:38 +08:00
    写得通俗易懂,赞!
    hitmanx
        12
    hitmanx  
       2015-11-06 10:01:35 +08:00
    “谢霆锋的是谁的儿子?”这句话看得别扭死了。。
    pein
        13
    pein  
       2015-11-06 10:15:51 +08:00
    写得不错,值得学习,如果能再深化一点就好了。
    tankcong
        14
    tankcong  
       2015-11-06 11:34:42 +08:00
    看到李娜那个例子提到个性化,如果搜索引擎在搜索结果页提供主动地打分或者 LIKE/PREFER 这样的选项会不会更好的建立用户数据。因为如果只考虑搜索历史记录的话感觉不能完整的体现用户习惯。比如同主题的两篇文章,一个仔细研究了 1 小时,另一个打开扫了一眼就关了,两者明显不同。
    xiaoFen
        15
    xiaoFen  
       2015-11-06 11:39:18 +08:00
    谢谢分享,正想做相关毕设:)
    wavingclear
        16
    wavingclear  
       2015-11-06 11:40:43 +08:00
    @jeffjade 搜 李易封 -李易峰
    有一次点仍然搜索发现他们就是这么干的
    menc
        17
    menc  
       2015-11-06 18:02:50 +08:00
    @tankcong 会的,而且已经应用在工业界。

    现在学术界的前沿是考虑用户无意识的鼠标动作来判断他感兴趣的 classification ,就是你搜索“李娜”之后,你鼠标看似无意识的乱动和在每个结果处光标的动作被拿来用于分析你的搜索倾向,你体会一下。

    点击行为和浏览行为已经被研究的透透的了
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     3554 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 26ms UTC 04:34 PVG 12:34 LAX 21:34 JFK 00:34
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86