我记得搜索引擎是有所谓的分词规则的,能不能在取昵称的时候利用到分词规则,如取名为“我和动物”,这样搜索引擎就会把这个昵称分为“我”、“和”、“动物”,并主动把“和”这个单词丢掉。
请问这样是否可行?还有没有其他办法可以防止搜索引擎收录自己的各平台信息?
]]>site: v2ex.com mysql
关键词排除 keyword -keyword
and 且
MySQL db design and index -csdn
or 或
MySQL db design or index -csdn
文件类型
数据库设计 filetype: pdf
数据库设计 ext:pdf
日期
leetcode site: github.com after: 2021
before: 2021
2021..2023
url 搜索
algorithm and data structure inurl:blog
inurl: gitbook
text 搜索
intext: mysql performance
我想请教的是你们要学一个东西或者找到你想要的且质量高的文章或者博客是用的什么关键字
你们是用的什么关键字或者技巧找到高质量的文章或者有趣的东西
谢谢大家。
推荐我觉得高质量的文章
]]>源自 sphinx 支持 Realtime 索引、indexer from mysql 。兼容 es 的 json 搜索,兼容 mysql 协议和基本 sql 语法子查询等。
性能目前在用很好。中文友好。资源占用很小。中小项目觉得挺适合的。
]]>如果是自己玩,应该是 Milvus 好一些, 但是他们数据处理流程是怎么样的呢?
假设有 1000 篇文章在 mysql 中,存在显示不显示状态。
如果导入 es 中,就可以实现分词搜索,但是这时候搜索比较笨。
看 Milvus 可以实现 类似拆字意图搜素, 我是用 Milvus 然后拆词,然后呢。。
用了 Milvus 是不是就不用用 es 了,还是和 es 搭配使用,具体方面呢。
我只会 es 分词搜索,es 日志使用, 对搜索方面又些兴趣, 但是越了解越乱。请大佬指点.
]]>是我搜索的姿势不对,还是别人的 seo 做的好,或者说是搜索引擎做的不够好?
PS:大家平时使用搜索引擎时,有哪些 tips 可以分享的?谢谢大家!
但是如果搜一些不存在但是又敏感的关键字,就会出现广告内容,比如搜索 site:chuangye.sjtu.edu.cn 污, 出现这种内容:
求解是什么原因呢,如何防止呢?感谢!
]]>Google search 里 SEO 或者 Ads 太多了
大家干脆 search Reddit, 或者 Google xxx Reddit
大家之前讨论的 SEO 影响 搜索结果... 其实国外也一样啊
看来 Reddit 成最大赢家, Baidu 贴吧 确实是好牌打烂了
用谷歌搜索了一下却搜到了 https://imgchr.com/i/yJxR0g
谷歌爬虫的收录速度这么快的嘛,一天前的帖子就收录了 https://imgchr.com/i/yJzCjK
]]>dogedoge:
baidu:
注:没有利益相关
]]>因为有几十万个词,不奢求全自动化处理完全部的词。
希望有一个策略告知如何分类出来。
目前我已经处理的是:
导航词这个比较容易处理,就是别人品牌词,自己品牌词,之类的。好处理,但是没有策略自动化处理
事务搜索词,目前我用了价格词处理了一波
信息搜索词,还没有想到招怎么处理。
弱弱的问问各个大大如何处理
]]>一张用户标签表(用户 ID, 标签 ID)
一张用户表(用户 ID, 手机号, 微信 openid, 邮件...)
都是 MySQL 表,并且结构固定,数据的维护是别的系统同步(每天会同步一次,用户也可手动同步)
大概 500W 以下的人,几百上千的标签.
要实现:使用标签组成组(标签与标签交集或并集),再使用组组成包(组与组加法或减法),前端界面在组成组或包的过程中,后端实时提供组或包的人群数量.并且人群包创建好之后会发送各种消息(短信,微信等).
我的问题:
欢迎拍砖交流,爬虫和后端接口开发使用的是 nodejs,前端使用的是 angular 8,有感兴趣的同学吗?
]]>