文字三方审核,阿里,腾讯都是按次数收费,阿里一次最多 600 字,腾讯一次最多 1000 字.
在短文字场景中,大家有合并审核的习惯吗. 一次审核个 10 个字符,有点浪费.
1 coderxy 2023-10-26 17:04:16 +08:00 文本审核很便宜,做合并的意义不是很大 |
![]() | 2 hongfs 2023-10-26 17:14:42 +08:00 不如做一下缓存,频繁的内容也就那些。 |
![]() | 3 dnjat OP @coderxy 是的,主要是成本,不然单条好处理多了 ,合并后还得拆结果,对不同来源的内容做后续动作,动作还不统一。就看成本与麻烦度的比例怎么样 |
![]() | 4 dnjat OP @hongfs 这个不好缓存吧,改个标点什么的就不一样了。缓存命中关键字也不行,担心本地缓存的关键字不够。 |
6 luodichen 2023-10-26 21:02:39 +08:00 核酸算法吧(狗头 |
![]() | 7 rekulas 2023-10-26 21:18:07 +08:00 布隆过滤思想,其实没必要全部付费审核,先用开源模型审核一遍,只有判断有风险或可信度太低的才丢给付费接口,至少可以节约 80% |
![]() | 8 dnjat OP @hongfs 有做文件 hash 匹配,但文字的机率应该不合适吧.同样一句话,重新打一遍都有可能会有区别,所以当时就放弃这个缓存方案了. 老兄你的方案是什么样子的. |
![]() | 10 dnjat OP @rekulas 机器学习前期投入太大了,不熟悉的话,学习,调优也是个成本. 不怕他误审,怕他识别不出风险,如果不是很相信自己的学习模型,无风险的,你还是得交三方审核再审一次. |
11 ccagml 2023-10-27 08:32:11 +08:00 via Android 这也能缓存?这个名字今天可以,明天不行,也没人来通知你这个名字不行了,怎么删掉缓存? |
12 ccagml 2023-10-27 08:37:43 +08:00 via Android 有合并审核,如果不通过,就二分看哪些不通过 |
![]() | 13 Leeeeex PRO 看一下数美的? https://www.ishumei.com/ |
14 whoami9426 2023-10-27 15:51:55 +08:00 交个 gpt 审核,function call 规定好返回的内容,敏感度,敏感词之类的 |