![]() | 1 raaaaaar 2022-04-11 20:22:40 +08:00 ![]() redis hash ,文件名 -> md5 ? |
2 fishCatcher 2022-04-11 20:31:25 +08:00 via iPhone ![]() 量很大的话可以考虑一下 Merkle tree |
![]() | 3 documentzhangx66 2022-04-11 20:44:06 +08:00 ![]() 想躺就直接 md5 然后存 mysql 。 不想躺: 1.文件尺寸。 2.文件固定位置抓 4 个点。 3.文件固定位置抓 8 个点。 4.xxHash 。 这 4 个步骤相当于剪枝,性能完爆 md5 。 |
![]() | 4 quxinna 2022-04-11 20:47:01 +08:00 beyond compare |
5 mengzhuo 2022-04-11 20:54:06 +08:00 |
6 polarbear007 2022-04-11 21:28:10 +08:00 ![]() 这种情况,记录 md5 可能不太合适吧。 因为要计算 md5 的话,你需要先把文件下载下来才行(除非网站有提供每个文件的 md5 值)。 看看有没有办法在下载文件之前,先对页面上的其他信息进行分析,确认文件是否下载过。比如文件名,所在页面 id 之类的。 |
7 tidos 2022-04-11 21:39:54 +08:00 ![]() Merkle tree. DynamoDB 用的就是这个 |