由 协议 + 域名 + path 组合,最后 path 的部分才是关键,看起来是一个由 6 个字符组成的字符串,并且字符的范围是大小写字母+数字。
怎么获得 path
通过哈希算法
通过哈希算法 可以获得一个随机性较强的随机字符串
通过自增 ID
- 做一个 ID 自增器,多台服务器就自增 比如 10,但是这种有迹可循,爬虫可以顺序依次请求得到
- 基于雪花算法,
进一步缩短
如果我们得到『1536389934』这个序号的话,可以通过 62 进制进一步缩短成类似 1FYxco 这种
为什么用 62 进制而不是 64 进制
62 进制转换是因为 62 进制转换后只含数字+小写+大写字母。而 64 进制转换会含有/,+这样的符号(不符合正常 URL 的字符)