由 协议 + 域名 + path 组合,最后 path 的部分才是关键,看起来是一个由 6 个字符组成的字符串,并且字符的范围是大小写字母+数字。

怎么获得 path

通过哈希算法

通过哈希算法 可以获得一个随机性较强的随机字符串

通过自增 ID

  1. 做一个 ID 自增器,多台服务器就自增 比如 10,但是这种有迹可循,爬虫可以顺序依次请求得到
  2. 基于雪花算法

进一步缩短

如果我们得到『1536389934』这个序号的话,可以通过 62 进制进一步缩短成类似 1FYxco 这种

为什么用 62 进制而不是 64 进制

62 进制转换是因为 62 进制转换后只含数字+小写+大写字母。而 64 进制转换会含有/,+这样的符号(不符合正常 URL 的字符)