算法
要生成随机字符串,请连接从一组可接受的符号中随机抽取的字符,直到字符串达到所需的长度为止。
实作
这是一些相当简单且非常灵活的代码,用于生成随机标识符。阅读以下信息以获取重要的应用笔记。
public class RandomString {
/**
* Generate a random string.
*/
public String nextString() {
for (int idx = 0; idx < buf.length; ++idx)
buf[idx] = symbols[random.nextInt(symbols.length)];
return new String(buf);
}
public static final String upper = "ABCDEFGHIJKLMNOPQRSTUVWXYZ";
public static final String lower = upper.toLowerCase(Locale.ROOT);
public static final String digits = "0123456789";
public static final String alphanum = upper + lower + digits;
private final Random random;
private final char[] symbols;
private final char[] buf;
public RandomString(int length, Random random, String symbols) {
if (length < 1) throw new IllegalArgumentException();
if (symbols.length() < 2) throw new IllegalArgumentException();
this.random = Objects.requireNonNull(random);
this.symbols = symbols.toCharArray();
this.buf = new char[length];
}
/**
* Create an alphanumeric string generator.
*/
public RandomString(int length, Random random) {
this(length, random, alphanum);
}
/**
* Create an alphanumeric strings from a secure generator.
*/
public RandomString(int length) {
this(length, new SecureRandom());
}
/**
* Create session identifiers.
*/
public RandomString() {
this(21);
}
}
用法示例
为8个字符的标识符创建不安全的生成器:
RandomString gen = new RandomString(8, ThreadLocalRandom.current());
为会话标识符创建一个安全的生成器:
RandomString session = new RandomString();
创建具有易于阅读的代码的生成器以进行打印。字符串比完整的字母数字字符串长,以补偿使用较少的符号:
String easy = RandomString.digits + "ACEFGHJKLMNPQRUVWXYabcdefhijkprstuvwx";
RandomString tickets = new RandomString(23, new SecureRandom(), easy);
用作会话标识符
生成可能唯一的会话标识符还不够好,或者您可以只使用一个简单的计数器。使用可预测的标识符时,攻击者会劫持会话。
长度和安全性之间存在张力。标识符越短越容易猜测,因为可能性较小。但是更长的标识符会消耗更多的存储空间和带宽。较大的一组符号会有所帮助,但如果标识符包含在URL中或手动重新输入,则可能会导致编码问题。
会话标识符的基本随机性或熵源应来自为密码学设计的随机数生成器。但是,初始化这些生成器有时可能会在计算上变得昂贵或缓慢,因此应努力在可能的情况下重新使用它们。
用作对象标识符
并非每个应用程序都需要安全性。随机分配可能是多个实体在共享空间中生成标识符而无需任何协调或分区的有效方法。协调可能会很慢,尤其是在群集或分布式环境中,当实体最终共享的份额太小或太大时,划分空间会引起问题。
如果攻击者能够像大多数Web应用程序中那样查看和操纵它们,则未采取措施使它们无法预测的所产生的标识符应受到其他保护。应该有一个单独的授权系统来保护对象,这些对象的标识符可以在没有访问权限的情况下被攻击者猜中。
考虑到预期的标识符总数,还必须小心使用足够长的标识符,以免发生碰撞。这被称为“生日悖论”。发生碰撞的概率 p大约为n 2 /(2q x),其中n是实际生成的标识符的数量,q是字母中不同符号的数量,x是标识符的长度。这应该是一个很小的数字,例如2 -50或更少。
得出的结论表明,500k个15个字符的标识符之间发生冲突的机会约为2到52,这可能比宇宙射线等未检测到的错误的可能性小。
与UUID的比较
根据其规范,UUID并非不可预测,因此不应用作会话标识符。
标准格式的UUID占用大量空间:36个字符仅代表122位熵。(并非“随机” UUID的所有位都是随机选择的。)随机选择的字母数字字符串仅21个字符就包含了更多的熵。
UUID不灵活;它们具有标准化的结构和布局。这是他们的主要美德,也是他们的主要弱点。与外部方合作时,UUID提供的标准化可能会有所帮助。仅用于内部使用,它们可能效率很低。