对于布局,我们有著名的“ Lorem ipsum”文本来测试其外观。
我要寻找的是一组包含Text的文件,这些Text编码有几种不同的编码,我可以在JUnit测试中使用它们来测试读取文本文件时处理字符编码的某些方法。
例:具有ISO 8859-1
编码的测试文件和Windows-1252
编码的测试文件。Windows-1252必须触发区域80 16 – 9F 16中的差异。换句话说,它必须至少包含此区域的一个字符,才能与ISO 8859-1区别开来。
也许最好的测试文件集是每种编码的测试文件一次包含所有字符。但是也许我不了解某件事-我们都喜欢这种编码的东西,对不对?:-)
是否有这样一组用于字符编码问题的测试文件?