4KB中可以存储多少个字符?


Answers:


113

在UTF-8中,字符需要1到4个字节。因此,您可以在4KB中分别存储4096至1024个UTF-8字符。

我认为在许多用例中,您可以期望大多数字符适合一个字节,几乎所有字符适合2个字节。


8
要扩展,ASCII字符仅占用1个字节,其他字符可以占用更多字节。因此,一种估计MForster给出的范围的方法是问自己,字符的哪一部分可能是ASCII。如果这基本上是英文的带有偶尔带有重音符号的文本,则可能适合接近4000个字符。如果您的文字在例如泰卢固语中,则每个字符通常为3个字节,因此您可以容纳大约1300个左右的位置。
Jacob Mattison 2010年

嗯,我使用西里尔文和英文,但是使用base64进行编码然后存储。所以我想base64是纯英文的,这使得每个字节正确的e字符等于4096个字符对吗?
Pockata

3
这是对的。(假设您的问题是,base64编码的字符串中可以容纳多少个字符,而不是原始西里尔字符有多少个)。
MForster 2010年

是的,我在写下这个问题之后在代码中添加了base64
Pockata 2010年

115

这是一个视觉提示,显示10244096的数量。阅读@Jon Snyder的消息以获得更好的理解。

1024个字符(假设字符有4个字节):

Lorem ipsum dolor坐下来,管教着迷。Aenean commodo ligula eget dolor。马尼拉(Aenean Massa)。兼收并存的蒙特产,无花果和无花果。Donec quam felis,neculies nec,pellentesque eu,pretium quis,sem。Nulla等于massa quis enim。Donec pede justo,fringilla vel,aliquet nec,vulputate eget,arcu。在enim justo,rhocus ut,imperdiet a,venenatis vitae,justo中​​。Nullam dictum felis eu pede mollis pretium。整数Tincidunt。Cras dapibus。Vivamus elementum semper nisi。埃内斯(Aenean)富足的eleifendtellus。Aenean leo ligula,porttitor eu,consequat vitae,eleifend ac,enim。Aliquam lorem ante,dapibus,viverra quis,feugiat a,tellus。菜豆(Phasellus viverra nulla ut metus varius laoreet)。Quisque rutrum。艾妮(Aenean)卑鄙。Etiam ultricies nisi vel augue。Curabitur ullamcorper菌类。Nam eget dui。阿提姆龙鼻。雌性颞叶色菊,特鲁斯色拉调味品,西姆夸姆·森伯·利伯罗,安乐死 南夸姆(Bnamit ve)

4096个字符(假设字符有1个字节):

Lorem ipsum dolor坐下来,管教精通精英。Aenean commodo ligula eget dolor。艾妮·马萨(Aenean Massa)。兼收并存的蒙特产,无花果和无花果。Donec quam felis,neculies nec,pellentesque eu,pretium quis,sem。Nulla等于massa quis enim。Donec pede justo,fringilla vel,aliquet nec,vulputate eget,arcu。在enim justo,rhoncus ut,imperdiet a,venenatis vitae,justo中​​。Nullam dictum felis eu pede mollis pretium。整数Tincidunt。Cras dapibus。Vivamus elementum semper nisi。埃内斯(Aenean)富足的eleifendtellus。Aenean leo ligula,porttitor eu,consequat vitae,eleifend ac,enim。Aliquam lorem ante,dapibus,viverra quis,feugiat a,tellus。菜豆(Phasellus viverra nulla ut metus varius laoreet)。Quisque rutrum。艾妮(Aenean)卑鄙。Etiam ultricies nisi vel augue。Curabitur ullamcorper菌类。Nam eget dui。阿提姆龙鼻。雌性颞叶色菊,特鲁斯色拉调味品菱形,西姆·森姆·利伯罗,安乐死地贴着西姆·西普·伊普森。Nam quam nunc,Blandit vel,luctus pulvinar,hendrerit id,lorem。Maecenas nec odio et ante tincidunt tempus。Donec vitae sapien ut libero venenatis faucibus。Nullam quis ante。Etiam坐在amet orci eget eros faucibus tincidunt。Duis leo。塞德·贝宁·毛里斯(Sed fringilla mauris)Donec sodales矢状象。塞德(Sed consequat),利奥·爱比(Leo eget bibendum sodales),augue velit cursus nunc,quis gravida magna mi libero。Fusce vulputate eleifend sapien。Vestibulum purus quam,scelerisque ut,mollis sed,nonummy id,metus。NullamAccumsan lorem在dui。Cras ultricies mi eu turpis hendrerit fringilla。紫茎泽兰和乌贼菌中的初生的Vestibulum ante ipsum primis;在ac dui quis mi consectetuer拉西尼亚。Nam pretium turpis et arcu。Duis arcu tortor,suscipit eget,nemdidiet nec,imperdiet iaculis,ipsum。Sed aliquam ultrices毛里斯。Integer ante arcu,accumsan a,consectetuer eget,posuere ut,mauris。强大的辅助功能。菜豆umsumcorper ipsum rutrum nunc。Nunc虚假的元数据。Vestibulum volutpat pretium libero。Cras id dui。埃涅埃特·埃罗斯·埃罗斯(Aenean ut eros et nisl sagittisvestibulum)。Nullam nulla eros,小农坐在amet,不受欢迎的身分,无礼的feugiat,脚踏。塞德·怀特斯。Donec mollis hendrerit病。小菜豆中的菜豆新芽。Etiam imperdiet impordiet orci。Nunc nec neque。菜豆leo dolor,非tempus,auctor等,hendrerit quis,nisi。Curabitur ligula sapien,tincidunt non,euismod vitae,posuere imperdiet,leo。Maecenas malesuada。Massa的Praesent Congue擦除。Sed诅咒turpis vitar Tortor。Donec posuere vulputate arcu。ll菜豆。紫茎泽兰(Faucibus orci luctus et ultrices cuuelia cubilia Curae)中的初生破骨细胞;Sed aliquam,nisi quis porttitor congue,elit eart euismod orci,ac placerat dolor lectus quis orci。菜豆属前庭前缘。艾尼安·特鲁斯(Aenean Tellus),双性恋sed,波斯人ac,非螳螂,nunc。Vestibulum fringilla pede坐在amet augue。在turpis。Pellentesque posuere。Praesent Turpis。Aenean posuere,tor sed cursus feugiat,nunc augue blandit nunc,eu sollicitudin urna dolor sagittis lacus。Donec elit libero,ne sodals ne,volutpat a,suscipit non,turpis。Nullam射手座。Suspendisse pulvinar,augue ac venenatis调味品,sem libero volutpat nibh,ne pellentesque velit pede quis nunc。紫茎泽兰和乌贼菌中的初生的Vestibulum ante ipsum primis;Fusce id purus。乌贼属锡伯里特libero。菜豆dolor。Maecenas前庭软体动物直径。Pellentesque ut neque。Pellentesque居民morbi tristique senectus et netus et malesuada成名ac turpis egestas。在大对决中,拥有权,前庭等人,临时拍卖人,正义者。在male中。Pellentesque auctor neque nec urna。Proin sapien ipsum,门,auctor quis,euismod ut,mi。Aenean Vivererra犀牛脚。Pellentesque居民morbi tristique senectus et netus et malesuada成名ac turpis egestas。Ut non enim eleifend felis pretium feugiat。Vivamus quis mi。菜豆和菜豆。在习惯习俗中,平板式的格言。在Lacus ac velit ornare lobortis的Curabitur。库拉 Pellentesque居民morbi tristique senectus et netus et malesuada成名ac turpis egestas。在dui magna中,posuere eget,vestibulum等,临时拍卖人,justo。在male中。Pellentesque auctor neque nec urna。Proin sapien ipsum,门,auctor quis,euismod ut,mi。Aenean Vivererra犀牛脚。Pellentesque居民morbi tristique senectus et netus et malesuada成名ac turpis egestas。Ut non enim eleifend felis pretium feugiat。Vivamus quis mi。菜豆和菜豆。在习惯习俗中,平板式的格言。在Lacus ac velit ornare lobortis的Curabitur。库拉 Pellentesque居民morbi tristique senectus et netus et malesuada成名ac turpis egestas。在dui magna中,posuere eget,vestibulum等,临时拍卖人,justo。在male中。Pellentesque auctor neque nec urna。Proin sapien ipsum,门,auctor quis,euismod ut,mi。Aenean Vivererra犀牛脚。Pellentesque居民morbi tristique senectus et netus et malesuada成名ac turpis egestas。Ut non enim eleifend felis pretium feugiat。Vivamus quis mi。菜豆和菜豆。在习惯习俗中,平板式的格言。在Lacus ac velit ornare lobortis的Curabitur。库拉 Pellentesque居民morbi tristique senectus et netus et malesuada成名ac turpis egestas。Ut non enim eleifend felis pretium feugiat。Vivamus quis mi。菜豆和菜豆。在习惯习俗中,平板式的格言。在Lacus ac velit ornare lobortis的Curabitur。库拉 Pellentesque居民morbi tristique senectus et netus et malesuada成名ac turpis egestas。Ut non enim eleifend felis pretium feugiat。Vivamus quis mi。菜豆和菜豆。在习惯习俗中,平板式的格言。在Lacus ac velit ornare lobortis的Curabitur。库拉


17

UTF-8字符为1-4个字节,因此取决于您要编码的字符。大多数英语单词的每个字符使用1个字节。其他西方语言使用2个字节。亚洲字符可以使用4个字节。

因此,答案是从1024到4096,具体取决于字符。此外,在Windows环境中,文档的开头可能需要3字节的BOM,这将减少可容纳4Kb的字符数量。请参阅有关UTF-8维基百科文章

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.