Questions tagged «storage»

存储-指在其中询问数据持久性和存储问题及技术的问题。


14
为什么大多数日志文件使用纯文本而不是二进制格式?
日志记录是必需的,但(相对)很少使用。这样,就存储而言可以使其更加紧凑。 例如,最常记录的数据(例如ip,日期,时间)以及其他可以表示为整数的数据将存储为文本。 如果将日志记录存储为二进制数据,则可以保留很多空间,从而需要较少的旋转并增加磁盘寿命,尤其是对于写受到限制的SSD。 有人可能说这是一个很小的问题,实际上并不重要,但是考虑到建立这种机制所需的努力,这是没有道理的。任何人都可以在业余时间里做两天左右的工作,为什么人们不这样做呢?
81 logging  storage 

2
PHP:什么时候使用数组,什么时候将对象用于大多数数据存储的代码构造?
PHP是一种混合范式语言,允许使用和返回非对象数据类型,例如数组。我提出一个问题,试图在确定在特定情况下使用哪种编程构造时,阐明一些选择数组还是对象的准则。 这实际上是一个有关使用PHP语言构造对数据进行编码的方法以及何时更可能为了数据传递目的而选择另一种方法(即面向服务的体系结构或Web服务)的问题。 例 假设您的商品类型由{cost,name,part_number,item_count}组成。您的程序要求显示几种此类项目,并决定使用数组作为外部容器来保存每种项目类型。[您也可以使用PHP的ArrayObjectOO范例,但是我的问题不是关于那个(外部)数组的]。我的问题是关于如何对项目类型数据进行编码,以及使用哪种范式。PHP允许您使用PHP Native Arrays或PHP Objects。 我可以通过两种方式对此类数据进行编码,如下所示: //PHP's associative arrays: $ret = array( 0 => array( 'cost' => 10.00, 'name' => 'item1', 'part_number' => 'zyz-100', 'item_count' => 15 ), 1 => array( 'cost' => 34.00, 'name' => 'item2', 'part_number' => 'abc-230', 'item_count' => 42 ), ); 与 //here ItemType …


3
与以二进制存储等效消息相比,存储纯文本数据是否占用更少的空间?
作为一名Web开发人员,我对二进制数据了解甚少。 如果我使用句子“ Hello world。”,将其转换为二进制文件,然后将其作为二进制文件存储在SQL数据库中,似乎 1和0会比字母占用更多的空间。在我看来,使用字母有点像使用压缩,其中一个符号代表多个。 但这真的是这样吗? 与以二进制存储等效消息相比,存储纯文本数据是否占用更少的空间?

4
是否可以存储千字节块和指针的所有可能排列?
这是一个很难缠住我的主意的想法,我将不胜感激任何编辑/帮助,以使其对于那些熟悉的人来说更具可读性。 从理论上讲,是否有可能在硬盘上保存一个千字节的每个可能二进制排列的一个副本,然后让系统的其余部分简单地创建指向这些位置的指针? 这样制作的系统会比简单地直接存储信息快吗? 要解释另一种方式,请说而不是句子: “你好,我是鲍勃。” 和“那个三明治看起来很好吃。” ...存储在硬盘驱动器上,我们会将字母和其他字符的所有排列替换为某个数字(例如1000个字符左右),然后将句子存储为: [Pointer#21381723]

5
什么时候应该比从文本文件解析数据优先使用数据库?
我正在制作一个Python程序来测量codereview.SE的增长。我的方法是获取首页上显示的“网站统计信息”,并将其存储在我的硬盘上。我计划每天执行一次。到目前为止,我已经做了足够的工作来获取统计数据并将它们附加到文本文件中。可以在github上查看python脚本。我使用的格式如下 22-08-2013 questions 9073 answers 15326 answered 88 users 26102 visitors/day 7407 22-08-2013 questions 9073 answers 15326 answered 88 users 26102 visitors/day 7407 我只运行了两次脚本,以获取文件中要使用的格式。最初,这对我来说似乎很好,因为我可以自己存储它,而且格式是相同的,因此很容易解析,但是不确定。似乎在这里使用数据库应该更好,因为那样检索数据应该更容易。请注意,我从未使用过任何数据库,也不了解SQL,MySQL或RDBMS的任何其他变体。 因此,这使我想到了这个问题。什么时候应该首选数据库来存储数据而不是将数据存储在文本文件中?在决定是否需要数据库还是简单的文本文件时,是否可以找到一些指针? PS:如果可以添加更好的标签,请这样做。我对可以添加的标签有些怀疑。

5
如何确定存储格式之间的区别,以及其中的一些示例用例?
我们有不同的方式来存储程序数据(在游戏,员工数据库,程序配置等中保存文件): 纯文本(.ini和.conf) XML格式 数据库(MySQL,SQLite ...) .zip 包含多个文件(格式不同)的类似文件 二进制文件(.doc例如,由序列化工具创建的文件等) 上面列出的格式有哪些不同的用例,它们的优点与缺点(考虑速度,灵活性,文件大小,易用性...)之间有什么分别?如何在不同任务之间做出决定? 关于压缩格式:仅用于包含其他文件。它也可以是另一种压缩格式。这允许几个文件的结构,包括图像文件,声音文件和文本文件。例如,假设您有一种消息的存储格式,其中可能包含文件。压缩文件中可以包含以下文件: message.txt (containing the message) attachments (folder containing attachments) audio.wav picture.jpg

8
假设您拥有无限线性二进制存储,一个很好的模式可以表示从0到无穷大的整数?
我想要一个表示以0开头的整数的模式,没有任何限制(假设访问无限线性存储)。 这是一个可以表示0到255之间的数字的模式: 使用存储器的第一个字节(地址0)存储整数。 现在,假设我要表示大于255的数字。当然,我可以使用多于1个字节来表示整数,但是只要它是一个固定数字,最终就会有一个太大的整数,无法用原始架构。 这是应该能够完成任务的另一个模式,但是可能效率不高。 只需使用某种唯一的“数字结尾”字节,然后使用所有前面的字节来表示数字。显然,此“数字结尾”字节不能在数字表示中的任何位置使用,但这可以通过使用base-255(而不是base-256)编号系统来实现。 但是,这很慢并且可能效率很低。我希望有一个更好的产品,它在低值的情况下表现更好并且可以很好地缩放。 本质上,它是一个UUID系统。我想看看是否有可能创建一个性能快速的UUID系统,该系统理论上可以扩展使用数年,数千年,数百万年,而无需重新设计。
10 storage  numbers  uuid 
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.