Questions tagged «indexing»

索引数据结构是提高数据查找速度的通用技术。


4
如何在MySQL中重命名索引
我想重命名索引。我看过alter table文档,但无法弄清楚简单重命名索引的语法。通过MySQL GUI进行操作时,它将删除索引并创建一个新索引。虽然这样做有效,但我想避免只是为了更改索引的名称而重建整个索引。 [附加信息] 在alter table文档中指出 可以通过更改表的.frm文件而不接触表内容来立即进行仅修改表元数据而不修改表数据的更改。以下更改是可以通过这种方式进行的快速更改: * Renaming a column or index. 但是,当我尝试通过编辑.frm文件(在测试数据库上)并重新启动服务器来重命名索引时,它现在在尝试列出列并尝试运行时在UI中指出“无法获取列”查询,它返回错误“未知表引擎”。.frm文件包含很多二进制内容。是否有用于编辑二进制信息的好工具。
80 sql  mysql  indexing 

4
在DataFrame索引上应用功能
在Pandas的索引上应用函数的最佳方法是什么DataFrame?目前,我正在使用这种冗长的方法: pd.DataFrame({"Month": df.reset_index().Date.apply(foo)}) 其中Date的索引foo名称和我正在应用的函数的名称。


2
按位置从data.table中提取列作为向量
如何从data.table的列中提取列作为矢量?以下是我尝试过的一些代码片段: DT<-data.table(x=c(1,2),y=c(3,4),z=c(5,6)) DT # x y z #1: 1 3 5 #2: 2 4 6 我想使用列位置获取此输出 DT$y #[1] 3 4 is.vector(DT$y) #[1] TRUE 使用列位置获取此输出的其他方法 DT[,y] #[1] 3 4 is.vector(DT[,y]) #[1] TRUE 这不给向量 DT[,2,with=FALSE] # y #1: 3 #2: 4 is.vector(DT[,2,with=FALSE]) #[1] FALSE 那两个不起作用: DT$noquote(names(DT)[2]) # Doesn't work #Error: attempt to …

4
删除熊猫中的索引名称
我有一个像这样的数据框: In [10]: df Out[10]: Column 1 foo Apples 1 Oranges 2 Puppies 3 Ducks 4 如何index name foo从该数据框中删除?所需的输出是这样的: In [10]: df Out[10]: Column 1 Apples 1 Oranges 2 Puppies 3 Ducks 4

28
是否存在其他具有非零索引数组位置的常见“ C类”或非“ C类”语言?[关闭]
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实,参考或专业知识的支持,但是这个问题可能会引起辩论,争论,民意调查或扩展讨论。如果您认为此问题可以解决并且可以重新提出,请访问帮助中心以获取指导。 8年前关闭。 C编程语言被称为零索引数组语言。使用可以访问数组中的第一项0。例如double arr[2] = {1.5,2.5},数组中的第一项arr位于位置0。arr[0] === 1.5基于1的索引是什么编程语言? 我听说过这些语言从1而不是0开始进行数组访问:Algol,Matlab,Action!,Pascal,Fortran和Cobol。完成了吗 具体来说,基于1的数组将使用1(而不是0)访问第一项。

6
索引布尔字段
这可能是一个非常愚蠢的问题,但是对数据库表中的布尔字段建立索引是否会有很多好处? 在常见情况下,例如将“软删除”记录标记为非活动状态,因此大多数查询都包括WHERE deleted = 0,这将有助于对该字段进行单独索引,还是应将其与其他常见搜索字段结合使用不同的索引?
76 sql  mysql  database  indexing 

3
MongoDB查询性能超过500万条记录
我们最近已经刷新了我们其中一个主要收藏的200万条记录,现在我们开始因该收藏的主要性能问题而受苦。 它们在集合中的文档大约有8个字段,您可以使用UI对其进行过滤,并且应该按记录处理的时间戳记字段对结果进行排序。 我添加了几个复合索引,其中包含过滤字段和时间戳,例如: db.events.ensureIndex({somefield: 1, timestamp:-1}) 我还添加了几个索引,可以同时使用多个过滤器,以期获得更好的性能。但是某些过滤器仍然需要花费很长时间才能执行。 我已经确保使用using来解释查询确实使用了我创建的索引,但是性能仍然不够好。 我想知道分片是否现在是要走的路..但我们很快将开始在该馆藏中每天增加约100万条新记录..所以我不确定它是否可以很好地扩展。 编辑:查询示例: > db.audit.find({'userAgent.deviceType': 'MOBILE', 'user.userName': {$in: ['nickey@acme.com']}}).sort({timestamp: -1}).limit(25).explain() { "cursor" : "BtreeCursor user.userName_1_timestamp_-1", "isMultiKey" : false, "n" : 0, "nscannedObjects" : 30060, "nscanned" : 30060, "nscannedObjectsAllPlans" : 120241, "nscannedAllPlans" : 120241, "scanAndOrder" : false, "indexOnly" : false, "nYields" : 1, "nChunkSkips" …

2
MongoDB如何索引数组?
在MongoDB中,如果我要将一个数组(例如["red", "blue"])存储在field中"color",它是否索引"red","blue"因此我可以进行查询"red",例如,还是要创建{"red", "blue"}一个复合索引?
75 indexing  mongodb 

3
Solr中“ multiValued”字段类型的用途是什么?
我是Apache Solr的新手。即使阅读了文档部分,我仍然很难清楚地了解multiValued字段类型属性的功能和使用。 Solr在内部做什么/处理/处理标记为multiValued的字段 ? 是什么在索引中的Solr的字段之间的区别是多值和那些没有? 有人可以举例说明吗? Doc说: multiValued = true | false 如果此字段可能在每个文档中包含多个值,则为真,即,如果它可以在文档中多次出现

2
IndexError:数组索引过多
我知道有很多这样的线程,但是它们都是用于非常简单的情况(例如3x3矩阵)之类的,解决方案甚至还没有开始应用于我的情况。因此,我尝试绘制G与l1的关系图(这不是11,而是L1)。数据在我从excel文件加载的文件中。excel文件为14x250,因此有14个参数,每个参数包含250个数据点。我有另一个用户(向休·博斯韦尔大喊大叫!)帮助我解决代码中的错误,但现在又出现了另一个错误。 所以这是有问题的代码: # format for CSV file: header = ['l1', 'l2', 'l3', 'l4', 'l5', 'EI', 'S', 'P_right', 'P1_0', 'P3_0', 'w_left', 'w_right', 'G_left', 'G_right'] def loadfile(filename, skip=None, *args): skip = set(skip or []) with open(filename, *args) as f: cr = csv.reader(f, quoting=csv.QUOTE_NONNUMERIC) return np.array(row for i,row in enumerate(cr) if i not …

3
优雅的索引,直到向量/矩阵的结尾
在R中是否可以说-我想要从位置i到向量/矩阵结尾的所有索引?假设我要从第3列开始添加子矩阵。我目前只知道这种方式: A = matrix(rep(1:8, each = 5), nrow = 5) # just generate some example matrix... A[,3:ncol(A)] # get submatrix from 3rd column onwards 但是我真的需要写ncol(A)吗?从“第三栏起”说出来没有优雅的方法吗?像A[,3:]什么?(或A[,3:...])?
74 r  matrix  dataframe  indexing 

5
用另一个数据框的索引创建一个空的数据框
我有一个具有多个列和行的数据框df1。简单的例子: TIME T1 T2 1 10 100 2 20 200 3 30 300 我想创建一个空的数据框df2,然后再添加带有计算结果的新列。 目前,我的代码如下所示: df1=pd.read_csv("1.txt",index_col="TIME") df2=df1.copy()[[]] #copy df1 and erase all columns ...添加两个新列: df2["results1"],df2["results2"]=df1["T1"]*df["T2"]*3,df1["T2"]+100 有没有更好/更安全/更快的方法呢?是否可以创建一个空的数据帧df2并仅从df1复制索引?


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.