Questions tagged «split»

使用此标签可以解决有关将项目(例如字符串)分成多个部分(通常使用定界符或正则表达式)的问题。

16
如何将没有空格的文本分割成单词列表?
输入: "tableapplechairtablecupboard..."很多单词 将此类文本拆分为单词列表并获得以下内容的有效算法是什么? 输出: ["table", "apple", "chair", "table", ["cupboard", ["cup", "board"]], ...] 首先想到的是遍历所有可能的单词(从第一个字母开始)并找到可能的最长单词,然后从 position=word_position+len(word) PS: 我们列出了所有可能的单词。 单词“ cupboard”可以是“ cup”和“ board”,选择时间最长。 语言:python,但主要是算法本身。
106 python  algorithm  text  split 

11
Javascript如何分割换行符
我正在使用jquery,并且有一个textarea。当我通过按钮提交时,我将提醒每个由换行符分隔的文本。有换行符时如何拆分文本? var ks = $('#keywords').val().split("\n"); (function($){ $(document).ready(function(){ $('#data').submit(function(e){ e.preventDefault(); alert(ks[0]); $.each(ks, function(k){ alert(k); }); }); }); })(jQuery); 输入示例: Hello There 我想要的结果是: alert(Hello); and alert(There)
102 jquery  split 



13
以点为分隔符分割字符串
我想知道我是否打算.以正确的方式分割字符串?我的代码是: String[] fn = filename.split("."); return fn[0]; 我只需要字符串的第一部分,这就是为什么我返回第一项的原因。我问是因为我在API中注意到这.意味着任何字符,所以现在我陷入了困境。
99 java  regex  string  split 

1
如何在行号处分割文件[关闭]
关闭。这个问题是题外话。它当前不接受答案。 想改善这个问题吗? 更新问题,使其成为Stack Overflow 的主题。 7年前关闭。 改善这个问题 我想从特定的行号中拆分一个400k行长的日志文件。 对于这个问题,让其为任意数字300k。 是否有Linux命令允许我执行此操作(在脚本内)? 我知道split可以按大小或行号将文件分成相等的部分,但这不是我想要的。我想要一个文件中的前300k,第二个文件中的最后100k。 任何帮助,将不胜感激。谢谢! 再三考虑,这将更适合于超级用户或服务器故障站点。

6
用定界符分割字符串
我目前正在尝试分割字符串,1128-2以便可以有两个单独的值。例如,value1:1128和value2:2,这样我就可以分别使用每个值。我已经尝试过,split()但是没有成功。Grails是否有特定的处理方式,或者有更好的处理方式?
94 string  groovy  split 

5
方法“ train_test_split”中的参数“ stratify”(scikit学习)
我正在尝试train_test_split从scikit Learn软件包中使用,但是我在使用parameter时遇到了麻烦stratify。以下是代码: from sklearn import cross_validation, datasets X = iris.data[:,:2] y = iris.target cross_validation.train_test_split(X,y,stratify=y) 但是,我一直遇到以下问题: raise TypeError("Invalid parameters passed: %s" % str(options)) TypeError: Invalid parameters passed: {'stratify': array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, …

8
为什么在C ++中拆分字符串要比Python慢​​?
我正在尝试将一些代码从Python转换为C ++,以期提高速度并提高生锈的C ++技能。当一个天真的实现从标准输入读取线是在Python比C快得多++(见昨天我惊呆了这个)。今天,我终于弄清楚了如何使用合并定界符(与python的split()相似的语义)在C ++中拆分字符串,并且现在遇到了deja vu!我的C ++代码需要花费更长的时间才能完成工作(尽管昨天的课程没有那么多)。 Python代码: #!/usr/bin/env python from __future__ import print_function import time import sys count = 0 start_time = time.time() dummy = None for line in sys.stdin: dummy = line.split() count += 1 delta_sec = int(time.time() - start_time) print("Python: Saw {0} lines in {1} seconds. ".format(count, delta_sec), …

17
如何使用JavaScript解析包含数据逗号的CSV字符串?
我有以下类型的字符串 var string = "'string, duppi, du', 23, lala" 我想将字符串分成每个逗号的数组,但仅将单引号之外的逗号分隔。 我无法弄清楚分割的正确正则表达式... string.split(/,/) 会给我 ["'string", " duppi", " du'", " 23", " lala"] 但结果应该是: ["string, duppi, du", "23", "lala"] 有跨浏览器的解决方案吗?

6
相当于Explode and Implode(PHP)的Java
关闭。此问题不符合堆栈溢出准则。它当前不接受答案。 想改善这个问题吗?更新问题,使其成为Stack Overflow 的主题。 6年前关闭。 改善这个问题 我是Java新手,尽管在PHP方面有丰富的经验,并且正在寻找Java中爆炸和内爆(PHP中可用)函数的完美替代品。 我已经用Google搜索了相同的结果,但对结果不满意。任何人对我的问题都有好的解决方案将不胜感激。 例如: String s = "x,y,z"; //Here I need a function to divide the string into an array based on a character. array a = javaExplode(',', s); //What is javaExplode? System.out.println(Arrays.toString(a)); 所需的输出: [x, y, z]
93 java  arrays  string  split 

11
将数据框拆分为多个数据框
我有一个非常大的数据框(大约一百万行),其中包含来自实验的数据(60位受访者)。 我想将数据框分成60个数据框(每个参与者一个数据框)。 在数据框中,data有一个名为的变量'name',它是每个参与者的唯一代码。 我已经尝试了以下方法,但是没有任何反应(或者执行不会在一小时内停止)。我打算做的是将其拆分data为较小的数据框,并将其附加到列表(datalist): import pandas as pd def splitframe(data, name='name'): n = data[name][0] df = pd.DataFrame(columns=data.columns) datalist = [] for i in range(len(data)): if data[name][i] == n: df = df.append(data.iloc[i]) else: datalist.append(df) df = pd.DataFrame(columns=data.columns) n = data[name][i] df = df.append(data.iloc[i]) return datalist 我没有收到错误消息,该脚本似乎可以永远运行! 有什么聪明的方法吗?


5
将大型Git存储库拆分为许多较小的存储库
在将SVN信息库成功转换为Git之后,我现在拥有一个非常大的Git信息库,我想分解为多个较小的信息库并维护历史记录。 因此,有人可以帮助分解可能如下所示的存储库: MyHugeRepo/ .git/ DIR_A/ DIR_B/ DIR_1/ DIR_2/ 分为两个如下所示的存储库: MyABRepo/ .git DIR_A/ DIR_B/ My12Repo/ .git DIR_1/ DIR_2/ 我已经尝试按照上一个问题中的指示进行操作,但是当尝试将多个目录放入一个单独的仓库(将子目录分离(移动)到单独的Git存储库中)时,它确实不合适。

3
根据列中的公共值将大数据帧拆分为数据帧列表
我有一个包含10列的数据框,收集“用户”的操作,其中一列包含一个ID(不是唯一的,标识用户)(第10列)。数据帧的长度约为750000行。我试图提取单个数据帧(以便获取数据帧的列表或向量),并按包含“用户”标识符的列进行拆分,以隔离单个参与者的动作。 ID | Data1 | Data2 | ... | UserID 1 | aaa | bbb | ... | u_001 2 | aab | bb2 | ... | u_001 3 | aac | bb3 | ... | u_001 4 | aad | bb4 | ... | u_002 导致 list( ID | …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.