如何将字符串分成n个字符的段?


200

如标题所示,我有一个字符串,我想分成n个字符的段。

例如:

var str = 'abcdefghijkl';

经过一些魔法之后n=3,它将变成

var arr = ['abc','def','ghi','jkl'];

有没有办法做到这一点?

Answers:


358

var str = 'abcdefghijkl';
console.log(str.match(/.{1,3}/g));

注意:使用{1,3}而不是仅{3}包括其余部分,该长度不是3的倍数,例如:

console.log("abcd".match(/.{1,3}/g)); // ["abc", "d"]


还有一些细微之处:

  1. 如果您的字符串中可能包含换行符(您希望将其视为一个字符而不是拆分字符串),则.不会捕获这些换行符。使用/[\s\S]{1,3}/代替。(感谢@Mike)。
  2. 如果您的字符串为空,则当您期望一个空数组时match()将返回null。通过附加来防止这种情况|| []

因此,您可能最终得到:

var str = 'abcdef \t\r\nghijkl';
var parts = str.match(/[\s\S]{1,3}/g) || [];
console.log(parts);

console.log(''.match(/[\s\S]{1,3}/g) || []);


从技术上讲,这是一个更好的答案,因为它将从不被3整除的字符串中捕获所有文本(它将捕获最后2个或1个字符)。
Erik

6
使用[\s\S]代替,.以免在换行符上失败。
Mike Samuel

2
您可能想在每一行上开始一个新的循环。如果您确实有换行符,则它们可能表示某种过渡。str.match(/。{1,3} / gm)可能是一个更好的选择。
kennebec

+1 小心: ''.match(/.{1,3}/g)''.match(/.{3}/g)返回null而不是一个空数组。
Web_Designer 2014年

4
是否可以在数字3处使用变量?
安娜·克劳迪娅

46

如果您不想使用正则表达式...

var chunks = [];

for (var i = 0, charsLength = str.length; i < charsLength; i += 3) {
    chunks.push(str.substring(i, i + 3));
}

jsFiddle

...否则正则表达式解决方案就很好了:)


1
+1 cos如果3OP所建议的变量是可变的,我更愿意这样做。比连接正则表达式字符串更具可读性。
David Tang

如果您可以将其包装为准备使用的有用功能
mmm,2016年

1
这比regex选项快10倍以上,所以我会使用它(在函数内部)jsbench.github.io/#9cb819bf1ce429575f8535a211f72d5a
Job

1
我之前的声明适用于Chromium(同样,我编辑以前的注释(因此是新注释)为时已晚。在Firefox上,它目前在我的计算机上仅“快”了30%,但这仍然持续地更好。
Job

这在大长度的琴弦上可持续吗?
Jacob Schneider

22
str.match(/.{3}/g); // => ['abc', 'def', 'ghi', 'jkl']

3对我有用null,但返回250。🤔
吉姆

9

以先前对该问题的答案为基础;以下函数将分割字符串(str)n个数字(size)。

function chunk(str, size) {
    return str.match(new RegExp('.{1,' + size + '}', 'g'));
}

演示版

(function() {
  function chunk(str, size) {
    return str.match(new RegExp('.{1,' + size + '}', 'g'));
  }
  
  var str = 'HELLO WORLD';
  println('Simple binary representation:');
  println(chunk(textToBin(str), 8).join('\n'));
  println('\nNow for something crazy:');
  println(chunk(textToHex(str, 4), 8).map(function(h) { return '0x' + h }).join('  '));
  
  // Utiliy functions, you can ignore these.
  function textToBin(text) { return textToBase(text, 2, 8); }
  function textToHex(t, w) { return pad(textToBase(t,16,2), roundUp(t.length, w)*2, '00'); }
  function pad(val, len, chr) { return (repeat(chr, len) + val).slice(-len); }
  function print(text) { document.getElementById('out').innerHTML += (text || ''); }
  function println(text) { print((text || '') + '\n'); }
  function repeat(chr, n) { return new Array(n + 1).join(chr); }
  function textToBase(text, radix, n) {
    return text.split('').reduce(function(result, chr) {
      return result + pad(chr.charCodeAt(0).toString(radix), n, '0');
    }, '');
  }
  function roundUp(numToRound, multiple) { 
    if (multiple === 0) return numToRound;
    var remainder = numToRound % multiple;
    return remainder === 0 ? numToRound : numToRound + multiple - remainder;
  }
}());
#out {
  white-space: pre;
  font-size: 0.8em;
}
<div id="out"></div>


2

我的解决方案(ES6语法):

const source = "8d7f66a9273fc766cd66d1d";
const target = [];
for (
    const array = Array.from(source);
    array.length;
    target.push(array.splice(0,2).join(''), 2));

我们甚至可以创建一个函数:

function splitStringBySegmentLength(source, segmentLength) {
    if (!segmentLength || segmentLength < 1) throw Error('Segment length must be defined and greater than/equal to 1');
    const target = [];
    for (
        const array = Array.from(source);
        array.length;
        target.push(array.splice(0,segmentLength).join('')));
    return target;
}

然后,您可以以可重用的方式轻松调用该函数:

const source = "8d7f66a9273fc766cd66d1d";
const target = splitStringBySegmentLength(source, 2);

干杯


2
const chunkStr = (str, n, acc) => {     
    if (str.length === 0) {
        return acc
    } else {
        acc.push(str.substring(0, n));
        return chunkStr(str.substring(n), n, acc);
    }
}
const str = 'abcdefghijkl';
const splittedString = chunkStr(str, 3, []);

不含REGEX的清洁溶液


1
function chunk(er){
return er.match(/.{1,75}/g).join('\n');
}

上面的函数是我用于Base64分块的功能。它将创建一个75个字符的换行符。


也可以replace(/.{1,75}/g, '$&\n')
Alex

1

在这里,我们每隔n个字符散布一个字符串和另一个字符串:

export const intersperseString = (n: number, intersperseWith: string, str: string): string => {

  let ret = str.slice(0,n), remaining = str;

  while (remaining) {
    let v = remaining.slice(0, n);
    remaining = remaining.slice(v.length);
    ret += intersperseWith + v;
  }

  return ret;

};

如果我们像这样使用上面的代码:

console.log(splitString(3,'|', 'aagaegeage'));

我们得到:

aag | aag | aeg | eag | e

在这里,我们做同样的事情,但是将其推送到数组:

export const sperseString = (n: number, str: string): Array<string> => {

  let ret = [], remaining = str;

  while (remaining) {
    let v = remaining.slice(0, n);
    remaining = remaining.slice(v.length);
    ret.push(v);
  }

  return ret;

};

然后运行它:

console.log(sperseString(5, 'foobarbaztruck'));

我们得到:

['fooba','rbazt','ruck']

如果有人知道一种简化上述代码lmk的方法,但对于字符串来说应该可以正常工作。


您的第一个代码片段未按预期工作。我在这里修改过:jsfiddle.net/omarojo/ksvx2txb/261
omarojo

0

一些不使用正则表达式的干净解决方案:

/**
* Create array with maximum chunk length = maxPartSize
* It work safe also for shorter strings than part size
**/
function convertStringToArray(str, maxPartSize){

  const chunkArr = [];
  let leftStr = str;
  do {

    chunkArr.push(leftStr.substring(0, maxPartSize));
    leftStr = leftStr.substring(maxPartSize, leftStr.length);

  } while (leftStr.length > 0);

  return chunkArr;
};

使用示例-https://jsfiddle.net/maciejsikora/b6xppj4q/

我还尝试将我的解决方案与正则表达式(被选择为正确答案)进行比较。一些测试可以的jsfiddle找到- https://jsfiddle.net/maciejsikora/2envahrk/。测试表明这两种方法具有相似的性能,也许乍看之下regexp解决方案要快一点,但您自己来判断吧。


0

.split

var arr = str.split( /(?<=^(?:.{3})+)(?!$)/ )  // [ 'abc', 'def', 'ghi', 'jkl' ]

并且.replace将是:

var replaced = str.replace( /(?<=^(.{3})+)(?!$)/g, ' || ' )  // 'abc || def || ghi || jkl'



/(?!$)/要在end之前停止/$/,没有is:

var arr      = str.split( /(?<=^(?:.{3})+)/ )        // [ 'abc', 'def', 'ghi', 'jkl' ]     // I don't know why is not [ 'abc', 'def', 'ghi', 'jkl' , '' ], comment?
var replaced = str.replace( /(?<=^(.{3})+)/g, ' || ')  // 'abc || def || ghi || jkl || '

忽略组/(?:... )/是不需要的,.replace但是.split正在将组添加到arr中:

var arr = str.split( /(?<=^(.{3})+)(?!$)/ )  // [ 'abc', 'abc', 'def', 'abc', 'ghi', 'abc', 'jkl' ]

0

这是没有正则表达式或显式循环的一种方法,尽管它稍微扩展了一个线性的定义:

const input = 'abcdefghijlkm';

// Change `3` to the desired split length.
const output = input.split('').reduce((s, c) => {let l = s.length-1; (s[l] && s[l].length < 3) ? s[l] += c : s.push(c); return s;}, []);

console.log(output);  // output: [ 'abc', 'def', 'ghi', 'jlk', 'm' ]

它通过将字符串分成单个字符数组,然后Array.reduce用于遍历每个字符来工作。通常,它reduce会返回一个值,但在这种情况下,该值恰好是一个数组,当我们传递每个字符时,会将其附加到该数组的最后一项。一旦数组中的最后一项达到目标长度,我们将追加一个新的数组项。


0

稍后再讨论,但是这里的变体比子字符串+数组推入快一点。

// substring + array push + end precalc
var chunks = [];

for (var i = 0, e = 3, charsLength = str.length; i < charsLength; i += 3, e += 3) {
    chunks.push(str.substring(i, e));
}

作为for循环的一部分,预先计算最终值比在子字符串内进行内联数学更快。我已经在Firefox和Chrome中对其进行了测试,它们都显示出加速。

你可以在这里尝试

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.