根据定界符将字符串拆分为字符串数组


84

我正在尝试找到一个Delphi函数,该函数会将输入字符串分成基于定界符的字符串数组。我在Google上找到了很多东西,但是似乎所有人都有自己的问题,而且我还无法解决其中的任何问题。

我只需要将像这样的字符串拆分为 "word:doc,txt,docx"基于':'的数组。结果将是 ['word', 'doc,txt,docx']

有人有他们知道的功能吗?

谢谢

Answers:


86

您可以使用TStrings.DelimitedText属性拆分字符串

检查这个样本

program Project28;

{$APPTYPE CONSOLE}

uses
  Classes,
  SysUtils;

procedure Split(Delimiter: Char; Str: string; ListOfStrings: TStrings) ;
begin
   ListOfStrings.Clear;
   ListOfStrings.Delimiter       := Delimiter;
   ListOfStrings.StrictDelimiter := True; // Requires D2006 or newer.
   ListOfStrings.DelimitedText   := Str;
end;


var
   OutPutList: TStringList;
begin
   OutPutList := TStringList.Create;
   try
     Split(':', 'word:doc,txt,docx', OutPutList) ;
     Writeln(OutPutList.Text);
     Readln;
   finally
     OutPutList.Free;
   end;
end.

更新

请参阅此链接以获取的解释StrictDelimiter


22
不幸的是,许多“较旧的” Delphi版本中存在一个错误(不确定该版本已修复),其结果是空格字符始终用作定界符。因此,请谨慎处理!
Leo 2010年

16
是的 您需要将StrictDelimiter设置为true,并且如果您的Delphi版本中StrictDelimiter属性不可用,请不要使用此技术!但是,如果是这样,这将非常有用。
梅森惠勒

3
这不是错误,而是D1或D2中的(烦人的)设计决策方式。CommaText应该用引号将任何字段括起来。如果输入在任何带空格的字段周围用双引号引起来,则结果正确。
Gerry Coll 2010年

1
我的烦恼之一是人们不必要地将类型指示符放在变量/参数名称中。Pascal是强类型的-它是(多种手指练习类型的)冗余类型,并且在类型指示符错误时会引起误解,如在这种情况下:ArrayOfStrings不是数组(因此甚至无法回答所提出的问题) 。
Deltics” 2010年

6
对于支持此答案的每个人,请注意,它不会产生问题中指定的数组。不完整的需求规格说明在这个行业中是一个大问题,忽略规定的需求并交付未要求的内容是另一个大问题。批准任何一种都只会鼓励不良做法。;)
Deltics 2010年

67

无需设计Split功能。它已经存在,请参阅:Classes.ExtractStrings

通过以下方式使用它:

program Project1;

{$APPTYPE CONSOLE}

uses
  Classes;

var
  List: TStrings;
begin
  List := TStringList.Create;
  try
    ExtractStrings([':'], [], PChar('word:doc,txt,docx'), List);
    WriteLn(List.Text);
    ReadLn;
  finally
    List.Free;
  end;
end.

并充分回答问题;List用元素表示所需的数组:

List[0] = 'word'
List[1] = 'doc,txt,docx'

14
ExtractStrings非常不灵活:“回车符,换行符和引号字符(单或双)始终被视为分隔符。” 和“注意:ExtractStrings不会将空字符串添加到列表中。”
2013年

问题不是设计split功能,而是TStrings对象的需要。而由于缺乏灵活性(@awmross)提到的,我喜欢弗兰克的解决方案
沃尔夫

50

您可以使用StrUtils.SplitString

function SplitString(const S, Delimiters: string): TStringDynArray;

文档中对其的描述:

将字符串拆分为由指定的分隔符分隔的不同部分。

SplitString将字符串拆分为由指定的分隔符分隔的不同部分。S是要分割的字符串。 分隔符是一个字符串,其中包含定义为分隔符的字符。

SplitString返回类型为System.Types.TStringDynArray的字符串数组,其中包含原始字符串的拆分部分。


3
嗯,不是在我的Delphi 2010版本中(XMLDoc和(印地语单元)IdStrings中都有一个SplitString例程,但是这些都不能满足发布者的要求,而且XMLDoc例程也不会通过单元接口公开)。
Deltics” 2010年

3
函数SplitString(const S,Delimiters:string):TStringDynArray; 在StrUtils.pas中定义
alex

我无法包含文件StrUtils.pas(即使存在)。
Truthseeker

这是将字符串拆分为“数组”的示例。
bvj 2014年

最好的事情是,它接受一个字符串定界符,而不是其他答案中的char定界符。
user30478 '18

42

使用SysUtils.TStringHelper.Split功能,在Delphi XE3介绍:

var
  MyString: String;
  Splitted: TArray<String>;
begin
  MyString := 'word:doc,txt,docx';
  Splitted := MyString.Split([':']);
end.

这会将具有给定分隔符的字符串拆分为字符串数组。


18

我总是使用类似的东西:

Uses
   StrUtils, Classes;

Var
  Str, Delimiter : String;
begin
  // Str is the input string, Delimiter is the delimiter
  With TStringList.Create Do
  try
    Text := ReplaceText(S,Delim,#13#10);

    // From here on and until "finally", your desired result strings are
    // in strings[0].. strings[Count-1)

  finally
    Free; //Clean everything up, and liberate your memory ;-)
  end;

end;

2
对于较早的Delphi版本的用户而言,这是一个很好的解决方案。

C ++ Builder 6用户:相应的功能是Strutils::AnsiReplaceText
Wolf

非常简单。在Delphi 7工作:list.Text := AnsiReplaceStr(source, delimiter, #13#10);
AlainD

在Delphi 6中可以使用
SysUtils.StringReplace

14

与Mef提供的Explode()函数类似,但有一些区别(我认为其中一个错误修复):

  type
    TArrayOfString = array of String;


  function SplitString(const aSeparator, aString: String; aMax: Integer = 0): TArrayOfString;
  var
    i, strt, cnt: Integer;
    sepLen: Integer;

    procedure AddString(aEnd: Integer = -1);
    var
      endPos: Integer;
    begin
      if (aEnd = -1) then
        endPos := i
      else
        endPos := aEnd + 1;

      if (strt < endPos) then
        result[cnt] := Copy(aString, strt, endPos - strt)
      else
        result[cnt] := '';

      Inc(cnt);
    end;

  begin
    if (aString = '') or (aMax < 0) then
    begin
      SetLength(result, 0);
      EXIT;
    end;

    if (aSeparator = '') then
    begin
      SetLength(result, 1);
      result[0] := aString;
      EXIT;
    end;

    sepLen := Length(aSeparator);
    SetLength(result, (Length(aString) div sepLen) + 1);

    i     := 1;
    strt  := i;
    cnt   := 0;
    while (i <= (Length(aString)- sepLen + 1)) do
    begin
      if (aString[i] = aSeparator[1]) then
        if (Copy(aString, i, sepLen) = aSeparator) then
        begin
          AddString;

          if (cnt = aMax) then
          begin
            SetLength(result, cnt);
            EXIT;
          end;

          Inc(i, sepLen - 1);
          strt := i + 1;
        end;

      Inc(i);
    end;

    AddString(Length(aString));

    SetLength(result, cnt);
  end;

差异:

  1. aMax参数限制要返回的字符串数
  2. 如果输入字符串由分隔符终止,则认为存在名义上的“空”最终字符串

例子:

SplitString(':', 'abc') returns      :    result[0]  = abc

SplitString(':', 'a:b:c:') returns   :    result[0]  = a
                                          result[1]  = b
                                          result[2]  = c
                                          result[3]  = <empty string>

SplitString(':', 'a:b:c:', 2) returns:    result[0]  = a
                                          result[1]  = b

我认为是bug修复的结尾是分隔符和概念上的“空的最终元素”。

我还细化了我建议的内存分配更改(我错误地建议输入字符串最多包含50%的分隔符,但是可以想象它当然可以包含100%的分隔符字符串,从而产生一个空元素数组!)


7

爆炸是一个非常高速的功能,源代码来自TStrings组件。我使用下一个爆炸测试:爆炸134217733字节数据,我得到19173962个元素,工作时间:2984毫秒。

Implode是非常低速的功能,但是我写起来很容易。

{ ****************************************************************************** }
{  Explode/Implode (String <> String array)                                      }
{ ****************************************************************************** }
function Explode(S: String; Delimiter: Char): Strings; overload;
var I, C: Integer; P, P1: PChar;
begin
    SetLength(Result, 0);
    if Length(S) = 0 then Exit;
    P:=PChar(S+Delimiter); C:=0;
    while P^ <> #0 do begin
       P1:=P;
       while (P^ <> Delimiter) do P:=CharNext(P);
       Inc(C);
       while P^ in [#1..' '] do P:=CharNext(P);
       if P^ = Delimiter then begin
          repeat
           P:=CharNext(P);
          until not (P^ in [#1..' ']);
       end;
    end;
    SetLength(Result, C);
    P:=PChar(S+Delimiter); I:=-1;
    while P^ <> #0 do begin
       P1:=P;
       while (P^ <> Delimiter) do P:=CharNext(P);
       Inc(I); SetString(Result[I], P1, P-P1);
       while P^ in [#1..' '] do P:=CharNext(P);
       if P^ = Delimiter then begin
          repeat
           P:=CharNext(P);
          until not (P^ in [#1..' ']);
       end;
    end;
end;

function Explode(S: String; Delimiter: Char; Index: Integer): String; overload;
var I: Integer; P, P1: PChar;
begin
    if Length(S) = 0 then Exit;
    P:=PChar(S+Delimiter); I:=1;
    while P^ <> #0 do begin
       P1:=P;
       while (P^ <> Delimiter) do P:=CharNext(P);
        SetString(Result, P1, P-P1);
        if (I <> Index) then Inc(I) else begin
           SetString(Result, P1, P-P1); Exit;
        end;
       while P^ in [#1..' '] do P:=CharNext(P);
       if P^ = Delimiter then begin
          repeat
           P:=CharNext(P);
          until not (P^ in [#1..' ']);
       end;
    end;
end;

function Implode(S: Strings; Delimiter: Char): String;
var iCount: Integer;
begin
     Result:='';
     if (Length(S) = 0) then Exit;
     for iCount:=0 to Length(S)-1 do
     Result:=Result+S[iCount]+Delimiter;
     System.Delete(Result, Length(Result), 1);
end;

3
这不会编译:Strings不是类型。
NGLN


6

您可以创建自己的函数,该函数返回字符串的TArray:

function mySplit(input: string): TArray<string>;
var
  delimiterSet: array [0 .. 0] of char; 
     // split works with char array, not a single char
begin
  delimiterSet[0] := '&'; // some character
  result := input.Split(delimiterSet);
end;

5

是爆炸功能的实现,该爆炸功能可以在许多其他编程语言中用作标准功能:

type 
  TStringDynArray = array of String;

function Explode(const Separator, S: string; Limit: Integer = 0): TStringDynArray; 
var 
  SepLen: Integer; 
  F, P: PChar; 
  ALen, Index: Integer; 
begin 
  SetLength(Result, 0); 
  if (S = '') or (Limit < 0) then Exit; 
  if Separator = '' then 
  begin 
    SetLength(Result, 1); 
    Result[0] := S; 
    Exit; 
  end; 
  SepLen := Length(Separator); 
  ALen := Limit; 
  SetLength(Result, ALen); 

  Index := 0; 
  P := PChar(S); 
  while P^ <> #0 do 
  begin 
    F := P; 
    P := AnsiStrPos(P, PChar(Separator)); 
    if (P = nil) or ((Limit > 0) and (Index = Limit - 1)) then P := StrEnd(F); 
    if Index >= ALen then 
    begin 
      Inc(ALen, 5); 
      SetLength(Result, ALen); 
    end; 
    SetString(Result[Index], F, P - F); 
    Inc(Index); 
    if P^ <> #0 then Inc(P, SepLen); 
  end; 
  if Index < ALen then SetLength(Result, Index); 
end; 

用法示例:

var
  res: TStringDynArray;
begin
  res := Explode(':', yourString);

2
在此代码中,存在一些用于管理/预测结果长度的奇怪且可能非常低效的选择。通过逐渐增加结果数组,可以增加内存重新分配和碎片化的机会。更有效的方法是将初始长度设置为尽可能大的长度,即假设输入字符串包含50%的分隔符字符串= Length(S)div(2 * Length(Separator)。然后将其设置为实际的长度)。项目完成后进行1个分配,然后可能会进行一次截断
-Deltics 2010年

同样,您也不会解释Limit参数的用途。我直觉上希望它设置一个最大的返回子字符串数,实际上这似乎将对子字符串的检测限制为输入字符串中第一个“ Limit”字符数。这似乎毫无意义,因为如果需要这样做,您可以对所需子字符串的Copy()进行Explode()操作。使用Limit设置最大子字符串数将更加有用。
Deltics

@Deltics:没有人声称这是一个高度优化的功能,也没有人要求它,所以我有点不理解您的抱怨。但是也许您是最优化一切的人之一,无论是否有必要...
Leo

1
我是那种不会编写不必要的低效率代码,然后担心以后进行优化的人。这不是仔细分析代码并发现一些微妙的优化潜力的情况,它只是一个显而易见的且容易解决的低效率问题:连续内存的增量增长可以替代地轻松地预先分配并随后被截断。
Deltics” 2010年

@Mef:这不是投诉,是评论,是观察。但更重要的是,您的代码也包含了我认为是错误的内容(有关说明,请参见我的替代方法)。
Deltics 2010年

5

我编写了此函数,该函数按特定的分隔符返回分隔字符串的链表。无模块的纯自由帕斯卡。

Program split_f;

type
    PTItem = ^TItem;
    TItem = record
        str : string;
        next : PTItem;
    end;

var
    s : string;
    strs : PTItem;

procedure split(str : string;delim : char;var list : PTItem);
var
    i : integer;
    buff : PTItem;
begin
    new(list);
    buff:= list;
    buff^.str:='';
    buff^.next:=nil;

    for i:=1 to length(str) do begin
        if (str[i] = delim) then begin
            new(buff^.next);
            buff:=buff^.next;
            buff^.str := '';
            buff^.next := nil;
        end
        else
        buff^.str:= buff^.str+str[i];
    end;
end;

procedure print(var list:PTItem);
var
    buff : PTItem;
begin
    buff := list;
    while buff<>nil do begin
        writeln(buff^.str);
        buff:= buff^.next;
    end;
end;

begin

    s := 'Hi;how;are;you?';

    split(s, ';', strs);
    print(strs);


end.

3

绝地代码库提供了带有内置Split功能的增强型StringList,该功能能够添加和替换现有文本。它还提供了引用计数接口。因此,即使在没有SplitStrings的较早的Delphi版本中,也无需对股票TStringList进行仔细且乏味的自定义以仅使用指定的定界符,就可以使用它。

例如,给定的行文本文件Dog 5 4 7可以使用以下命令解析它们:

var slF, slR: IJclStringList; ai: TList<integer>; s: string; i: integer;
    action: procedure(const Name: string; Const Data: array of integer);

slF := TJclStringList.Create; slF.LoadFromFile('some.txt');
slR := TJclStringList.Create;
for s in slF do begin
    slR.Split(s, ' ', true);
    ai := TList<Integer>.Create;
    try
       for i := 1 to slR.Count - 1 do
           ai.Add(StrToInt(slR[i]));
       action(slR[0], ai.ToArray);
    finally ai.Free; end;
end; 

http://wiki.delphi-jedi.org/wiki/JCL_Help:IJclStringList.Split@string@string@Boolean


3

这将解决您的问题

interface
   TArrayStr = Array Of string;

implementation

function SplitString(Text: String): TArrayStr;
var
   intIdx: Integer;
   intIdxOutput: Integer;
const
   Delimiter = ';';
begin
   intIdxOutput := 0;
   SetLength(Result, 1);
   Result[0] := ''; 

   for intIdx := 1 to Length(Text) do
   begin
      if Text[intIdx] = Delimiter then
      begin
         intIdxOutput := intIdxOutput + 1;
         SetLength(Result, Length(Result) + 1);
      end
      else
         Result[intIdxOutput] := Result[intIdxOutput] + Text[intIdx];
   end;
end;

能否请您解释一下代码的作用?谢谢
Paco 2015年

它遍历传递的字符串以查找定界符const(如果找不到),并与数组的当前位置连接,当找到时,其跳转到动态数组中的下一个位置
Dennis

1

我最喜欢的拆分功能:

procedure splitString(delim: char; s: string; ListOfStrings: TStrings);
var temp: string;
    i: integer;
begin
   ListOfStrings.Clear;
   for i:=1 to length(s) do
    begin
      if s[i] = delim then
        begin
          ListOfStrings.add(temp);
          temp := '';
        end
      else
        begin
          temp := temp + s[i];
          if i=length(s) then
             ListOfStrings.add(temp);
        end;
    end;
    ListOfStrings.add(temp);
end;

1
您的职能中遗漏了最后一个要素
alijunior '18

1
您需要ListOfStrings.add(temp);在循环后添加以添加最后一项。
rnso

感谢您的注释,我在else块中编辑了代码。
John Boe

0

*

//Basic functionality of a TStringList solves this:


uses Classes  //TStringList 
    ,types    //TStringDynArray
    ,SysUtils //StringReplace()
    ;

....

 //--------------------------------------------------------------------------
 function _SplitString(const s:string; const delimiter:Char):TStringDynArray;
  var sl:TStringList;
      i:integer;
  begin
  sl:=TStringList.Create;

  //separete delimited items by sLineBreak;TStringlist will do the job:
  sl.Text:=StringReplace(s,delimiter,sLineBreak,[rfReplaceAll]);

  //return the splitted string as an array:
  setlength(Result,sl.count);
  for i:=0 to sl.Count-1
   do Result[i]:=sl[i];

  sl.Free;
  end;



//To split a FileName (last item will be the pure filename itselfs):

 function _SplitPath(const fn:TFileName):TStringDynArray;
  begin
  result:=_SplitString(fn,'\');
  end;

*


0

NGLG的答案为https://stackoverflow.com/a/8811242/6619626,您可以使用以下功能:

type
OurArrayStr=array of string;

function SplitString(DelimeterChars:char;Str:string):OurArrayStr;
var
seg: TStringList;
i:integer;
ret:OurArrayStr;
begin
    seg := TStringList.Create;
    ExtractStrings([DelimeterChars],[], PChar(Str), seg);
    for i:=0 to seg.Count-1 do
    begin
         SetLength(ret,length(ret)+1);
         ret[length(ret)-1]:=seg.Strings[i];
    end;
    SplitString:=ret;
    seg.Free;
end;

它适用于所有Delphi版本。


0

对于delphi 2010,您需要创建自己的split函数。

function Split(const Texto, Delimitador: string): TStringArray;
var
  i: integer;
  Len: integer;
  PosStart: integer;
  PosDel: integer;
  TempText:string;
begin
  i := 0;
  SetLength(Result, 1);
  Len := Length(Delimitador);
  PosStart := 1;
  PosDel := Pos(Delimitador, Texto);
  TempText:=  Texto;
  while PosDel > 0 do
    begin
      Result[i] := Copy(TempText, PosStart, PosDel - PosStart);
      PosStart := PosDel + Len;
      TempText:=Copy(TempText, PosStart, Length(TempText));
      PosDel := Pos(Delimitador, TempText);
      PosStart := 1;
      inc(i);
      SetLength(Result, i + 1);
    end;
  Result[i] := Copy(TempText, PosStart, Length(TempText));
end;

您可以这样称呼它

type
  TStringArray = array of string;
var Temp2:TStringArray;
Temp1="hello:world";
Temp2=Split(Temp1,':')

0
procedure SplitCSV(S:STRING;out SL:TStringList);
var c,commatext:string;
  a,b,up:integer;
begin
   c:=s.Replace(' ','<SPACE>');   //curate spaces

   //first ocurrence of "
   a:=pos('"',c);
   b:=pos('"',c,a+1);
   if (a>0) and (b>0) then
   begin
     commatext:=commatext+copy(c,0,a-1);
     commatext:=commatext+copy(c,a,b-a+1).Replace(',','<COMMA>');   //curate commas
     up:=b+1;
   end
   else
     commatext:=c;

   //while continue discovering "
   while (a>0) and (b>0) do
   begin
     a:=Pos('"',c,b+1);
     b:=pos('"',c,a+1);
     if (a>0) and (b>0) then
     begin
       commatext:=commatext+copy(c,up,a-up);
       commatext:=commatext+copy(c,a,b-a+1).Replace(',','<COMMA>'); //curate commas
       up:=b+1;
     end;
   end;
   //last piece of text end  
   if up<c.Length then
     commatext:=commatext+copy(c,up,c.Length-up+1);

   //split text using CommaText
   sl.CommaText:=commatext;

   sl.Text:=sl.Text.Replace('<COMMA>',',');   //curate commas
   sl.Text:=sl.Text.Replace('<SPACE>',' ');   //curate spaces
end;

清晰,简洁地解释解决方案的答案比仅使用代码的答案有用得多。
MartynA

0
interface

uses
  Classes;

type
  TStringArray = array of string;

  TUtilStr = class
    class function Split(const AValue: string; const ADelimiter: Char = ';'; const AQuoteChar: Char = '"'): TStringArray; static;
  end;


implementation

{ TUtilStr }

class function TUtilStr.Split(const AValue: string; const ADelimiter: Char; const AQuoteChar: Char): TStringArray;
var
  LSplited: TStringList;
  LText: string;
  LIndex: Integer;
begin
  LSplited := TStringList.Create;
  try
    LSplited.StrictDelimiter := True;
    LSplited.Delimiter := ADelimiter;
    LSplited.QuoteChar := AQuoteChar;
    LSplited.DelimitedText := AValue;

    SetLength(Result, LSplited.Count);
    for LIndex := 0 to LSplited.Count - 1 do
    begin
      Result[LIndex] := LSplited[LIndex];
    end;
  finally
    LSplited.Free;
  end;
end;

end.
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.