避免在for循环中使用if语句？

116

我有一个叫做的类Writer，它具有如下功能writeVector：

void Drawer::writeVector(vector<T> vec, bool index=true)
{
    for (unsigned int i = 0; i < vec.size(); i++) {
        if (index) {
            cout << i << "\t";
        }
        cout << vec[i] << "\n";
    }
}

我正在尝试没有重复的代码，同时仍然担心性能。在函数中，即使结果始终相同if (index)，我for也会在-loop的每一轮中进行检查。这与“担心性能”相反。

通过将检查放在我的for-loop 之外，可以轻松避免这种情况。但是，我将获得大量重复代码：

void Drawer::writeVector(...)
{
    if (index) {
        for (...) {
            cout << i << "\t" << vec[i] << "\n";
        }
    }
    else {
        for (...) {
            cout << vec[i] << "\n";
        }
    }
}

所以这些对我来说都是“不好”的解决方案。我一直在想的是两个私有函数，其中一个超出索引，然后调用另一个。另一个仅超出价值。但是，我不知道如何在程序中使用它，我仍然需要if检查以查看要调用的那个...

根据问题，多态性似乎是正确的解决方案。但是我看不到我应该如何使用它。解决此类问题的首选方法是什么？

这不是一个真正的程序，我只是对学习如何解决此类问题感兴趣。

— Skamah One
source

8

@JonathonReinhart也许有些人想学习编程，并对如何解决问题感到好奇？

— Skamah

9

我给了这个问题+1。这种优化可能不是经常需要的，但首先，指出这一事实可以作为答案的一部分，其次，罕见的优化类型仍然与编程高度相关。

— jogojapan 2013年

31

问题是关于良好的设计，它避免了代码重复和循环内复杂的逻辑。这是一个好问题，无需投票。

— 阿里

5

这是一个有趣的问题，通常编译器中的循环转换将非常有效地解决此问题。如果像这样的功能足够小，则内层会对此进行处理，并且很可能会完全杀死分支。我宁愿更改代码，直到内联代码愉快地内联代码，而不是使用模板来解决。

— 亚历克斯

5

@JonathonReinhart：嗯？该问题的第一个修订版实际上与此相同。你的“你为什么在乎？” 注释100％与所有修订都不相关。至于公开谴责您-不仅是您，还有很多人在造成此问题。当标题为“避免在for循环内使用if语句”时，很明显问题是通用的，该示例仅用于说明。当您忽略该问题并使OP看起来很愚蠢时，您并没有帮助任何人，因为他使用了特定的说明性示例。

— user541686 2013年

79

将循环体作为函子传递。它在编译时内联，没有性能损失。

C ++标准库中普遍存在传递变化的想法。这称为策略模式。

如果允许使用C ++ 11，则可以执行以下操作：

#include <iostream>
#include <set>
#include <vector>

template <typename Container, typename Functor, typename Index = std::size_t>
void for_each_indexed(const Container& c, Functor f, Index index = 0) {

    for (const auto& e : c)
        f(index++, e);
}

int main() {

    using namespace std;

    set<char> s{'b', 'a', 'c'};

    // indices starting at 1 instead of 0
    for_each_indexed(s, [](size_t i, char e) { cout<<i<<'\t'<<e<<'\n'; }, 1u);

    cout << "-----" << endl;

    vector<int> v{77, 88, 99};

    // without index
    for_each_indexed(v, [](size_t , int e) { cout<<e<<'\n'; });
}

这段代码并不完美，但是您可以理解。

在旧的C ++ 98中，它看起来像这样：

#include <iostream>
#include <vector>
using namespace std;

struct with_index {
  void operator()(ostream& out, vector<int>::size_type i, int e) {
    out << i << '\t' << e << '\n';
  }
};

struct without_index {
  void operator()(ostream& out, vector<int>::size_type i, int e) {
    out << e << '\n';
  }
};


template <typename Func>
void writeVector(const vector<int>& v, Func f) {
  for (vector<int>::size_type i=0; i<v.size(); ++i) {
    f(cout, i, v[i]);
  }
}

int main() {

  vector<int> v;
  v.push_back(77);
  v.push_back(88);
  v.push_back(99);

  writeVector(v, with_index());

  cout << "-----" << endl;

  writeVector(v, without_index());

  return 0;
}

同样，代码远非完美，但可以为您提供想法。

— 阿里
source

4

for(int i=0;i<100;i++){cout<<"Thank you!"<<endl;}：D这是我一直在寻找的一种解决方案，它就像一种魅力:)您可以用很少的注释来改进它（起初很难理解它），但是我没有问题:)

— Skamah一月1

1

我很高兴它有所帮助！请检查我的C ++ 11代码更新，与C ++ 98版本相比，它的update肿程度更低。

— 阿里

3

Nitpick：这在OP的示例中很好，因为循环体很小，但是如果循环体很大（想象一堆代码行，而不是单个代码cout << e << "\n";），仍然会有很多代码重复。

— syam 2013年

3

为什么在C ++ 03示例中使用结构和运算符重载？为什么不仅仅创建两个函数并将指针传递给它们呢？

— 2013年

2

@Malcolm内联。如果它们是结构，则可以内联函数调用。如果传递函数指针，则可能无法内联这些调用。

— 阿里

40

在函数中，即使结果始终相同，我也会在for循环的每一轮中进行if（index）检查。这与“担心性能”相反。

如果确实如此，则分支预测器在预测（恒定）结果时将没有问题。这样，这只会在前几次迭代中造成适度的错误预测开销。就性能而言，无需担心

在这种情况下，我主张将测试保持在循环中以保持清晰。

— 马克·克莱森
source

3

这只是一个例子，我在这里学习如何解决此类问题。我很好奇，甚至没有创建一个真正的程序。应该在问题中提到它。

— Skamah 2013年

40

在这种情况下，请记住，过早的优化是万恶之源。编程时，请始终专注于代码的可读性，并确保其他人理解您要执行的操作。在对程序进行概要分析并确定热点之后，仅考虑微优化和各种破解。在不确定需要优化的情况下，切勿考虑优化。很多时候，性能问题不在您期望的位置。

— 马克·克莱森

3

在这个特定的示例中（好的，可以理解，这只是一个示例），很可能除了用于IO的时间之外，用于循环控制的时间以及是否几乎看不到测试的时间。对于C ++，这通常是一个问题：在以维护为代价的可读性和（假设的）效率之间进行选择。

— kriss 2013年

8

您假设代码在具有分支预测开始的处理器上运行。大多数运行C ++的系统都没有。（尽管，可能大多数系统都有用std::cout）

— Ben Voigt

2

-1。是的，分支预测在这里可以很好地工作。是的，条件实际上可能是编译器在循环外部提出的。是的，POITROAE。但是循环中的分支是危险的事情，通常会影响性能，如果有人真的在乎性能，我不认为仅仅通过说“分支预测”就可以消除分支。最值得注意的例子是矢量化编译器将需要谓词来处理此问题，从而产生的效率低于无分支循环的代码。

— 2013年

35

为了扩展Ali的答案，该答案是完全正确的，但仍然重复了一些代码（作为循环主体的一部分，不幸的是，使用策略模式时这很难避免）...

在这种特殊情况下，代码重复不是很多，但是有一种方法可以减少更多代码，如果函数主体大于仅几个指令，这将很方便。

关键是利用编译器的功能来执行恒定的折叠/死代码消除。我们可以通过手动将运行时的值映射index到编译时的值来实现这一点（当案例数量有限时很容易-在这种情况下为两种），并使用在编译时已知的非类型模板参数-时间：

template<bool index = true>
//                  ^^^^^^ note: the default value is now part of the template version
//                         see below to understand why
void writeVector(const vector<int>& vec) {
    for (size_t i = 0; i < vec.size(); ++i) {
        if (index) { // compile-time constant: this test will always be eliminated
            cout << i << "\t"; // this will only be kept if "index" is true
        }
        cout << vec[i] << "\n";
    }
}

void writeVector(const vector<int>& vec, bool index)
//                                            ^^^^^ note: no more default value, otherwise
//                                            it would clash with the template overload
{
    if (index) // runtime decision
        writeVector<true>(vec);
        //          ^^^^ map it to a compile-time constant
    else
        writeVector<false>(vec);
}

这样，我们最终得到的编译代码等效于您的第二个代码示例（outer if/ inner for），但无需自己复制代码。现在，我们可以根据需要使模板版本writeVector变得非常复杂，因此始终只需要维护一段代码。

注意模板版本（采用非类型模板参数形式的编译时常量）和非模板版本（以运行时变量作为函数参数）是如何重载的。这使您可以根据需要选择最相关的版本，在两种情况下都具有非常相似，易于记忆的语法：

writeVector<true>(vec);   // you already know at compile-time which version you want
                          // no need to go through the non-template runtime dispatching

writeVector(vec, index);  // you don't know at compile-time what "index" will be
                          // so you have to use the non-template runtime dispatching

writeVector(vec);         // you can even use your previous syntax using a default argument
                          // it will call the template overload directly

— 山药
source

2

请记住，删除代码重复的代价是使循环内的逻辑更加复杂。我认为这与我为这个特定的简单示例提出的建议一样好或坏。还是+1！

— 阿里

1

我喜欢您的建议，因为它显示了另一个可能的优化。从一开始索引很有可能是模板常量。在这种情况下，可以由writeVector的调用者将其替换为运行时常量，并将writeVector更改为某些模板。避免对原始代码进行任何进一步的更改。

— kriss 2013年

1

@kriss：实际上，我以前的解决方案已经允许您doWriteVector直接致电，但是我同意这个名字很不幸。我只是将其更改为具有两个重载writeVector函数（一个模板，另一个为常规函数），以使结果更均匀。谢谢你的建议。;）

— syam 2013年

4

IMO这是最好的答案。+1

— user541686

1

@Mehrdad除非它没有回答原始问题，否则避免在for循环内使用if语句？它确实回答了如何避免性能下降。至于“复制”，将需要一个带有用例的更实际的示例，以了解如何最好地将其分解出来。如我之前所说，我赞成这个答案。

— 2013年

0

在大多数情况下，您的代码已经对性能和可读性有帮助。一个好的编译器能够检测循环不变性并进行适当的优化。考虑以下与您的代码非常接近的示例：

#include <cstdio>
#include <iterator>

void write_vector(int* begin, int* end, bool print_index = false) {
    unsigned index = 0;
    for(int* it = begin; it != end; ++it) {
        if (print_index) {
            std::printf("%d: %d\n", index, *it);
        } else {
            std::printf("%d\n", *it);
        }
        ++index;
    }
}

int my_vector[] = {
    1, 2, 3, 4, 5, 6, 7, 8, 9, 10,
};


int main(int argc, char** argv) {
    write_vector(std::begin(my_vector), std::end(my_vector));
}

我正在使用以下命令行对其进行编译：

g++ --version
g++ (GCC) 4.9.1
Copyright (C) 2014 Free Software Foundation, Inc.
This is free software; see the source for copying conditions.  There is NO
warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
g++ -O3 -std=c++11 main.cpp

然后，让我们转储程序集：

objdump -d a.out | c++filt > main.s

的结果汇编write_vector为：

00000000004005c0 <write_vector(int*, int*, bool)>:
  4005c0:   48 39 f7                cmp    %rsi,%rdi
  4005c3:   41 54                   push   %r12
  4005c5:   49 89 f4                mov    %rsi,%r12
  4005c8:   55                      push   %rbp
  4005c9:   53                      push   %rbx
  4005ca:   48 89 fb                mov    %rdi,%rbx
  4005cd:   74 25                   je     4005f4 <write_vector(int*, int*, bool)+0x34>
  4005cf:   84 d2                   test   %dl,%dl
  4005d1:   74 2d                   je     400600 <write_vector(int*, int*, bool)+0x40>
  4005d3:   31 ed                   xor    %ebp,%ebp
  4005d5:   0f 1f 00                nopl   (%rax)
  4005d8:   8b 13                   mov    (%rbx),%edx
  4005da:   89 ee                   mov    %ebp,%esi
  4005dc:   31 c0                   xor    %eax,%eax
  4005de:   bf a4 06 40 00          mov    $0x4006a4,%edi
  4005e3:   48 83 c3 04             add    $0x4,%rbx
  4005e7:   83 c5 01                add    $0x1,%ebp
  4005ea:   e8 81 fe ff ff          callq  400470 <printf@plt>
  4005ef:   49 39 dc                cmp    %rbx,%r12
  4005f2:   75 e4                   jne    4005d8 <write_vector(int*, int*, bool)+0x18>
  4005f4:   5b                      pop    %rbx
  4005f5:   5d                      pop    %rbp
  4005f6:   41 5c                   pop    %r12
  4005f8:   c3                      retq   
  4005f9:   0f 1f 80 00 00 00 00    nopl   0x0(%rax)
  400600:   8b 33                   mov    (%rbx),%esi
  400602:   31 c0                   xor    %eax,%eax
  400604:   bf a8 06 40 00          mov    $0x4006a8,%edi
  400609:   48 83 c3 04             add    $0x4,%rbx
  40060d:   e8 5e fe ff ff          callq  400470 <printf@plt>
  400612:   49 39 dc                cmp    %rbx,%r12
  400615:   75 e9                   jne    400600 <write_vector(int*, int*, bool)+0x40>
  400617:   eb db                   jmp    4005f4 <write_vector(int*, int*, bool)+0x34>
  400619:   0f 1f 80 00 00 00 00    nopl   0x0(%rax)

我们可以看到，在函数开始时，我们检查了该值并跳转到两个可能的循环之一：

  4005cf:   84 d2                   test   %dl,%dl
  4005d1:   74 2d                   je     400600 <write_vector(int*, int*, bool)+0x40>

当然，这仅在编译器能够检测到条件是实际不变的情况下才有效。通常，它非常适合标志和简单的内联函数。但是，如果条件是“复杂的”，请考虑使用其他答案中的方法。

— 活泼的
source