我有以下代码。
#include <iostream>
int * foo()
{
int a = 5;
return &a;
}
int main()
{
int* p = foo();
std::cout << *p;
*p = 8;
std::cout << *p;
}
并且代码仅在没有运行时异常的情况下运行!
输出是 58
怎么会这样?局部变量的存储不是在其功能之外不可访问的吗?
我有以下代码。
#include <iostream>
int * foo()
{
int a = 5;
return &a;
}
int main()
{
int* p = foo();
std::cout << *p;
*p = 8;
std::cout << *p;
}
并且代码仅在没有运行时异常的情况下运行!
输出是 58
怎么会这样?局部变量的存储不是在其功能之外不可访问的吗?
Answers:
怎么会这样?局部变量的存储不是在其功能之外不可访问的吗?
您租了旅馆房间。您将一本书放在床头柜的顶部抽屉中,然后入睡。您第二天早上退房,但是“忘记了”退还您的钥匙。您偷了钥匙!
一周后,您返回酒店,不办理入住手续,用偷来的钥匙偷偷进入旧房间,然后看向抽屉。你的书还在那里。惊人!
怎么可能?如果您没有租房,不是不是无法进入酒店房间抽屉的内容吗?
好吧,显然,这种情况可以在现实世界中发生,没有问题。当您不再被授权进入房间时,没有任何神秘的力量会使您的书消失。也没有一种神秘的力量阻止您使用失窃的钥匙进入房间。
不需要酒店管理人员删除您的书。您没有与他们订立合同,说如果您留下东西,他们会为您切碎。如果您使用偷来的钥匙非法重新进入房间以将其取回,则无需酒店安全人员抓到您潜行。您没有与他们订立合同,说“如果我尝试潜入我的房间,房间过后,您必须阻止我。” 相反,您与他们签订了一份合同,上面写着“我保证以后不会再潜入我的房间”,这是您违反的合同。
在这种情况下,任何事情都可能发生。这本书可以在那里-您很幸运。可能有人的书在那里,而您的书可能在酒店的炉子里。当您进来时,有人可能会在那里,将您的书撕成碎片。该酒店本可以删除桌子并完全预订,然后用衣柜代替。整个酒店可能会被拆毁,取而代之的是一个足球场,而当您潜行时,您将在爆炸中丧生。
您不知道会发生什么;当您退房并偷走了以后非法使用的钥匙时,您放弃了生活在可预测的安全世界中的权利,因为您选择了违反系统规则。
C ++不是安全的语言。它将乐意让您打破系统规则。如果您尝试做一些非法和愚蠢的事情,例如回到没有权限的房间,或者翻阅一张可能根本不在那儿的桌子,那么C ++不会阻止您。比C ++更安全的语言通过限制您的力量来解决此问题-例如,通过对键进行更严格的控制。
天哪,这个答案引起了很多关注。(我不确定为什么-我认为这只是一个“有趣”的小类比,但无论如何。)
我认为用一些其他技术思想来对此进行更新可能是很紧要的。
编译器负责生成代码,该代码管理该程序处理的数据的存储。生成代码来管理内存的方法有很多,但是随着时间的流逝,已经确立了两种基本技术。
第一种是具有某种“长寿”的存储区域,在该区域中,存储中每个字节的“生存期”(即与某个程序变量有效关联的时间段)无法轻易地预先预测时间。编译器生成对“堆管理器”的调用,该堆管理器知道如何在需要时动态分配存储,并在不再需要时回收存储。
第二种方法是拥有一个“短暂的”存储区域,其中每个字节的生存期众所周知。在此,生命周期遵循“嵌套”模式。这些短期变量中寿命最长的变量将在任何其他短期变量之前分配,最后释放。寿命较短的变量将在寿命最长的变量之后分配,并在它们之前被释放。这些寿命较短的变量的寿命被“嵌套”在寿命较长的变量的寿命之内。
局部变量遵循后一种模式;输入方法后,其局部变量将生效。当该方法调用另一个方法时,新方法的局部变量将生效。在第一个方法的局部变量失效之前,它们将失效。可以提前确定与局部变量关联的存储生命周期的开始和结束的相对顺序。
由于这个原因,局部变量通常作为“堆栈”数据结构上的存储生成,因为堆栈具有的属性是,首先要压入的堆栈将是最后弹出的堆栈。
就像酒店决定只按顺序出租房间一样,只有在房间号高于您所选择的每个人之前,您都无法退房。
因此,让我们考虑一下堆栈。在许多操作系统中,每个线程获得一个堆栈,并且该堆栈被分配为一定的固定大小。当您调用一个方法时,东西被压入堆栈。如果您随后将指针传递回方法之外的栈,就像原始海报在这里所做的那样,那仅仅是指向某个完全有效的百万字节内存块中间的指针。打个比方,您从酒店退房;当您这样做时,您只是从编号最高的占用房间中退出。如果没有其他人在您之后入住,并且您非法返回您的房间,则可以保证所有物品仍在该特定酒店中。
我们将堆栈用于临时存储,因为它们确实便宜又容易。不需要使用C ++的实现就可以使用堆栈来存储本地对象;它可以使用堆。事实并非如此,因为那会使程序变慢。
不需要C ++的实现即可使您留在堆栈上的垃圾保持不变,以便以后可以非法返回它;编译器生成将刚腾出的“房间”中的所有内容都归零的代码是完全合法的。并不是因为这又会很昂贵。
不需要C ++的实现来确保在逻辑上缩小堆栈时,曾经有效的地址仍会映射到内存中。该实现被允许告诉操作系统“我们现在已经完成了使用该堆栈的页面。除非另行说明,否则如果有人触摸先前有效的堆栈页面,则发出一个异常,该异常会破坏进程”。再次,实现实际上并没有这样做,因为它很慢且不必要。
取而代之的是,实现使您犯错并摆脱错误。大多数时候。直到一天,真正可怕的事情出了问题,整个过程爆炸了。
这是有问题的。有很多规则,很容易意外地打破它们。我当然有很多次。更糟糕的是,问题通常仅在损坏发生后检测到内存损坏数十亿纳秒时才浮出水面,而很难弄清是谁弄乱了内存。
更多的内存安全语言通过限制您的能力来解决此问题。在“普通” C#中,根本没有办法获取本地地址并将其返回或存储以供以后使用。您可以使用本地地址,但是语言设计巧妙,因此在本地生命周期结束后无法使用它。为了获取本地地址并将其传递回去,您必须将编译器置于特殊的“不安全”模式,并将 “不安全”一词放入程序中,以引起注意以下事实:可能违反规则的危险。
进一步阅读:
如果C#允许返回引用怎么办?巧合的是,这是今天的博客文章的主题:
https://ericlippert.com/2011/06/23/ref-returns-and-ref-locals/
为什么我们使用堆栈来管理内存?C#中的值类型是否始终存储在堆栈中?虚拟内存如何工作?还有更多有关C#内存管理器如何工作的主题。这些文章中有许多也与C ++程序员紧密相关:
您在这里所做的只是读取和写入曾经是的地址的内存a
。现在您不在foo
,它只是指向某个随机内存区域的指针。碰巧的是,在您的示例中,该内存区域确实存在,并且目前没有其他人在使用它。您不会通过继续使用而破坏任何东西,并且还没有其他东西覆盖它。因此,5
仍然存在。在实际的程序中,该内存将几乎立即被重用,并且这样做会破坏某些功能(尽管症状可能要等到很久以后才会出现!)
当你从 foo
,您告诉操作系统您不再使用该内存,可以将其重新分配给其他内存。如果您很幸运,但是它从未被重新分配,并且操作系统没有抓住您再次使用它的机会,那么您将可以摆脱谎言。尽管您最终可能会写满以该地址结尾的其他内容,但很有可能。
现在,如果您想知道为什么编译器没有抱怨,那可能是因为foo
优化导致了淘汰。通常会警告您这种事情。C假定您知道自己在做什么,但从技术上讲,您在这里没有违反范围(在a
之外没有引用其自身foo
),只有内存访问规则,它仅触发警告而不是错误。
简而言之:这通常不起作用,但有时会偶然。
因为存储空间尚未增加。不要指望这种行为。
对所有答案的补充:
如果您这样做:
#include<stdio.h>
#include <stdlib.h>
int * foo(){
int a = 5;
return &a;
}
void boo(){
int a = 7;
}
int main(){
int * p = foo();
boo();
printf("%d\n",*p);
}
输出可能是:7
这是因为从foo()返回后,堆栈被释放,然后由boo()重用。如果您对可执行文件进行反汇编,则会清楚看到它。
boo
重用foo
堆栈?函数堆栈不是彼此分开的,我在Visual Studio 2015上运行此代码也很垃圾
foo()
,存在,然后下降为boo()
。 Foo()
并且Boo()
都在同一位置堆栈指针进入。但是,这不是应该依赖的行为。其他“东西”(如中断,或操作系统)可以使用的调用之间的堆栈boo()
和foo()
,修改它的内容...
在C ++中,您可以访问任何地址,但这并不意味着您应该。您正在访问的地址不再有效。它的工作原理,因为没有别的炒内存FOO后返回,但它可能在很多情况下崩溃。尝试使用Valgrind分析您的程序,甚至只是对其进行优化编译,然后查看...
您永远不会通过访问无效的内存而引发C ++异常。您只是在举例说明引用任意内存位置的一般思路。我可以这样做:
unsigned int q = 123456;
*(double*)(q) = 1.2;
在这里,我只是将123456当作double的地址并写入它。可能发生任何事情:
q
实际上可能实际上是double的有效地址,例如double p; q = &p;
。q
可能指向分配的内存中的某个地方,而我只是覆盖其中的8个字节。 q
点在分配的内存之外,操作系统的内存管理器向我的程序发送一个分段错误信号,导致运行时终止该程序。 设置方式将返回的地址指向内存的有效区域更为合理,因为它可能位于堆栈的更下方,但它仍然是无效的位置,您无法在其中访问确定性时尚。
在正常程序执行期间,没有人会像您那样自动检查内存地址的语义有效性。但是,诸如此类的内存调试器valgrind
会很乐意这样做,因此您应该通过它运行程序并见证错误。
4) I win the lottery
您是否在启用优化程序的情况下编译了程序?该foo()
函数非常简单,可能已在结果代码中内联或替换了该函数。
但是我同意Mark B的观点,即行为是不确定的。
5
将会更改...
您的问题与范围无关。在你展示的代码,该功能main
并没有看到在函数的名称foo
,所以你不能访问a
foo中直接与该名之外foo
。
您遇到的问题是,为什么程序在引用非法内存时没有发出错误信号。这是因为C ++标准没有在非法内存和合法内存之间指定非常明确的界限。引用弹出堆栈中的某些内容有时会导致错误,有时则不会。这取决于。不要指望这种行为。假定在编程时它总是会导致错误,但是假定在调试时它永远不会提示错误。
您只是返回了一个内存地址,这是允许的,但可能是错误。
是的,如果您尝试取消引用该内存地址,则将具有未定义的行为。
int * ref () {
int tmp = 100;
return &tmp;
}
int main () {
int * a = ref();
//Up until this point there is defined results
//You can even print the address returned
// but yes probably a bug
cout << *a << endl;//Undefined results
}
cout
。*a
指向未分配(释放)的内存。即使您不取消引用它,它仍然是危险的(并且可能是虚假的)。
之所以起作用,是因为自将a放入堆栈以来,堆栈尚未更改(但尚未更改)。在a
再次访问之前调用一些其他函数(也在调用其他函数),您可能不会再那么幸运了……;-)
在典型的编译器实现中,您可以将代码视为“ 用以前被a占用的地址打印出内存块的值”。另外,如果您向包含局部函数的函数添加新的函数调用,int
则很有可能a
(或a
更改用于指向)的值。发生这种情况是因为堆栈将被包含不同数据的新帧覆盖。
但是,这是未定义的行为,您不应依靠它来工作!
a
,指针保留的地址a
。尽管该标准不要求实现在其目标生命周期结束后定义地址的行为,但该标准还认识到在某些平台上,UB是按照环境特征的书面方式进行处理的。尽管局部变量的地址超出范围后通常不会有太大用处,但某些其他类型的地址在其各自目标的生存期之后可能仍然有意义。
realloc
与返回值进行比较,也不允许对指向旧块内地址的指针进行调整以指向新的指针,但是某些实现却这样做,并且利用这种功能的代码可能比必须避免采取任何行动(甚至是比较)的代码(包括涉及指向分配给该指针的代码)的效率更高realloc
。
从函数返回后,所有标识符都会被破坏,而不是将值保留在内存位置中,并且如果没有标识符,我们将无法定位这些值。但是该位置仍然包含先前函数存储的值。
因此,这里的函数foo()
返回的是地址,a
并且a
在返回其地址后被销毁。您可以通过该返回地址访问修改后的值。
让我以现实世界为例:
假设某人将钱藏在某个地点,然后告诉您该地点。一段时间后,告诉您钱款所在地的那个人去世了。但是您仍然可以使用这些隐藏的资金。
您的代码很有风险。您正在创建一个局部变量(在函数结束后将其视为破坏),并且在对该变量进行存储之后返回该变量的内存地址。
这意味着内存地址可能有效或无效,并且您的代码将很容易受到可能的内存地址问题(例如分段错误)的影响。
这意味着您正在做一件非常糟糕的事情,因为您根本无法信任将内存地址传递给指针的指针。
请考虑以下示例,并对其进行测试:
int * foo()
{
int *x = new int;
*x = 5;
return x;
}
int main()
{
int* p = foo();
std::cout << *p << "\n"; //better to put a new-line in the output, IMO
*p = 8;
std::cout << *p;
delete p;
return 0;
}
与您的示例不同,在此示例中,您是:
new
。
new
。您正在教他们使用new
。但是您不应该使用new
。
new
在2019年(除非您正在编写库代码),也不要教新手这样做!干杯。
address of local variable ‘a’ returned
;valgrind节目Invalid write of size 4 [...] Address 0xbefd7114 is just below the stack ptr