内存泄漏

本页使用了标题或全文手工转换
维基百科,自由的百科全书
“memory leak”的各地常用译名
中国大陆内存泄漏
台湾记忆体流失、记忆体漏失

内存泄漏(英语:memory leak)是计算机科学中的一种资源泄漏,主因是计算机程序记忆体管理失当[1],因而失去对一段已分配内存空间的控制,程序继续占用已不再使用的内存空间,或是记忆体所储存之物件无法透过执行程式码而存取,令内存资源空耗[2]

记忆体漏失与许多其他问题情形具有相同征兆,通常只有获得程序源代码的程序员能分析诊断是否发生记忆体漏失[原创研究?]

后果[编辑]

内存泄漏会因为减少可用内存的数量从而降低计算机的性能。最终,在最糟糕的情况下,过多的可用内存被分配掉导致全部或部分设备停止正常工作,或者应用程序崩溃[3]

内存泄漏带来的后果可能是不严重的,有时甚至能够被常规的手段检测出来。在现代操作系统中,一个应用程序使用的常规内存在程序终止时被释放。这表示一个短暂运行的应用程序中的内存泄漏不会导致严重后果。

在以下情况,内存泄漏后果较严重:

  • 程序运行后置之不理,并且随着时间的流逝消耗越来越多的内存(比如服务器上的后台任务,尤其是嵌入式系统中的后台任务,这些任务可能被运行后很多年内都置之不理);
  • 新的内存被频繁地分配,比如当显示电脑游戏或动画视频画面时;
  • 程序能够请求即使在程序终止之后也不会被释放的内存(比如共享内存);
  • 泄漏在操作系统内部发生;
  • 泄漏在系统关键驱动中发生;
  • 内存非常有限,比如在嵌入式系统或便携设备中;
  • 当运行于一个程序终止时内存并不自动释放内存的操作系统(比如AmigaOS)之上时。

简例[编辑]

以下的虚构例子无需任何程式设计的知识,但能表明如何导致记忆体泄漏及其造成的影响。

在此例中的应用程式是一个简单软件的一小部分,用来控制升降机的运作。此部分软件当乘客在升降机内按下一楼层的按钮时运行。

当按下按钮时:

  1. 要求使用记忆体,用作记住目的楼层
  2. 把目的楼层的数字储存到记忆体中
  3. 升降机是否已到达目的楼层?
  4. 如是,没有任何事需要做:程式完成
  5. 否则:
  1. 等待直至升降机停止
  2. 到达指定楼层
  3. 释放刚才用作记住目的楼层的记忆体

此程式有一处会造成记忆体泄漏:如果在升降机所在楼层按下该层的按钮(即上述程序的第4步),程序将触发判断条件而结束运行,但记忆体仍一直被占用而没有被释放。这种情况发生得越多,泄漏的记忆体也越多。

这个小错误不会造成即时影响。因为人不会经常在升降机所在楼层按下同一层的按钮。而且在通常情况下,升降机应有足够的记忆体以应付上百次、上千次类似的情况。不过,升降机最后仍有可能消耗完所有记忆体。这可能需要数个月或是数年,所以在简单的测试下这个问题不会被发现。

而这个例子导致的后果会是不那么令人愉快。至少,升降机不会再理会前往其他楼层的要求。更严重的是,如果程式需要记忆体去开启升降机门,那可能有人被困升降机内,因为升降机没有足够的记忆体去开启升降机门。

记忆体泄漏只会在程式运行的时间内持续。例如:关闭升降机的电源时,程式终止运行。当电源再度开启,程式会再次运行而记忆体会重置,而这种缓慢的泄漏则会从头开始再次发生。

程式设计问题[编辑]

记忆体泄漏是程式设计中一项常见错误,特别是使用没有内置自动垃圾回收程式语言,如CC++。一般情况下,记忆体泄漏发生是因为不能存取动态分配的记忆体。目前有相当数量的调试工具用于检测不能存取的内存,从而可以防止记忆体泄漏问题,如IBM Rational Purify英语IBM Rational PurifyBoundsChecker英语BoundsCheckerValgrindInsure++英语Insure++memwatch英语memwatch都是为C/C++程式设计亦较受欢迎的记忆体除错工具。垃圾回收则可以应用到任何程式语言,而C/C++也有此类函式库。

提供自动记忆体管理的编程语言如JavaCC#VB.NET以及LISP,都不能避免记忆体泄漏。例如,程式会把项目加入至列表,但在完成时没有移除,如同人把物件丢到一堆物品中或放到抽屉内,但后来忘记取走这件物品一样。记忆体管理器不能判断项目是否将再被存取,除非程式作出一些指示表明不会再被存取。

譬如以C语言为例,在stdlib.h中提供了 malloc()、calloc()、free()等函数,在使用malloc()取得记忆体空间,则需在不需使用后free()释放,如未释放,则会产生所谓memory leakage。

虽然记忆体管理器可以回复不能存取的记忆体,但它不可以释放可存取的记忆体因为仍有可能需要使用。现代的记忆体管理器因此为程式设计员提供技术来标示记忆体的可用性,以不同级别的“存取性”表示。记忆体管理器不会把需要存取可能较高的对象释放。当对象直接和一个强引用相关或者间接和一组强引用相关表示该对象存取性较强。(强引用相对于弱引用,是防止对象被回收的一个引用。)要防止此类记忆体泄漏,开发者必须使用对象后清理引用,一般都是在不再需要时将引用设成null,如果有可能,把维持强引用的事件侦听器全部注销。

一般来说,自动记忆体管理对开发者来讲比较方便,因为他们不需要实现释放的动作,或担心清理内存的顺序,而不用考虑对象是否依然被引用。对开发者来说,了解一个引用是否有必要保持比了解一个对象是否被引用要简单得多。但是,自动记忆体管理不能消除所有的内容泄漏。

影响[编辑]

如果一个程序存在内存泄漏并且它的内存使用量稳定增长,通常不会有很快的症状。每个物理系统都有一个较大的内存量,如果内存泄漏没有被中止(比如重启造成泄漏的程序)的话,它迟早会造成问题。

大多数的现代计算机操作系统都有存储在RAM芯片中主内存和存储在次级存储设备如硬盘中的虚拟内存,内存分配是动态的——每个进程根据要求获得相应的内存。存取活跃的页面文件被转移到主内存以提高存取速度;反之,存取不活跃的页面文件被转移到次级存储设备。当一个简单的进程消耗大量的内存时,它通常占用越来越多的主内存,使其他程序转到次级存储设备,使系统的运行效率大大降低。甚至在有内存泄漏的程序终止后,其他程序需要相当长的时间才能切换到主内存,恢复原来的运行效率。

当系统所有的内存全部耗完后(包括主内存和虚拟内存,在嵌入式系统中,仅有主内存),所有申请内存的操作将失败。这通常导致程序试图申请内存来终止自己,或造成分段内存访问错误(segmentation fault)。现在有一些专门为修复这种情况而设计的程序,常用的办法是预留一些内存。值得注意的是,第一个遭遇得不到内存问题的程序有时候并不是有内存泄漏的程序。

一些多任务操作系统有特殊的机制来处理内存耗尽得情况,如随机终止一个进程(可能会终止一些正常的进程),或终止耗用内存最大的进程(很有可能是引起内存泄漏的进程)。另一些操作系统则有内存分配限制,这样可以防止任何一个进程耗用完整个系统的内存。这种设计的缺点是有时候某些进程确实需要较大数量的内存时,如一些处理图像,视频和科学计算的进程,操作系统需要重新配置。

如内存泄漏发生在内核,表示操作系统自身发生了问题。那些没有完善的内存管理的计算机,如嵌入式系统,会因为一个长时间的内存泄漏而崩溃。

一些被公众访问的系统,如网络服务器路由器很容易被黑客攻击,加入一段攻击代码,而产生内存泄漏。

其他记忆体消耗[编辑]

值得注意的是,记忆体用量持续增加不一定表明记忆体泄漏。一些应用程式会储存越来越多资料到记忆体中(如用作快取。如果快取太大引起问题,这可能是程式设计上的错误,但并非是记忆体泄漏因为资料仍被使用。另一方面,程式有可能申请不合理的大量记忆体,因为程式设计者假设记忆体总是足够运行特定的工作;例如,图像档案处理器会在开始时阅读图像档案的内容并把之储存至记忆体中,有时候由于图像档案太大,消耗的记忆体超过了可用的内存导致失败。

另一角度讲,内存泄漏是一种特殊的编程错误,如果没有源代码,根据征兆只能猜测可能有内存泄漏。在这种情况下,使用术语“内存消耗持续增加”可能更确切。

例子[编辑]

C[编辑]

下面是一个C语言的例子,在函数f()中申请了内存却没有释放,导致内存泄漏。当程式不停地重复调用这个有问题的函数f,申请内存函数malloc()最后会在程式没有更多可用记忆体可以申请时产生错误(函数输出为NULL)。但是,由于函数malloc()输出的结果没有加以出错处理,因此程式会不停地尝试申请记忆体,并且在系统有新的空闲内存时,被该程序占用。注意,malloc()返回NULL的原因不一定是因为前述的没有更多可用记忆体可以申请,也可能是逻辑地址空间耗尽,在Linux环境上测试的时候后者更容易发生。

 #include <stdio.h>
 #include <stdlib.h>

 void f(void)
 {
     void* s;
     s = malloc(50); /* 申请内存空间 */
     return;  /* 内在泄漏 - 参见以下资料 */ 
     /* 
      * s 指向新分配的堆空间。
      * 当此函数返回,离开局部变量s的作用域后将无法得知s的值,
      * 分配的内存空间不能被释放。
      *
      * 如要「修复」这个问题,必须想办法释放分配的堆空间,
      * 也可以用alloca(3)代替malloc(3)。
      * (注意:alloca(3)既不是ANSI函数也不是POSIX函数)
      */
 }
 int main(void)
 {
     /* 该函数是一个死循环函数 */
     while (true) f(); /* Malloc函数迟早会由于内存泄漏而返回NULL*/
     return 0;
 }

C++[编辑]

以下例子中,储存了整数123的内存空间不能被删除,因为地址丢失了。这些空间已无法再使用。

#include <iostream>
using namespace std;
int main()
{ 
   int *a = new int(123);
   cout << *a << endl;
   // We should write "delete a;" here
   a = new int(456);
   cout << *a << endl;
   delete a;
   return 0;
}

参阅[编辑]

参考资料[编辑]

  1. ^ Crockford, Douglas. JScript Memory Leaks. [20 July 2022]. (原始内容存档于7 December 2012). 
  2. ^ Creating a memory leak with Java. Stack Overflow. [2013-06-14]. 
  3. ^ Rudafshani, Masoomeh, and Paul A. S. Ward. "LeakSpot: Detection and Diagnosis of Memory Leaks in JavaScript Applications." Software, practice & experience 47.1 (2017): 97–123. Web.

外部链接[编辑]