堆栈(外文名:stack),在计算机领域是一种数据项按序排列的数据结构。只能在一端(称为栈顶(top))对数据项进行插入和删除。在单片机应用中,堆栈是个特殊的存储区,主要功能是暂时存放数据和地址,通常用来保护断点和现场。它的一端是固定的,另一端是浮动的。堆这个存储区存入的数据,是一种特殊的数据结构。所有的数据存入或取出,只能在浮动的一端(称栈顶)进行,严格按照“先进后出”的原则存取,位于其中间的元素,必须在其栈上部(后进栈者)诸元素逐个移出后才能取出

中文名

堆栈

外文名

Stack

所属学科

计算机

定义

一种数据项按序排列的数据结构

特点

先进后出

应用

内存分配

简介

堆栈是一个特定的存储区或寄存器,它的一端是固定的,另一端是浮动的。堆这个存储区存入的数据,是一种特殊的数据结构。所有的数据存入或取出,只能在浮动的一端(称栈顶)进行,严格按照“先进后出”的原则存取,位于其中间的元素,必须在其栈上部(后进栈者)诸元素逐个移出后才能取出。在内存储器(随机存储器)中开辟一个区域作为堆栈,叫软件堆栈;用寄存器构成的堆栈,叫硬件堆栈。

单片机应用中,堆栈是个特殊存储区,堆栈属于RAM空间的一部分,堆栈用于函数调用、中断切换时保存和恢复现场数据。堆栈中的物体具有一个特性:第一个放入堆栈中的物体总是被最后拿出来,这个特性通常称为先进后出(FILO—First-In/Last-Out)。堆栈中定义了一些操作,两个最重要的是PUSH和POP。PUSH(入栈)操作:堆栈指针(SP)加1,然后在堆栈的顶部加入一个元素。POP(出栈)操作相反,出栈则先将SP所指示的内部ram单元中内容送入直接地址寻址的单元中(目的位置),然后再将堆栈指针(SP)减1。这两种操作实现了数据项的插入和删除。

对比分析

堆栈是计算机科学领域重要的数据结构,它被用于多种数值计算领域。表达式求值是编译程序中较为常见的操作,在算术表达式求值的过程中,需要使用堆栈来保存表达式的中间值和运算符,堆栈使得表达式的中间运算过程的结果访问具有了一定的自动管理能力。大部分编译型程序设计语言具有程序递归特性,递归能够增强语言的表达能力和降低程序设计难度。递归程序的递归深度通常是不确定的,需要将子程序执行的返回地址保存到堆栈这种先进后出式的结构中,以保证子程序的返回地址的正确使用顺序。函数式程序设计语言中,不同子函数的参数的种类和个数是不相同的,编译器也是使用堆栈来存储子程序的参数。

空间分配

栈(操作系统):由操作系统自动分配释放,存放函数的参数值,局部变量的值等。其操作方式类似于数据结构中的栈。

堆(操作系统):一般由程序员分配释放,若程序员不释放,程序结束时可能由OS(操作系统)回收,分配方式倒是类似于链表。

缓存方式

栈使用的是一级缓存,他们通常都是被调用时处于存储空间中,调用完毕立即释放。

堆则是存放在二级缓存中,生命周期由虚拟机的垃圾回收算法来决定(并不是一旦成为孤儿对象就能被回收)。所以调用这些对象的速度要相对来得低一些。

数据结构区别

堆(数据结构):堆可以被看成是一棵树,如:堆排序。

栈(数据结构):一种先进后出的数据结构。

例如:顺序栈AStack的类定义

template < class T >

class AStack {

private:

int size ; // 数组的规模

T * stackArray ; // 存放堆栈元素的数组

int top ; // 栈顶所在数组元素的下标

public:

AStack ( int MaxStackSize ) // 构造函数

{ size = MaxStackSize ; stackArray = new T [MaxStackSize] ; top = -1 ; }

~AStack ( ) { delete [ ] stackArray ; } // 析构函数

bool Push ( const T& item ) ; // 向栈顶压入一个元素

bool Pop ( T & item ) ; // 从栈顶弹出一个元素

bool Peek ( T & item ) const ; // 存取栈顶元素

int IsEmpty ( void ) const { return top = = -1 ; }

// 检测栈是否为空

int IsFull ( void ) const { return top   size-1 ; }

// 检测栈是否为满

void clear ( void ) { top-1 ; } // 清空栈

} ;

区别介绍

Java

1. 栈(stack)与堆(heap)都是Java用来在Ram中存放数据的地方。与C++不同,Java自动管理栈和堆,程序员不能直接地设置栈或堆。

2. 栈的优势是,存取速度比堆要快,仅次于直接位于CPU中的寄存器。但缺点是,存在栈中的数据大小与生存期必须是确定的,缺乏灵活性。另外,栈数据在多个线程或者多个栈之间是不可以共享的,但是在栈内部多个值相等的变量是可以指向一个地址的,详见第3点。堆的优势是可以动态地分配内存大小,生存期也不必事先告诉编译器,Java的垃圾收集器会自动收走这些不再使用的数据。但缺点是,由于要在运行时动态分配内存,存取速度较慢。

3.Java中的数据类型有两种。

一种是基本类型(primitivetypes),共有8种,即int,short,long,byte,float,double,boolean,char(注意,并没有string的基本类型)。这种类型的定义是通过诸如int a=3;long b=255L;的形式来定义的,称为自动变量。值得注意的是,自动变量存的是字面值,不是类的实例,即不是类的引用,这里并没有类的存在。如int a=3;这里的a是一个指向int类型的引用,指向3这个字面值。这些字面值的数据,由于大小可知,生存期可知(这些字面值固定定义在某个程序块里面,程序块退出后,字段值就消失了),出于追求速度的原因,就存在于栈中。

另外,栈有一个很重要的特殊性,就是存在栈中的数据可以共享。假设我们同时定义:

1

2

int a=3;

int b=3;

编译器先处理int a=3;首先它会在栈中创建一个变量为a的内存空间,然后查找有没有字面值为3的地址,没找到,就开辟一个存放3这个字面值的地址,然后将a指向3的地址。接着处理int b=3;在创建完b的引用变量后,由于在栈中已经有3这个字面值,便将b直接指向3的地址。这样,就出现了a与b同时均指向3的情况。

特别注意的是,这种字面值的引用与类对象的引用不同。假定两个类对象的引用同时指向一个对象,如果一个对象引用变量修改了这个对象的内部状态,那么另一个对象引用变量也即刻反映出这个变化。相反,通过字面值的引用来修改其值,不会导致另一个指向此字面值的引用的值也跟着改变的情况。如上例,我们定义完a与b的值后,再令a=4;那么,b不会等于4,还是等于3。在编译器内部,遇到a=4;时,它就会重新搜索栈中是否有4的字面值,如果没有,重新开辟地址存放4的值;如果已经有了,则直接将a指向这个地址。因此a值的改变不会影响到b的值。

另一种是包装类数据,【如Integer,String, Double等将相应的基本数据类型包装起来的类。这些类数据全部存在于【堆】中】,Java用new()语句来显示地告诉编译器,在运行时才根据需要动态创建,因此比较灵活,但缺点是要占用更多的时间。4.String是一个特殊的包装类数据。即可以用String str = new String("abc");的形式来创建,也可以用String str="abc";的形式来创建(作为对比,在JDK 5.0之前,你从未见过Integer i = 3;的表达式,因为类与字面值是不能通用的,除了String。而在JDK5.0中,这种表达式是可以的!因为编译器在后台进行Integer i = new Integer(3)的转换)。前者是规范的类的创建过程,即在Java中,一切都是对象,而对象是类的实例,全部通过new()的形式来创建。Java中的有些类,如DateFormat类,可以通过该类的getInstance()方法来返回一个新创建的类,似乎违反了此原则。其实不然。该类运用了单例模式来返回类的实例,只不过这个实例是在该类内部通过new()来创建的,而getInstance()向外部隐藏了此细节。那为什么在String str = "abc";中,并没有通过new()来创建实例,是不是违反了上述原则?其实没有。

4. 关于String str ="abc"的内部工作。Java内部将此语句转化为以下几个步骤:【String str ="abc",String str不要连着】

(1)先定义一个名为str的对String类的对象引用变量:String str;

(2)【在【栈】中查找有没有存放值为"abc"的地址,如果没有,则开辟一个存放字面值为"abc"的地址,接着创建一个新的String类的对象o,并将o的字符串值指向这个地址,而且在栈中这个地址旁边记下这个引用的对象o。如果已经有了值为"abc"的地址,则查找对象o,并返回o的地址。】【上文说数据时存放在堆中,此文说数据存放在栈中】[因为此处不是通过new()创建的啊]

(3)将str指向对象o的地址。

值得注意的是,一般String类中字符串值都是直接存值的。但像String str="abc";这种场合下,其字符串值却是保存了一个指向存在栈中数据的引用!

为了更好地说明这个问题,我们可以通过以下的几个代码进行验证。

复制内容到剪贴板代码:

1

2

3

String str1="abc";

String str2="abc";

System.out.println(str1==str2);//true

注意,我们这里并不用str1.equals(str2);的方式,因为这将比较两个字符串的值是否相等。==号,根据JDK的说明,只有在两个引用都指向了同一个对象时才返回真值。而我们在这里要看的是,str1与str2是否都指向了同一个对象。

结果说明,JVM创建了两个引用str1和str2,但只创建了一个对象,而且两个引用都指向了这个对象。

我们再来更进一步,将以上代码改成:

复制内容到剪贴板代码:

1

2

3

4

5

String str1="abc";

String str2="abc";

str1="bcd";

System.out.println(str1+","+str2);//bcd,abc

System.out.println(str1==str2);//false

这就是说,赋值的变化导致了类对象引用的变化,str1指向了另外一个新对象!而str2仍旧指向原来的对象。上例中,当我们将str1的值改为"bcd"时,JVM发现在栈中没有存放该值的地址,便开辟了这个地址,并创建了一个新的对象,其字符串的值指向这个地址。

事实上,String类被设计成为不可改变(immutable)的类。如果你要改变其值,可以,但JVM在运行时根据新值悄悄创建了一个新对象,然后将这个对象的地址返回给原来类的引用。这个创建过程虽说是完全自动进行的,但它毕竟占用了更多的时间。在对时间要求比较敏感的环境中,会带有一定的不良影响。

再修改原来代码:

复制内容到剪贴板代码:

1

2

3

4

5

6

7

String str1="abc";

String str2="abc";

str1="bcd";

String str3=str1;

System.out.println(str3);//bcd

String str4="bcd";

System.out.println(str1==str4);//true

我们再接着看以下的代码。

复制内容到剪贴板代码:

String str1 = new String("abc");

String str2 = "abc";

System.out.println(str1==str2); //false

String str1 = "abc";

String str2 = new String("abc");

System.out.println(str1==str2); //false

创建了两个引用。创建了两个对象。两个引用分别指向不同的两个对象。

以上两段代码说明,只要是用new()来新建对象的,都会在堆中创建,而且其字符串是单独存值的,即使与栈中的数据相同,也不会与栈中的数据共享。

5. 数据类型包装类的值不可修改。不仅仅是String类的值不可修改,所有的数据类型包装类都不能更改其内部的值。

6. 结论与建议:

(1)我们在使用诸如String str ="abc";的格式定义类时,总是想当然地认为,我们创建了String类的对象str。担心陷阱!对象可能并没有被创建。可以肯定的是,指向String类的引用被创建了。至于这个引用到底是否指向了一个新的对象,必须根据上下文来考虑,除非你通过new()方法来显要地创建一个新的对象。因此,更为准确的说法是,我们创建了一个指向String类的对象的引用变量str,这个对象引用变量指向了某个值为"abc"的String类。清醒地认识到这一点对排除程序中难以发现的bug是很有帮助的。

(2)使用String str ="abc";的方式,可以在一定程度上提高程序的运行速度,因为JVM会自动根据栈中数据的实际情况来决定是否有必要创建新对象。而对于Stringstr = new String("abc");的代码,则一概在堆中创建新对象,而不管其字符串值是否相等,是否有必要创建新对象,从而加重了程序的负担。这个思想应该是享元模式的思想,但JDK的内部在这里实现是否应用了这个模式,不得而知。

(3)当比较包装类里面的数值是否相等时,用equals()方法;当测试两个包装类的引用是否指向同一个对象时,用==。

(4)由于String类的immutable性质,当String变量需要经常变换其值时,应该考虑使用StringBuffer类,以提高程序效率

C/C++

一个由C/C++编译的程序占用的内存分为以下几个部分

1、栈区(stack)—由编译器自动分配释放,存放函数的参数名,局部变量的名等。其操作方式类似于数据结构中的栈。

2、堆区(heap)—由程序员分配释放,若程序员不释放,程序结束时可能由OS回收。注意它与数据结构中的堆是两回事,分配方式倒是类似于链表。

3、静态区(static)—全局变量和局部静态变量的存储是放在一块的。程序结束后由系统释放。

4、文字常量区—常量字符串就是放在这里的,程序结束后由系统释放。

5、程序代码区—存放函数体的二进制代码。

变量的存储方式

存储描述

持续性/作用域

链接性/如何声明

自动

代码块/代码块

无/在代码块中

寄存器

自动/代码块

无/在代码块中,使用关键字 register

静态,无链接性

静态/代码块

无/在代码块中,使用关键字 static

静态,外部链接性

静态/文件

外部/不在任何函数内

静态,内部链接性

静态/文件

内部/不在任何函数内,使用关键字 static

首先,定义静态变量时如果没有初始化编译器会自动初始化为0.。接下来,如果是使用常量表达式初始化了变量,则编译器仅根据文件内容(包括被包含的头文件)就可以计算表达式,编译器将执行常量表达式初始化。必要时,编译器将执行简单计算。如果没有足够的信息,变量将被动态初始化。请看一下代码:

1

int global_1=1000;//静态变量外部链接性常量表达式初始化

2

int global_2;//静态变量外部链接性零初始化

3

static int one_file_1=1000;//静态变量内部链接性常量表达式初始化

4

static int one_file_2;//静态变量内部链接性零初始化

5

int main()

6

{

7

static int count_1=1000;//静态变量无链接性常量表达式初始化

8

static int count_2;//静态变量无链接性零初始化

9

return 0;

10

}

所有的静态持续变量都有下述初始化特征:未被初始化的静态变量的所有位都被设为0。这种变量被称为零初始化。以上代码说明关键字static的两种用法,但含义有些不同:用于局部声明,以指出变量是无链接性的静态变量时,static表示的是存储持续性;而用于代码块外声明时,static表示内部链接性,而变量已经是静态持续性了。有人称之为关键字重载,即关键字的含义取决于上下文。

理论知识

申请方式

stack:

由系统自动分配。例如,声明在函数中一个局部变量int b;系统自动在栈中为b开辟空间。

heap:

需要程序员自己申请,并指明大小,在c中malloc函数

如p1 = (char *)malloc(10);

在C++中用new运算符

如p2 = new char[10];//(char *)malloc(10);

但是注意p1、p2本身是在栈中的。

申请响应

栈:只要栈的剩余空间大于所申请空间,系统将为程序提供内存,否则将报异常提示栈溢出。

堆:首先应该知道操作系统有一个记录空闲内存地址的链表,当系统收到程序的申请时,会遍历该链表,寻找第一个空间大于所申请空间的堆结点,然后将该结点从空闲结点链表中删除,并将该结点的空间分配给程序,另外,对于大多数系统,会在这块内存空间中的首地址处记录本次分配的大小,这样,代码中的delete语句才能正确的释放本内存空间。另外,由于找到的堆结点的大小不一定正好等于申请的大小,系统会自动的将多余的那部分重新放入空闲链表中。

申请限制

栈:在Windows下,栈是向低地址扩展的数据结构,是一块连续的内存的区域。这句话的意思是栈顶的地址和栈的最大容量是系统预先规定好的,在WINDOWS下,栈的大小是2M(也有的说是1M,总之是一个编译时就确定的常数),如果申请的空间超过栈的剩余空间时,将提示overflow。因此,能从栈获得的空间较小。

堆:堆是向高地址扩展的数据结构,是不连续的内存区域。这是由于系统是用链表来存储的空闲内存地址的,自然是不连续的,而链表的遍历方向是由低地址向高地址。堆的大小受限于计算机系统中有效的虚拟内存。由此可见,堆获得的空间比较灵活,也比较大。

效率比较

栈由系统自动分配,速度较快。但程序员是无法控制的。

堆是由new分配的内存,一般速度比较慢,而且容易产生内存碎片,不过用起来最方便。

另外,在WINDOWS下,最好的方式是用VirtualAlloc分配内存,他不是在堆,也不是在栈,而是直接在进程的地址空间中保留一块内存,虽然用起来最不方便。但是速度快,也最灵活

存储内容

栈:在函数调用时,在大多数的C编译器中,参数是由右往左入栈的,然后是函数中的局部变量。注意静态变量是不入栈的。

当本次函数调用结束后,局部变量先出栈,然后是参数,最后栈顶指针指向函数的返回地址,也就是主函数中的下一条指令的地址,程序由该点继续运行。

堆:一般是在堆的头部用一个字节存放堆的大小。堆中的具体内容由程序员安排。

存取比较

char s1[] ="aaaaaaaaaaaaaaa";

char *s2 ="bbbbbbbbbbbbbbbbb";

aaaaaaaaaaa是在运行时刻赋值的;

而bbbbbbbbbbb是在编译时就确定的;

但是,在以后的存取中,在栈上的数组比指针所指向的字符串(例如堆)快。

比如:

1

2

3

4

5

6

7

8

9

10

#include

void main()

{

char a = 1;

char c[] = "1234567890";

char *p ="1234567890";

a = c[1];

a = p[1];

return;

}

对应的汇编代码

10: a = c[1];

00401067 8A 4D F1 mov cl,byte ptr [ebp-0Fh]

0040106A 88 4D FC mov byte ptr [ebp-4],cl

11: a = p[1];

0040106D 8B 55 EC mov edx,dword ptr [ebp-14h]

00401070 8A 42 01 mov al,byte ptr [edx+1]

00401073 88 45 FC mov byte ptr [ebp-4],al

第一种在读取时直接就把字符串中的元素读到寄存器cl中,而第二种则要先把指针值读到edx中,再根据edx读取字符,显然慢了。

小结

堆和栈的区别可以用如下的比喻来看出:

使用栈就象我们去饭馆里吃饭,只管点菜(发出申请)、付钱、和吃(使用),吃饱了就走,不必理会切菜、洗菜等准备工作和洗碗、刷锅等扫尾工作,他的好处是快捷,但是自由度小。使用堆就象是自己动手做喜欢吃的菜肴,比较麻烦,但是比较符合自己的口味,而且自由度大。

堆栈处理器

堆栈处理器是由堆栈式程序设计语言Forth演化而来的一种处理器,它继承了Forth语言的双堆栈结构和堆栈操作原语。Forth定义了堆栈处理器的主要体系结构状态和指令集风格。Forth语言定义了两个下推式堆栈,它们提供了Forth原语操作所需的源数据、目的数据和程序控制数据,它们是数据栈和返回栈。两个栈在结构上完全相同,但它们的用途却大不相同。数据栈指出了算术逻辑运算的源操作数和目标操作数、子程序调用的参数和主调程序的数据现场。返回栈具有辅助堆栈和保存子程序调用的返回地址的功能。

堆栈处理器的指令可以分为四类:算术逻辑运算、堆栈调整、程序分支和存储器访问。堆栈指令集与常见的RISC处理器指令集的不同是指令的寻址方式,堆栈指令多为默认寻址方式,指令操作数的地址被处理器设定为某一个既定的堆栈位置,不需要将地址信息存放于指令中。这种方式增加了堆栈处理器的指令压缩度,但固定的操作数地址会使得指令的操作数指定不够灵活,堆栈处理器中设计了能够调整堆栈中数据存放顺序的堆栈调整指令。堆栈调整指令可以在同一堆栈内部和堆栈间调整数据的位置,堆栈调整指令和堆栈的先进后出特性使得堆栈中特定位置的数据可以灵活地改变。

堆栈处理器也是基于简单性哲学的处理器,但是它更加深入的践行了简单性哲学。首先堆栈处理器的具有更简短的指令格式,一个指令字可以包含的指令条数更多,指令更加紧凑。堆栈指令的操作数大部分是采用默认寻址,如:算术运算的操作数为数据堆栈的栈顶和次栈顶,操作数无需直接指定。省略了操作数信息,堆栈指令长度可以变得非常短。其次,堆栈处理器的每一条指令所完成的功能都非常简单,这使得它的每一条指令都可以在一个机器周期内完成。对于较复杂的功能,堆栈处理器将它分解为多个简单操作指令来完成,这使得堆栈处理器可以在不使用流水线技术的情况下,依然可以有很高的指令吞吐率。再次,紧凑的指令结构使得堆栈处理器无需使用缓冲技术来缓解处理器与存储器在速度上的差异。堆栈处理器的指令长度都很短,一个机器字中通常可以存储两到三条指令,所以处理器一次可以同时取出多条指令,每执行两到三条指令才进行一次取指令操作,这就允许堆栈处理器的速度是存储器的数倍,而不会产生等待访存的情形。最后,堆栈处理器内置的硬件堆栈和优异的堆栈操作性能使得它具有了快速的子程序调用和返回能力。堆栈处理器的指令操作都是基于堆栈的,它进行子程序调用时,只需要保存子程序的返回地址,不需要进行数据现场保护,因为程序的数据现场就天然地存储在数据堆栈中。堆栈处理器中的堆栈除了进行程序现场保护和数值运算,它还可被用来存放子程序参数和返回值,堆栈存放参数和返回值的好处是它能适应程序参数和返回值个数的变化。