之前对数组的概念一直没有理解透彻,只觉得数组名就是个常量指针而已,用法和基本的指针差不多。所以当我尝试用二级指针去访问二维数组时,就经常会出错。下面就是刚开始写的一个错误的程序:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
#include <stdio.h> int main() { int iArray[2][3] = {{1,2,3},{4,5,6}}; int **pArray = NULL; pArray = iArray; printf ( "array[0][0] = %d\n" , pArray[0][0]); printf ( "array[1][2] = %d\n" , pArray[1][2]); return 0; } |
开始的时候我是这样分析的:本来数组和指针就差不多,一维数组和一维指针对应,那么二维数组名应该和二维指针差不多,所以上面那个程序是没有错的,应该打印出的是1和6。但是当我实际编译运行的时候,却出现了段错误,也就是我访问了不该访问的地址空间。那错误到底出在什么地方呢?正确的程序应该怎么写呢?
为了解决问题,不得不让我重新理解数组的含义。仔细翻阅一些书籍后,我发现其实数组并不是我原来想象的那么简单:一个常量指针标识的一群变量的集合。数组应该也算是一个完备的变量类型:有名字,有大小,也有地址。只不多就是名字和它的地址一样罢了。也正是因为数组有大小,所以当用sizeof对数组名进行运算时,算出来的是实际数组的大小,而不是指针的大小。
也正是因为这样,所以指向数组的指针和指向指针的指针也大不一样。它们俩最明显的不同就是表现在指针步进的时候。我们知道指针在进行++运算的时候,跨越的实际地址取决于指针指向的数据类型:对于一般的32位机来说,假如指向的是int型数据,跨越的实际地址就是4,指向的是指针型数据,跨越的实际地址也是4,当指向的是数组类型的时候,跨越的实际地址就是数组的长度了。
现在再回头分析上面那个错误程序,根据下标引用符号[]的运算规则,我们知道pArray[0][0]其实就是**pArray,而iArray实际上只是个数组变量名,而它的值就是整个数组的开始地址(其实&iArray,iArray,iArray[0]以及&iArray的值都是数组的开始地址,都是在编译过程中编译器赋予的值)。那么其实*pArray就已经是iArray[0][0]的值了,也就是1,而**pArray则是去访问地址为1的地址空间中的数据,自然会出段错误。
其实用指针访问二维数组可以直接用一级指针就可以了。比如下面这个程序:
1
2
3
4
5
6
7
8
9
10
11
12
|
int main() { int iArray[2][3] = {{1,2,3},{4,5,6}}; int *pArray = NULL; pArray = iArray; printf ( "array[0][0] = %d\n" , *pArray); printf ( "array[1][2] = %d\n" , *(pArray + 1 * 3 + 2)); return 0; } |
因为数组本身在地址空间中就是连续排列的,根据行数和列数,我们自己计算出访问单元的地址偏移量就可以用一级指针轻松遍历二维数组中的所有数据了。
我们还可以尝试用指向数组的指针来访问二维数组的成员。下面就是事例程序:
1
2
3
4
5
6
7
8
9
10
11
12
|
int main() { int iArray[2][3] = {{1,2,3},{4,5,6}}; int (*pArray)[3] = NULL; pArray = iArray; printf ( "array[0][0] = %d\n" , pArray[0][0]); printf ( "array[1][2] = %d\n" , pArray[1][2]); return 0; } |
简单分析一下这个程序:我们知道[]运算符的结合方向是由左向右,pArray[1][2]就等价于(* (pArray + 1))[2],而由于pArray是数组指针,而且数组的长度为3,所以* (pArray + 1)就表示iArray[1]这个数组,则pArray[1][2]则就完全等价于iArray[1][2]。
如果非得想用二级指针来访问二维数组的话,我们还得借用指针数组(数组内存储的都是指针类型的数据),下面是事例程序:
1
2
3
4
5
6
7
8
9
10
11
12
13
|
int main() { int iArray[2][3] = {{1,2,3},{4,5,6}}; int *ipArray[2] = {iArray[0], iArray[1]}; int **pArray = NULL; pArray = ipArray; printf ( "array[0][0] = %d\n" , pArray[0][0]); printf ( "array[1][2] = %d\n" , pArray[1][2]); return 0; } |
由于二级指针要跳两次,所以中间还需要额外的存储一级指针的空间。所以一般不建议用二级指针去访问二维数组。
众所周知,指针实质就是地址!一个变量的地址即称为此变量的“指针”。如果有这样一种变量:它的存储单元里存放的是其它变量的地址!我们就称之为“指针变量”。(请注意两者之间的区别:两个完全不同的概念!)
我们都知道,数组名和函数名就是它们的入口地址。同理,一个变量名其实也是此变量的所在地址!C语言中有一种运算符为“&”:取址运算符。因为数组名与函数名本身代表的就是地址,通常不会对并且也不能对它们进行取址操作或其它运算操作(其实对于函数名的直接引用与对它取址是等价的)。这也是它们被称为“常量”的原因!但对于一个变量来讲,情况就不一样了。要想获得它的地址,就必须进行“&”运算,尽管它本身表示的也是地址值!而对变量直接进行引用得到却是它所在的内存单元的数据内容!“指针变量”作为一种变量当然也不能例外!只不过它与其它普通变量的差别是,它的内容是其它变量(包括“指针变量”)的地址,在WIN32上,它的大小恒为32位,4BYTE。而普通变量则不会有大小上的限制!对指针变量所指向的地址的数据内容的获取则是通过操作符“*”。在理解上我们将“提领操作符*”视为类型的一部分,并且这种数据类型是一种变量地址类型(均对每一个“*”而言)!
只要明白了以上常识,“指针”将不会再是程序设计中的“拦路虎”!
从内存的存储映象的角度来讲,C的规则数组(不包括通过数据结构设计的多维数组)不存在多维,也就是说所有的数组本质上都是一维的,而一级指针就等价于一维数组!关键的不同在于多维数组与一维数组语义上的差别!而我们理解多维数组通常将之形象地描述成“矩阵”形式。更为精确的理解是多维数组的每个元素就是一个数组,如此递归下去直至最后每个元素是一个简单的变量类型,最终得到的就是一个特殊的一维数组!