阅读:0

Go语言指针详解,看这一篇文章就够了

指针(pointer)概念在 Go 语言中被拆分为两个核心概念:
  • 类型指针,允许对这个指针类型的数据进行修改。传递数据使用指针,而无须拷贝数据。类型指针不能进行偏移和运算。
  • 切片,由指向起始元素的原始指针、元素数量和容量组成。

受益于这样的约束和拆分,Go 语言的指针类型变量拥有指针的高效访问,但又不会发生指针偏移,从而避免非法修改关键性数据问题。同时,垃圾回收也比较容易对不会发生偏移的指针进行检索和回收。

切片比原始指针具备更强大的特性,更为安全。切片发生越界时,运行时会报出宕机,并打出堆栈,而原始指针只会崩溃。

C/C++中的指针

说到 C/C++ 中的指针,会让许多人“谈虎色变”,尤其对指针偏移、运算、转换都非常恐惧。

其实,指针是使 C/C++ 语言有极高性能的根本,在操作大块数据和做偏移时方便又便捷。因此,操作系统依然使用C语言及指针特性进行编写。

C/C++ 中指针饱受诟病的根本原因是指针运算和内存释放。

C/C++ 语言中的裸指针可以自由偏移,甚至可以在某些情况下偏移进入操作系统核心区域。我们的计算机操作系统经常需要更新、修复漏洞的本质,是为解决指针越界访问所导致的“缓冲区溢出”。

要明白指针,需要知道几个概念:指针地址、指针类型和指针取值,下面将展开细说。

认识指针地址和指针类型

每个变量在运行时都拥有一个地址,这个地址代表变量在内存中的位置。Go 语言中使用&作符放在变量前面对变量进行“取地址”操作。

格式如下:

ptr := &v    // v的类型为T

其中 v 代表被取地址的变量,被取地址的 v 使用 ptr 变量进行接收,ptr 的类型就为*T,称做 T 的指针类型。*代表指针。

指针实际用法,通过下面的例子了解:
package main

import (
    "fmt"
)

func main() {
    var cat int = 1
    var str string = "banana"
    fmt.Printf("%p %p", &cat, &str)
}
运行结果:
0xc042052088 0xc0420461b0

代码说明如下:
  • 第 8 行,声明整型 cat 变量。
  • 第 9 行,声明字符串 str 变量。
  • 第 10 行,使用 fmt.Printf 的动词%p输出 cat 和 str 变量取地址后的指针值,指针值带有0x的十六进制前缀。

输出值在每次运行是不同的,代表 cat 和 str 两个变量在运行时的地址。

在 32 位平台上,将是 32 位地址;64 位平台上是 64 位地址。

提示:变量、指针和地址三者的关系是:每个变量都拥有地址,指针的值就是地址。

从指针获取指针指向的值

在对普通变量使用&操作符取地址获得这个变量的指针后,可以对指针使用*操作,也就是指针取值,代码如下。
package main

import (
    "fmt"
)

func main() {

    // 准备一个字符串类型
    var house = "Malibu Point 10880, 90265"

    // 对字符串取地址, ptr类型为*string
    ptr := &house

    // 打印ptr的类型
    fmt.Printf("ptr type: %Tn", ptr)

    // 打印ptr的指针地址
    fmt.Printf("address: %pn", ptr)

    // 对指针进行取值操作
    value := *ptr

    // 取值后的类型
    fmt.Printf("value type: %Tn", value)

    // 指针取值后就是指向变量的值
    fmt.Printf("value: %sn", value)

}
运行结果:
ptr type: *string
address: 0xc0420401b0
value type: string
value: Malibu Point 10880, 90265

代码说明如下:
  • 第 10 行,准备一个字符串并赋值。
  • 第 13 行,对字符串取地址,将指针保存到 ptr 中。
  • 第 16 行,打印 ptr 变量的类型,类型为 *string。
  • 第 19 行,打印 ptr 的指针地址,每次运行都会发生变化。
  • 第 22 行,对 ptr 指针变量进行取值操作,value 变量类型为 string。
  • 第 25 行,打印取值后 value 的类型。
  • 第 28 行,打印 value 的值。

取地址操作符&和取值操作符*是一对互补操作符,&取出地址,*根据地址取出地址指向的值。

变量、指针地址、指针变量、取地址、取值的相互关系和特性如下:
  • 对变量进行取地址(&)操作,可以获得这个变量的指针变量。
  • 指针变量的值是指针地址。
  • 对指针变量进行取值(*)操作,可以获得指针变量指向的原变量的值。

使用指针修改值

通过指针不仅可以取值,也可以修改值。

前面已经使用多重赋值的方法进行数值交换,使用指针同样可以进行数值交换,代码如下:
package main

import "fmt"

// 交换函数
func swap(a, b *int) {

    // 取a指针的值, 赋给临时变量t
    t := *a

    // 取b指针的值, 赋给a指针指向的变量
    *a = *b

    // 将a指针的值赋给b指针指向的变量
    *b = t
}

func main() {

// 准备两个变量, 赋值1和2
    x, y := 1, 2

    // 交换变量值
    swap(&x, &y)

    // 输出变量值
    fmt.Println(x, y)
}
运行结果:
2 1

代码说明如下:
  • 第 6 行,定义一个交换函数,参数为 a、b,类型都为 *int,都是指针类型。
  • 第 9 行,将 a 指针取值,把值(int类型)赋给 t 变量,t 此时也是 int 类型。
  • 第 12 行,取 b 指针值,赋给 a 变量指向的变量。注意,此时*a的意思不是取 a 指针的值,而是“a指向的变量”。
  • 第 15 行,将 t 的值赋给 b 指向的变量。
  • 第 21 行,准备 x、y 两个变量,赋值 1 和 2,类型为 int。
  • 第 24 行,取出 x 和 y 的地址作为参数传给 swap() 函数进行调用。
  • 第 27 行,交换完毕时,输出 x 和 y 的值。

*操作符作为右值时,意义是取指针的值;作为左值时,也就是放在赋值操作符的左边时,表示 a 指向的变量。其实归纳起来,*操作符的根本意义就是操作指针指向的变量。当操作在右值时,就是取指向变量的值;当操作在左值时,就是将值设置给指向的变量。

如果在 swap() 函数中交换操作的是指针值,会发生什么情况?可以参考下面代码:
package main

import "fmt"

func swap(a, b *int) {
    b, a = a, b
}

func main() {
    x, y := 1, 2
    swap(&x, &y)
    fmt.Println(x, y)
}
运行结果:
1 2

结果表明,交换是不成功的。上面代码中的 swap() 函数交换的是 a 和 b 的地址,在交换完毕后,a 和 b 的变量值确实被交换。但和 a、b 关联的两个变量并没有实际关联。这就像写有两座房子的卡片放在桌上一字摊开,交换两座房子的卡片后并不会对两座房子有任何影响。

示例:使用指针变量获取命令行的输入信息

Go 语言的 flag 包中,定义的指令以指针类型返回。通过学习 flag 包,可以深入了解指针变量在设计上的方便之处。

下面的代码通过提前定义一些命令行指令和对应变量,在运行时,输入对应参数的命令行参数后,经过 flag 包的解析后即可通过定义的变量获取命令行的数据。

获取命令行输入:
package main

// 导入系统包
import (
    "flag"
    "fmt"
)

// 定义命令行参数
var mode = flag.String("mode", "", "process mode")

func main() {

    // 解析命令行参数
    flag.Parse()

    // 输出命令行参数
    fmt.Println(*mode)
}
将这段代码命名为main.go,然后使用如下命令行运行:

$ go run flagparse.go --mode=fast

命令行输出结果如下:
fast

代码说明如下:
  • 第 10 行,通过 flag.String,定义一个 mode 变量,这个变量的类型是 *string。后面 3 个参数分别如下:
    • 参数名称:在给应用输入参数时,使用这个名称。
    • 参数值的默认值:与 flag 所使用的函数创建变量类型对应,String 对应字符串、Int 对应整型、Bool 对应布尔型等。
    • 参数说明:使用 -help 时,会出现在说明中。
  • 第 15 行,解析命令行参数,并将结果写入创建的指令变量中,这个例子中就是 mode 变量。
  • 第 18 行,打印 mode 指针所指向的变量。

由于之前使用 flag.String 已经注册了一个 mode 的命令行参数,flag 底层知道怎么解析命令行,并且将值赋给 mode*string 指针。在 Parse 调用完毕后,无须从 flag 获取值,而是通过自己注册的 mode 这个指针,获取到最终的值。代码运行流程如下图所示。


图:命令行参数与变量的关系

创建指针的另一种方法——new() 函数

Go 语言还提供了另外一种方法来创建指针变量,格式如下:

new(类型)

一般这样写:
str := new(string)
*str = "ninja"

fmt.Println(*str)
new() 函数可以创建一个对应类型的指针,创建过程会分配内存。被创建的指针指向的值为默认值。