2020-11-22

Golang

Golang反射三定律

文章目录

1. 简介
2. 类型和接口
3. 接口变量的表示
4. 反射三定律
5. 总结：

原文地址：https://blog.golang.org/laws-of-reflection

简介

Reflection（反射）在计算机中表示程序能够检查自身结构的能力，尤其是类型。它是元编程的一种形式，也是最容易让人迷惑的一部分。

类型和接口

因为反射建立在类型系统之上，所以我们从类型的基础知识说起。Go是静态类型语言。每个变量都有一个静态类型，也就是在编译时已经确定了。比如int, float32, *MyType, []byte等。我们进行如下声明：

type MyInt int

var i int
var j MyInt

上面代码中变量 i 的类型是 int，j 的类型是 MyInt。尽管变量 i 和 j 具有共同的底层类型 int，但如果不经过类型转换，直接相互赋值编译会报错

类型的一个重要类别是接口类型(interface)，它是固定的方法集合。接口变量可以存储任何类型的具体（非接口）值，只要该值实现接口的所有方法即可。一个典型示例是io.Reader和io.Writer，它们是io包中的Reader和Writer类型：

// Reader is the interface that wraps the basic Read method.
type Reader interface {
 Read(p []byte) (n int, err error)
}

// Writer is the interface that wraps the basic Write method.
type Writer interface {
 Write(p []byte) (n int, err error)
}

任何实现了Read或Write方法的类型，我们都可以说它实现(implement)了io.Reader或io.Writer接口。这意味着io.Reader类型的变量可以保存(也可称为指向)具有Read方法的任何值：

var r io.Reader
r = os.Stdin
r = bufio.NewReader(r)
r = new(bytes.Buffer)
// and so on

要时刻牢记的是不管变量 r 指向的具体值是什么，它的类型永远是 io.Reader。记住：Go语言是静态类型语言，变量 r 的静态类型是 io.Reader。

一个特别重要的接口类型是空接口：

1	interface{}

空接口代表空方法集合，因为任何类型的值都具有零个或多个方法，所以类型为interface{} 的变量能够存储任何值。

有人说Go的接口是动态类型的。这个说法是错的！接口变量也是静态类型的，它永远只有一个相同的静态类型。如果在运行时它存储的值发生了变化，这个值也必须实现接口类型的方法集合。

由于反射和接口两者的关系很密切，我们必须澄清这一点。

接口变量的表示

Russ Cox写了一篇详细的文章介绍了Go中接口变量的表示。这里面只对改文章做一个简单的总结：

接口类型的变量存储一对值：分配给该变量的具体值以及该值的类型描述符。更准确地说，该值是实现接口的底层数据，而类型是底层数据类型的描述

举个例子:

var r io.Reader
tty, err := os.OpenFile("/dev/tty", os.O_RDWR, 0)
if err != nil {
    return nil, err
}
r = tty

上面例子中 r 包含一个(value, type)对：（tty，*os.File）。注意：*os.File类型不光实现了Read的方法；即使该接口变量仅提供对Read方法的访问，但由于底层的值包含有关该值的所有类型信息。所以我们能够做如下的类型转换操作：

1 2	var w io.Writer w = r.(io.Writer)

上面代码的第二行是一个类型断言：它断定变量 r 内部的实际值也实现了 io.Writer接口，所以才能被赋值给 w。赋值之后，w 就指向了 (tty, *os.File) 对，和变量 r 指向的是同一个 (value, type) 对。即使底层具体值的拥有的方法再多，由于接口的静态类型限制，接口变量只能调用特定的一些方法。

我们继续往下看：

1 2	var empty interface{} empty = w

空接口变量 empty 也包含 (tty, *os.File) 对。这一点很容易理解：空接口变量可以存储任何具体值以及该值的所有描述信息。这里我们没有使用类型断言，因为变量 w 满足空接口的所有方法。而在前一个例子中，我们把一个具体值从 io.Reader 转换为 io.Writer 时，需要显式的类型断言，是因为 io.Writer 的方法集合并不是 io.Reader 的子集。

很重要的一点：(value, type) 对中的 type 必须是具体的类型（struct或基本类型），不能是接口类型。接口类型不能存储接口变量。

反射三定律

反射第一定律

Reflection goes from interface value to reflection object
反射可以将“接口类型变量”转换为“反射类型对象”

从用法上来讲，反射提供了一种机制，允许程序在运行时检查接口变量内部存储的 (value, type) 对。在最开始，我们先了解下 reflect 包的两种类型：Type 和 Value。这两种类型使访问接口内的数据成为可能。它们对应两个简单的方法，分别是 reflect.TypeOf 和 reflect.ValueOf，分别用来读取接口变量的 reflect.Type 和 reflect.Value 部分。当然，从 reflect.Value 也很容易获取到 reflect.Type。目前我们先将它们分开。

让我们看下reflect.TypeOf：

package main

import (
    "fmt"
    "reflect"
)

func main() {
    var x float64 = 3.4
    fmt.Println("type:", reflect.TypeOf(x))
}

这段代码会打印出：

1	type: float64

您可能想知道接口在这里，因为该程序看起来像在传递float64变量x而不是接口值来反映.TypeOf。但是在那里当godoc报告时，reflect.TypeOf的签名包括一个空接口：

你可能会疑惑：为什么没看到接口？这段代码看起来只是把一个 float64类型的变量 x 传递给 reflect.TypeOf，并没有传递接口。事实上，接口就在那里。查阅一下TypeOf的文档，你会发现 reflect.TypeOf 的函数签名里包含一个空接口：

1 2	// TypeOf returns the reflection Type of the value in the interface{}. func TypeOf(i interface{}) Type

我们调用 reflect.TypeOf(x) 时，x 被存储在一个空接口变量中被传递过去；然后reflect.TypeOf 对空接口变量进行拆解，恢复其类型信息。

函数 reflect.ValueOf 也会对底层的值进行恢复（这里我们忽略细节，只关注可执行的代码）：

当我们调用reflect.TypeOf（x）时，x首先存储在一个空接口变量中，然后将其作为参数传递过去；然后reflect.TypeOf拆解(unpack)该空接口变量以恢复其类型信息。

当然reflect.ValueOf函数可以恢复底层的值值：

1 2	var x float64 = 3.4 fmt.Println("value:", reflect.ValueOf(x).String())

上面代码打印出：

1	value: <float64 Value>

上面代码中之所以明确地调用String方法，是因为默认情况下，fmt包会深入(dig into)reflect.Value以显示其中的具体值。而String方法返回是字符串类型。

类型 reflect.Type 和 reflect.Value 都有很多方法，我们可以检查和使用它们。这里我们举几个例子。

reflect.Type和reflect.Value都有很多方法可以让我们检查和操作它们。类型 reflect.Value 有一个方法 Type()，它会返回一个 reflect.Type 类型的对象。Type和 Value都有一个名为 Kind 的方法，它会返回一个常量，表示底层数据的类型，常见值有：Uint、Float64、Slice等。Value类型也有一些类似于Int、Float的方法，用来提取底层的数据。Int方法用来提取 int64, Float方法用来提取 float64。

var x float64 = 3.4
v := reflect.ValueOf(x)
fmt.Println("type:", v.Type())
fmt.Println("kind is float64:", v.Kind() == reflect.Float64)
fmt.Println("value:", v.Float())

上面代码打印出：

1
2
3

type: float64
kind is float64: true
value: 3.4

还有一些用来修改数据的方法，比如SetInt、SetFloat，在讨论它们之前，我们要先理解“可修改性”（settability），这一特性会在“反射第三定律”中进行详细说明。

反射库提供了很多值得列出来单独讨论的属性。首先是介绍下Value 的 getter 和 setter 方法。为了保证API 的精简，这两个方法操作的是某一组类型范围最大的那个。比如处理任何含符号整型数，都使用 int64。也就是说 Value 类型的Int 方法返回值为 int64类型，SetInt 方法接收的参数类型也是 int64 类型。实际使用时，可能需要转化为实际的类型：

var x uint8 = 'x'
v := reflect.ValueOf(x)
fmt.Println("type:", v.Type())                            // uint8.
fmt.Println("kind is uint8: ", v.Kind() == reflect.Uint8) // true.
x = uint8(v.Uint())                                       // v.Uint returns a uint64.

第二个属性是反射类型变量（reflection object）的 Kind 方法会返回底层数据的类型，而不是静态类型。如果一个反射类型对象包含一个用户定义的整型数：

1
2
3

type MyInt int
var x MyInt = 7
v := reflect.ValueOf(x)

上面的代码中，虽然变量 v 的静态类型是MyInt，不是 int，Kind 方法仍然返回 reflect.Int。换句话说， Kind 方法不会像 Type 方法一样区分 MyInt 和 int。

反射第二定律

Reflection goes from reflection object to interface value
反射可以将“反射类型对象”转换为“接口类型变量”

像物理反射一样，Go中的反射会生成自己的逆。

和物理反射类似，Go语言中的反射也能创造自己反面类型的对象。

给定reflect.Value类型的变量，我们可以使用 Interface 方法恢复其接口类型的值。实际上，这个方法会把 type 和 value 信息打包并填充到一个接口变量中，然后返回。

1 2	// Interface returns v's value as an interface{}. func (v Value) Interface() interface{}

接着可以通过断言，恢复底层的具体值：

1 2	y := v.Interface().(float64) // y will have type float64. fmt.Println(y)

上面这段代码会打印出一个 float64 类型的值，也就是反射类型变量 v 所代表的值。

事实上，我们可以更好地利用这一特性。标准库中的 fmt.Println 和 fmt.Printf 等函数都接收空接口变量作为参数，fmt 包内部会对接口变量进行拆包（前面的例子中，我们也做过类似的操作）。因此，fmt 包的打印函数在打印 reflect.Value 类型变量的数据时，只需要把 Interface 方法的结果传给格式化打印程序：

1	fmt.Println(v.Interface())

为什么不直接打印 v ，比如 fmt.Println(v)？答案是 v 的类型是 reflect.Value，我们需要的是它存储的具体值。由于底层的值是一个 float64，我们可以格式化打印：

1	fmt.Printf("value is %7.1e\n", v.Interface())

上面代码的打印出：

1	value is 3.4e+00

同样这次也不需要对 v.Interface() 的结果进行类型断言。空接口值内部包含了具体值的类型信息，Printf 函数会恢复类型信息。

简单来说，Interface 方法和 ValueOf 函数作用恰好相反，除了其返回值的静态类型是 interface{}。

再次重申一下：Go的反射机制可以将“接口类型的变量”转换为“反射类型的对象”，然后再将“反射类型对象”转换过去。

反射第三定律

To modify a reflection object, the value must be settable
如果要修改“反射类型对象”，其值必须是“可写的”（settable）

第三定律是最微妙和令人困惑的，但是如果我们从第一条原则开始，就很容易理解。

下面这段代码不能正常工作，但是非常值得研究：

1
2
3

var x float64 = 3.4
v := reflect.ValueOf(x)
v.SetFloat(7.1) // Error: will panic.

如果你运行这段代码，它会抛出抛出一个奇怪的异常：

1	panic: reflect.Value.SetFloat using unaddressable value

这里问题不在于值 7.1 不能被寻址( not addressable)，而是因为变量 v 是“不可写的”。“可写性”是反射类型变量的一个属性，但不是所有的反射类型变量都拥有这个属性。

我们可以通过 CanSet 方法检查一个 reflect.Value 类型变量的“可写性”:

1
2
3

var x float64 = 3.4
v := reflect.ValueOf(x)
fmt.Println("settability of v:", v.CanSet())

上面这段代码打印出：

1	settability of v: false

对于一个不具有“可写性”的 Value类型变量，调用 Set 方法会报出错误。首先，我们要弄清楚什么“可写性”。

“可写性”有些类似于寻址能力，但是更严格。它是反射类型变量的一种属性，赋予该变量修改底层存储数据的能力。“可写性”最终是由一个事实决定的：反射对象是否存储了原始值。我们看下下面这个例子：

1 2	var x float64 = 3.4 v := reflect.ValueOf(x)

我们将x的副本传递给reflect.ValueOf，因此，作为reflect.ValueOf的参数创建的接口值是x的副本，而不是x本身。

1	v.SetFloat(7.1)

如果上面操作能够操作成功，它不会更新 x ，虽然看起来变量 v 是根据 x 创建的。相反，它会更新 x 存在于反射对象 v 内部的一个拷贝，而变量 x 本身完全不受影响。这会造成迷惑并且没有任何意义，所以是不合法的。“可写性”就是为了避免这个问题而设计的。

这看起来很诡异，事实上并非如此，而且类似的情况很常见。考虑下面这行代码：

f(x)

上面的代码中，我们把变量 x 的一个拷贝传递给函数，因此不期望它会改变 x 的值。如果期望函数 f 能够修改变量 x，我们必须传递 x 的地址（即指向 x 的指针）给函数 f，如下：

f(&x)

跟上面代码一样。如果你想通过反射修改变量 x，你需要把修改的变量的指针传递给反射库。

首先，像往常一样初始化变量 x，然后创建一个指向它的反射对象，名字为 p：

var x float64 = 3.4
p := reflect.ValueOf(&x) // Note: take the address of x.
fmt.Println("type of p:", p.Type())
fmt.Println("settability of p:", p.CanSet())

上面代码输出：

1 2	type of p: *float64 settability of p: false

反射对象 p 是不可写的，但是我们也不想修改 p，事实上我们要修改的是 *p。为了得到 p 指向的数据，可以调用 Value 类型的 Elem 方法。Elem 方法能够对指针进行“解引用”，然后将结果存储到反射 Value类型对象 v中：

1 2	v := p.Elem() fmt.Println("settability of v:", v.CanSet())

现在变量 v 是一个可写的反射对象，上面代码输出也验证了这一点:

1	settability of v: true

由于变量 v 代表 x，因此我们可以使用 v.SetFloat 修改 x 的值:

1
2
3

v.SetFloat(7.1)
fmt.Println(v.Interface())
fmt.Println(x)

上面代码将输出：

1
2

7.1
7.1

你只需要记住(Just keep in mind)：只要反射对象要修改它们表示的对象，就必须获取它们表示的对象的地址

结构体

在前面的例子中，变量 v 本身并不是指针，它只是从指针衍生而来。把反射应用到结构体时，常用的方式是使用反射修改一个结构体的某些字段。只要拥有结构体的地址，我们就可以修改它的字段。

下面通过一个简单的例子对结构体类型变量 t 进行分析。

首先，我们创建了反射类型对象，它包含一个结构体的指针，因为后续会修改。然后我们设置 typeOf 为它的类型，并遍历所有的字段。

type T struct {
    A int
    B string
}
t := T{23, "skidoo"}
s := reflect.ValueOf(&t).Elem()
typeOfT := s.Type()
for i := 0; i < s.NumField(); i++ {
    f := s.Field(i)
    fmt.Printf("%d: %s %s = %v\n", i,
        typeOfT.Field(i).Name, f.Type(), f.Interface())
}

上面代码将会输出：

1 2	0: A int = 23 1: B string = skidoo

有重要的一点需要指出来：变量 T 的字段都是首字母大写的（暴露到外部），因为struct中只有暴露到外部的字段才是“可写的”。

由于变量 s 包含一个“可写的”反射对象，我们可以修改结构体的字段：

1
2
3

s.Field(0).SetInt(77)
s.Field(1).SetString("Sunset Strip")
fmt.Println("t is now", t)

上面代码输出：

1	t is now {77 Sunset Strip}

如果变量 s 是通过 t ，而不是 &t 创建的，调用 SetInt 和 SetString 将会失败，因为 t 的字段不是“可写的”。

总结：

Golang反射三定律：

反射可以将“接口类型变量”转换为“反射类型对象”
反射可以将“反射类型对象”转换为“接口类型变量”
如果要修改“反射类型对象”，其值必须是“可写的”