
今天被一道题目恶心到了, 发现不研究这些东西可能真的活不下去了, 狠下心来读了一个多小时的源码, 写下些自己对 Slice 的见解吧.
先说说那个题目.
// https://play.golang.org/p/2fA3BylTgtf // 请问 s1 和 s2 的值分别是? func main() { s1 := []int{1, 2, 3} s2 := s1[:0] s2 = append(s2, 4) fmt.Println(s1) fmt.Println(s2) } //========== // [4 2 3] // [4] 先看看 Slice 在 Go 底层的定义
// https://github.com/golang/go/blob/master/src/reflect/value.go#L1806 type sliceHeader struct { Data unsafe.Pointer // Array pointer Len int // slice length Cap int // slice capacity } s1 := []int{1, 2, 3} 是将 [1, 2, 3] 的首地址 存入了 Data 中, 设置了 Len 为 3, 设置了 Cap 为 3.
// https://play.golang.org/p/bjP8BKtwQQl // 验证代码. func main() { s1 := []int{1, 2, 3} // 我们可以先将它转成 *reflect.SliceHeader 类型. // *reflect.SliceHeader // 定义: https://github.com/golang/go/blob/master/src/reflect/value.go#L1800 // 顺带着再说一句 uintptr: uintptr 是整型, 可以足够保存指针的值得范围, // 在 32 平台下为 4 字节,在 64 位平台下是 8 字节 sliceHeader1 := (*reflect.SliceHeader)((unsafe.Pointer)(&s1)) fmt.Printf("data address: %#0x, len: %d, cap: %d\n", sliceHeader1.Data, sliceHeader1.Len, sliceHeader1.Cap) } //===== // data address: 0x10414020, len: 3, cap: 3 s2 := s1[:0] 是将 s1 的 Data 中的值, 赋值给了 s2 的 Data 中, 设置 Len 为 0, s1 的 Cap 赋值给了 s2 的 Cap.
上面这一段有可能不太好理解, 我直接拿出源码来说.
// https://github.com/golang/go/blob/master/src/reflect/value.go#1559 func (v Value) Slice(i, j int) Value { // ... 略过无用代码 switch kind := v.kind(); kind { // ... case Slice: typ = (*sliceType)(unsafe.Pointer(v.typ)) s := (*sliceHeader)(v.ptr) base = s.Data cap = s.Cap } // ... // Declare slice so that gc can see the base pointer in it. var x []unsafe.Pointer // Reinterpret as *sliceHeader to edit. s := (*sliceHeader)(unsafe.Pointer(&x)) // 这里是给 s2.Len 进行赋值. s1[:0] i 没有传所以为 0, j 也为 0, 所以 j - i ... s.Len = j - // 这里是给 s2.Cap 进行赋值. cap 在上面的 case 中 被赋值为 3, 3 - 0 emmm... s.Cap = cap - i // if 为真 if cap-i > 0 { // 所以这里是给 s2.Data 进行赋值. // arrayAt 的 4 个参数类型: // p unsafe.Pointer, i int, eltSize uintptr, whySafe string // base 是 s1.Data, i 是 0, eltSize 这个值是根据类型来的, // 在当前例子里是 []int, int 在根据系统, 32 平台下为 4 字节,在 64 位平台下是 8 字节 // 最后一个参数 whySafe 可能是为了做个记录吧... 而且必须说明为啥安全... s.Data = arrayAt(base, i, typ.elem.Size(), "i < cap") } else { // do not advance pointer, to avoid pointing beyond end of slice s.Data = base } } // https://github.com/golang/go/blob/master/src/reflect/value.go#1826 func arrayAt(p unsafe.Pointer, i int, eltSize uintptr, whySafe string) unsafe.Pointer { // 以系统 64 位 为例 // 传的值分别是 s1.Data(0x10414020), 0*8, "i < len" return add(p, uintptr(i)*eltSize, "i < len") } // https://github.com/golang/go/blob/master/src/reflect/type.go#1079 func add(p unsafe.Pointer, x uintptr, whySafe string) unsafe.Pointer { // 所以这里就相当于 0x10414020+0 return unsafe.Pointer(uintptr(p) + x) } // https://play.golang.org/p/pA6coJh2bSg // 验证代码 func main() { s1 := []int{1, 2, 3} s2 := s1[:0] sliceHeader2 := (*reflect.SliceHeader)((unsafe.Pointer)(&s2)) fmt.Printf("data address: %#0x, len: %d, cap: %d\n", sliceHeader2.Data, sliceHeader2.Len, sliceHeader2.Cap) } //===== // data address: 0x10414020, len: 0, cap: 3 可以看见 s1.Data 和 s2.Data 地址都是 0x10414020
到了这里你可能会问如果地址一样, 为什么 访问 s2[2] 会报错. runtime error: index out of range
其实猜也能大概猜到, 因为你获取数据的时候 程序是判断了 s2.Len 的.
代码位置在: https://github.com/golang/go/blob/master/src/reflect/type.go#870 这个函数里面有写.
emm.. 不知道....
1 hawken 2018-03-08 22:40:43 +08:00 mark |
2 polythene 2018-03-08 23:28:52 +08:00 安利一下这篇文章,里面讲解了你遇到的问题: https://jiajunhuang.com/articles/2017_07_18-golang_slice.md.html |
4 herozem 2018-03-09 00:29:55 +08:00 via iPad |
5 popbones 2018-03-09 06:56:07 +08:00 预料到是这样的结果,没预料到的是并不总是这样的结果(如二楼文章所说的,取决于 append 是否扩容),这有点蛋疼。 |
6 iRiven 2018-03-09 09:48:01 +08:00 via Android 遇到过坑,中间插入 array = append (append (array [0: index],item), array [index:]...) 然而这段代码能运行却不能实现中间插入的效果 |
7 lovejoy 2018-03-09 10:04:59 +08:00 看来还是得老老实实用 copy |
8 VinllenChen 2018-03-09 11:02:50 +08:00 对 slice 的修改是可能会修改原 array 的,需要特别注意。 |
10 xrlin 2018-03-09 12:52:36 +08:00 via iPhone 使用 slice 时要时刻提醒自己 slice 只是指向底层数组的一部分,即便是以 slice 做参数,也知识传递一个 slice 的 header 的复制,在涉及添加操作时一定要使用指针。不得不说确实容易导致 bug。 |
11 kirigaya 2018-03-09 13:38:10 +08:00 一楼 |