WaitGroup 用于等待一组线程的结束,父线程调用 Add 来增加等待的线程数,被等待的线程在结束后调用 Done 来将等待线程数减 1,父线程通过调用 Wait 阻塞等待所有结束(计数器清零)后进行唤醒。
WaitGroup 的源码在 SDK 包的路径为src/sync/waitgroup.go
。
type WaitGroup struct { noCopy noCopy state1 [3]uint32 }
1.noCopy noCopy
noCopy 这个主要用来限制不能进行 copy,这里是为了避免 copy 后的 waitGroup 并发使用后,可能会与原 waitGroup 出现异常而 panic 。
2.state1 [3]unit32
数组的三个元素(非顺序):
这里需要注意一下 couter 、waiter 、semap 并不是顺序存储的,64bit 操作系统的原子操作需要保证 64bit 的内存对齐,在设计上我们需要保证 couter 和 waiter 的操作原子性。如果数组的首元素地址能被 8 整除,则 counter 和 waiter 刚好可以在同一块原子操作的 64bit 内存上,所以取数组前两个元素分别表示 couter 和 waiter ;如果不能被 8 整除(根据内存对齐的原理,地址必然是 4 的倍数),则取数组后两个。
// 根据内存对齐方式的不同,返回 statep(couter 占用高 32bit 和 waiter 占用低 32bit)和 semap 的地址 func (wg *WaitGroup) state() (statep *uint64, semap *uint32) { if uintptr(unsafe.Pointer(&wg.state1))%8 == 0 { return (*uint64)(unsafe.Pointer(&wg.state1)), &wg.state1[2] } else { return (*uint64)(unsafe.Pointer(&wg.state1[1])), &wg.state1[0] } }
func (wg *WaitGroup) Add(delta int) //增加 waitGroup 子 goruntine 计数值 func (wg *WaitGroup) Done() //当子 goruntine 完成后,将计数器-1 func (wg *WaitGroup) Wait() //调用此方法的 goruntine,阻塞等待计数值为 0
以下方法去除了 race 竞争检查的源代码。
操作 counter 计数值加减。
func (wg *WaitGroup) Add(delta int) { //从数组中拿到 stetep ( counter+waiter 的组合)和 semap 信号量的内存地址 statep, semap := wg.state() //stetep 原子加操作,高位 32bit 是 counter,实际 counter+1 state := atomic.AddUint64(statep, uint64(delta)<<32) //state 的高位 32bit,表示 couter 的计数值 v := int32(state >> 32) //state 的低位 32bit,表示 waiter 的等待者数量 w := uint32(state) // couter 不能小于 0 if v < 0 { panic("sync: negative WaitGroup counter") } // 需要避免错误操作:Add 和 Wait 并发操作,否则会 panic if w != 0 && delta > 0 && v == int32(delta) { panic("sync: WaitGroup misuse: Add called concurrently with Wait") } // 如果还有等待线程未完成或者并没有等待者,直接 return if v > 0 || w == 0 { return } // 需要避免错误操作:Add 和 Wait 并发操作,否则会 panic if *statep != state { panic("sync: WaitGroup misuse: Add called concurrently with Wait") } // 将 statep 复位为 0 ( counter 和 waiter 都置为 0 ) *statep = 0 // 有多少个等待者就往 semap 循环发信号量(其实就是 semap+1 ),Wait 等待有一个调用 // runtime_Semacquire(semap)就是在等待这个信号量 for ; w != 0; w-- { runtime_Semrelease(semap, false, 0) } }
被等待线程完成后调用 Done,将 counter 计数-1,表示线程结束
func (wg *WaitGroup) Done() { wg.Add(-1) }
主线程循环对 waiter 原子操作+1 直到成功后,然后阻塞等待 semap 信号量而被唤醒,最后 return
func (wg *WaitGroup) Wait() { // 从数组中拿到 stetep ( counter+waiter 的组合)和 semap 信号量的内存地址 statep, semap := wg.state() for { //从内存总线中加载最新的 statep 值 state := atomic.LoadUint64(statep) //state 的高位 32bit,表示 couter 的计数值 v := int32(state >> 32) //state 的低位 32bit,表示 waiter 的等待者数量 w := uint32(state) //如果 couter 为 0,表示当前已经没有在运行的等待线程了 if v == 0 { return } // CAS 操作 statep+1,低位属于 waiter,即 waiter+1 if atomic.CompareAndSwapUint64(statep, state, state+1) { // CAS 操作成功后,阻塞等待 semap 信号为非零,竞争到会将 semap-1,并唤醒线程 runtime_Semacquire(semap) if *statep != 0 { panic("sync: WaitGroup is reused before previous Wait has returned") } return } // CAS 操作失败了,重新进入循环 } }
1 makdon 2021-04-04 21:32:55 +08:00 ![]() 拉到最后竟然没有公众号 /博客 /培训班 /招聘 |
![]() | 2 raaaaaar 2021-04-04 22:40:43 +08:00 via Android 最近学了操作系统,发现就是个二元信号量。。 |
![]() | 4 kuro1 2021-04-07 13:32:21 +08:00 拉到最后竟然没有公众号 /博客 /培训班 /招聘+1 |