根据Proposal: Mid-stack inlining in the Go compiler,当前go1.9+
已经支持用户调整编译器的内联程度。
可以使用编译参数go build -gcflags="-l=4"
增加内联程度,从而提升9%的运行速度,代价是生成的二进制程序大小提升11-15%,看起来是很不错的一个交换。
我们可以通过添加-m=2
参数来对比效果。我们可以使用下列命令来对比前后内联的程度,数据结果越少,表示内联的函数越多。
# 优化前
go build -gcflags="-m=2" 2>&1 | grep "too complex"
# 优化后
go build -gcflags="-m=2 -l=4" 2>&1 | grep "too complex"
根据cmd/compile/internal/gc/inl.go源码显示,-l
的取值为:
// The debug['l'] flag controls the aggressiveness. Note that main() swaps level 0 and 1,
// making 1 the default and -l disable. Additional levels (beyond -l) may be buggy and
// are not supported.
// 0: disabled
// 1: 80-nodes leaf functions, oneliners, panic, lazy typechecking (default)
// 2: (unassigned)
// 3: (unassigned)
// 4: allow non-leaf functions
当然,一味的吹求函数内联并不总能带来性能的提高,因为随着代码段大小的提升,CPU运行时instruction cache miss
会随之增加,过高时会适得其反,所以是否采用还要以实际的PROFILE为准绳。