内存对齐

Go语言中数据类型的大小（字节数）取决于具体类型和平台架构（32位或64位）。以下是Go语言主要数据类型的字节占用情况（以64位系统为主）：

0.1 基本数据类型字节占用表

数据类型

32位系统

64位系统

说明

bool

1字节

布尔值

byte

1字节

uint8别名

rune

4字节

int32别名，表示Unicode码点

int

4字节

8字节

平台相关整数

uint

4字节

8字节

平台相关无符号整数

int8/uint8

1字节

8位整数

int16/uint16

2字节

16位整数

int32/uint32

4字节

32位整数

int64/uint64

8字节

64位整数

float32

4字节

单精度浮点数

float64

8字节

双精度浮点数

complex64

8字节

两个float32组成

complex128

16字节

两个float64组成

指针类型

4字节

8字节

指向内存地址

uintptr

4字节

8字节

足够容纳指针值的整数

0.2 复合数据类型字节占用

0.2.1 数组 (Array)

数组大小固定，计算公式：

数组大小 = 元素数量 × 单个元素大小

示例：

var arr1 [3]int32 // 3 × 4字节 = 12字节
var arr2 [10]byte  // 10 × 1字节 = 10字节

0.2.2 结构体 (Struct)

结构体大小是所有字段大小之和，但需要考虑内存对齐：

type Example struct {
    a bool    // 1字节
    b int32   // 4字节
    c int16   // 2字节
}
// 实际大小：1 + 3(填充) + 4 + 2 = 10字节

0.2.3 切片 (Slice)

切片是24字节的复合结构（64位系统）：

type slice struct {
    array unsafe.Pointer // 8字节（指向底层数组）
    len   int            // 8字节（长度）
    cap   int            // 8字节（容量）
}

示例：

s := make([]int, 0) // 24字节（不包含底层数组）

0.2.4 字符串 (String)

字符串是16字节的复合结构（64位系统）：

type string struct {
    str unsafe.Pointer // 8字节（指向底层字节数组）
    len int            // 8字节（长度）
}

示例：

str := "hello" // 16字节（不包含底层字节数组）

0.2.5 映射 (Map)

映射是一个指针（8字节），指向运行时实现的哈希表结构：

m := make(map[string]int) // 8字节（不包含实际数据）

0.2.6 通道 (Channel)

通道是一个指针（8字节），指向运行时实现的通道结构：

ch := make(chan int) // 8字节（不包含实际数据）

0.2.7 接口 (Interface)

接口是16字节的复合结构（64位系统）：

type iface struct {
    tab  *itab          // 8字节（类型信息）
    data unsafe.Pointer // 8字节（值指针）
}

示例：

var i interface{} = 42 // 16字节

0.3 内存对齐规则

内存对齐（Memory Alignment）是指数据在内存中的存储位置必须满足特定地址边界的要求。在 Go 语言中，内存对齐遵循以下基本原则：

数据类型对齐系数（Align）：
- 每种数据类型都有其自然对齐系数（通常等于其大小）
- 对齐系数必须是 2 的幂（1, 2, 4, 8, 16...）
结构体对齐规则：
- 结构体的对齐系数是其所有字段中最大的对齐系数
- 结构体大小必须是其对齐系数的整数倍
字段存储规则：
- 字段的偏移量必须是其类型对齐系数的整数倍
- 编译器会在字段间插入填充字节（padding）以满足对齐要求

0.4 Go 中的基本类型对齐系数

数据类型

大小（字节）

对齐系数

bool

int8, uint8, byte

int16, uint16

int32, uint32, float32, rune

int64, uint64, float64, complex64

complex128

string

slice

map

chan

interface{}

指针（*T）

type Example struct {  
    a bool  // 大小1，对齐1  
    b int32 // 大小4，对齐4  
    c int8  // 大小1，对齐1  
}  
  
type Optimized struct {  
    b int32 // 4字节，对齐4  
    a bool  // 1字节，对齐1  
    c int8  // 1字节，对齐1  
}  
  
func main() {  
    fmt.Println(unsafe.Sizeof(Example{}))  // 12
    fmt.Println(unsafe.Sizeof(Optimized{})) // 8
}

还有一种特殊的类型，空结构体，一般来说空结构体大小为0，不需要额外填充，但如果该空结构体被外部指针指向，如果不填充就会导致指向结构体外的内存地址，这样会在结构体回收的时候导致指针悬垂，如果该内存地址被复用，可能导致内存安全问题。

所以 GO 会默认直接在结构体末尾的空结构体填充 pedding

  
type demo3 struct {  
    a struct{}  
    b int32  
}  
  
type demo4 struct {  
    c int32  
    a struct{}  
}  
  
func main() {  
    fmt.Println(unsafe.Sizeof(demo3{}))   // 4
    fmt.Println(unsafe.Sizeof(demo4{}))   // 8
}

0.5 如何查看类型大小

使用unsafe.Sizeof()函数：

package main

import (
	"fmt"
	"unsafe"
)

func main() {
	fmt.Println("bool:", unsafe.Sizeof(true))           // 1
	fmt.Println("int:", unsafe.Sizeof(42))              // 8 (64位)
	fmt.Println("string:", unsafe.Sizeof("hello"))     // 16
	fmt.Println("slice:", unsafe.Sizeof([]int{}))      // 24
	fmt.Println("map:", unsafe.Sizeof(map[int]int{}))   // 8
	fmt.Println("chan:", unsafe.Sizeof(make(chan int))) // 8
	fmt.Println("interface:", unsafe.Sizeof(interface{}(42))) // 16
	
	type Point struct {
		X, Y float64
	}
	fmt.Println("struct:", unsafe.Sizeof(Point{})) // 16
}

0.6 如何查看对齐系数

unsafe 标准库提供了 Alignof 方法，可以返回一个类型的对齐值，也可以叫做对齐系数或者对齐倍数。例如：

type Example struct {  
    a bool  // 大小1，对齐1  
    b int32 // 大小4，对齐4  
    c int8  // 大小1，对齐1  
}  
  
type Optimized struct {  
    b int32 // 4字节，对齐4  
    a bool  // 1字节，对齐1  
    c int8  // 1字节，对齐1  
}  
  
func main() {  
    fmt.Println(unsafe.Alignof(Example{}))   // 4
    fmt.Println(unsafe.Alignof(Optimized{})) //  4
}

0.7 重要注意事项

指针大小：在32位系统上为4字节，64位系统上为8字节
切片大小：24字节（64位）只包含切片头，不包含底层数组
字符串大小：16字节（64位）只包含字符串头，不包含底层字节数组
零值大小：unsafe.Sizeof(nil)无效，但空接口大小相同
函数大小：函数值在Go中是8字节（指向函数代码的指针）

0.8 为什么需要内存对齐

0.8.1 硬件要求

CPU访问优化：现代CPU从内存读取数据时，通常以字长（word size）为单位（64位系统为8字节）
对齐访问：CPU访问对齐的内存地址只需单次操作，访问未对齐地址可能需要多次操作
- 通过移位和掩码操作拼接所需数据，比单纯的位提取操作更耗时
硬件限制：某些架构（如ARM）直接拒绝未对齐访问，导致程序崩溃

0.8.2 性能提升

减少内存访问：对齐数据可减少CPU访问内存的次数
缓存效率：对齐数据能更好地利用CPU缓存行（通常64字节）
- 当CPU从主内存读取数据时，并不是只读取需要的数据，而是读取一个缓存行大小的数据块（通常为64字节）。
- 同样，写入缓存也是以缓存行为单位。
- 如果数据对齐，那么一个缓存行可以容纳更多的有效数据。相反，如果数据未对齐，可能需要两个缓存行来存储一个本可以放在一个缓存行中的数据。可以提高数据加载效率。
向量化优化：SIMD指令（如AVX）要求数据严格对齐

0.8.3 原子操作保证

Go的sync/atomic包要求64位变量必须8字节对齐
未对齐的64位变量在32位系统上会导致panic

0.8.4 减少内存碎片

对齐的内存分配更高效，减少内存碎片
内存分配器（如Go的TCMalloc）基于对齐块工作

0.9 最佳实践

字段排序优化：
- 按对齐系数降序排列字段（大字段在前）
- 将相同类型字段放在一起
避免过度填充：

// 优化前 (24字节) 
type Unoptimized struct { 
    a int8    
    b int64     
    c int32 
    }  
    
// 优化后 (16字节) 
type Optimized struct {
    b int64     
    c int32     
    a int8 
}

敏感数据对齐：
- 对性能关键的结构体使用//go:align指令强制指定对齐系数
- 必须是2的幂

    //go:align 64 
    type CacheLine struct {     
        data [64]byte 
        }

原子变量声明：
- 使用单独声明确保64位变量对齐

    var counter int64 // 全局变量自动对齐  
    
    type Container struct {   
      // 单独声明确保对齐     
      counter int64     
      _       [4]byte // 显式填充（不推荐） 
      }

上一页值类型和指针类型接收者下一页对象设计原则SOLID

最后更新于3个月前

hashtag0.1 基本数据类型字节占用表

hashtag0.2 复合数据类型字节占用

hashtag0.2.1 数组 (Array)

hashtag0.2.2 结构体 (Struct)

hashtag0.2.3 切片 (Slice)

hashtag0.2.4 字符串 (String)

hashtag0.2.5 映射 (Map)

hashtag0.2.6 通道 (Channel)

hashtag0.2.7 接口 (Interface)

hashtag0.3 内存对齐规则

hashtag0.4 Go 中的基本类型对齐系数

hashtag0.5 如何查看类型大小

hashtag0.6 如何查看对齐系数

hashtag0.7 重要注意事项

hashtag0.8 为什么需要内存对齐

hashtag0.8.1 硬件要求

hashtag0.8.2 性能提升

hashtag0.8.3 原子操作保证

hashtag0.8.4 减少内存碎片

hashtag0.9 最佳实践