Go 原理剖析：数据结构之字符串-EW帮帮网

在 Go 语言中，字符串（string）是一个非常重要的数据类型。它看似简单，但背后却隐藏着不少有趣的原理和优化技巧。今天我们就来聊聊 Go 中字符串的底层结构、特性，以及如何高效地使用它。

1. 字符串的底层结构

字符串的底层其实很简单：它由两个部分组成：

一个指针：指向字符串的首地址。
一个整数：表示字符串的长度（len）。

也就是说，字符串本质上是一个“只读的字节数组”。它的长度固定，不能动态扩展。

类比一下：

字符串就像一个快递盒，里面装着固定的物品（字节），快递盒的标签（长度）告诉我们里面有多少东西。
一旦快递盒被封口，里面的物品就不能再被修改。

2. 字符串的特性

不可修改：字符串是只读的，一旦创建就不能修改。比如：

go复制
```
s := "hello"
s[0] = 'H' // 这会报错！
```
不能为空指针：字符串可以是空字符串（""），但不能是 nil。也就是说：

go复制
```
var s string // s 是空字符串，不是 nil
```
拼接和追加需要拷贝：字符串不能扩容，任何写操作（比如拼接、追加）都需要创建一个新的字符串，并将旧内容拷贝过去。这有点像搬家：每次需要更大的空间时，就得重新租个仓库，把东西搬过去。

3. 字符串与 `[]byte` 的互相转换

字符串和字节数组（[]byte）可以互相转换，但这里有个关键点：

转换会拷贝内存：每次转换时，都会申请一块新的内存，并将数据从原地址拷贝到新地址。

比如：

go复制

s := "hello"
b := []byte(s) // 拷贝字符串内容到新的字节数组

不过，Go 有一个优化：

如果转换后的字符串只是用于临时场景（比如比较、查找、拼接），Go 会直接复用原数据，而不会拷贝。这种情况下，效率会更高。

4. 字符串拼接的性能对比

拼接字符串是常见的操作，但不同的方法性能差异很大。以下是几种常见方法的对比：

+ 拼接：
每次使用 + 拼接时，都会创建一个新的字符串，把旧内容拷贝过去。效率最低，适合少量拼接。
fmt.Sprintf：
使用了反射机制，适合动态格式化，但性能较差。
bytes.Buffer：
底层是一个动态扩展的字节数组，适合多次拼接，但每次拼接都会重新申请内存。
strings.Builder：
底层也是 []byte，支持预分配和自动扩容，性能最佳。

推荐顺序：

go复制

strings.Builder > append > + > fmt.Sprintf

类比一下：

+ 拼接就像每次搬家都重新租仓库。
strings.Builder 就像一个可扩展的仓库，能动态扩展空间，效率更高。

5. 值传递还是引用传递？

字符串是值类型，传递时会拷贝整个内容。但由于字符串是只读的，传递时不会修改原数据，因此性能影响不大。

总结

Go 中的字符串看似简单，但背后有很多优化技巧：

避免频繁使用 + 拼接。
使用 strings.Builder 或预分配的 []byte 提高性能。
理解字符串与 []byte 的转换机制，避免不必要的拷贝。

Go 原理剖析：数据结构之字符串

1. 字符串的底层结构

2. 字符串的特性

3. 字符串与 `[]byte` 的互相转换

4. 字符串拼接的性能对比

5. 值传递还是引用传递？

总结

网站公告

今日签到

热门文章

最新发布

Go 原理剖析：数据结构之字符串

1. 字符串的底层结构

2. 字符串的特性

3. 字符串与 []byte 的互相转换

4. 字符串拼接的性能对比

5. 值传递还是引用传递？

总结

网站公告

今日签到

热门文章

最新发布

3. 字符串与 `[]byte` 的互相转换