当前位置:首页 > 文章列表 > Golang > Go教程 > Golang获取字符串长度的实用方法

Golang获取字符串长度的实用方法

2026-03-26 11:57:46 0浏览 收藏
Go语言中字符串的长度计算暗藏关键陷阱:len()函数返回的是UTF-8字节长度而非人类可读的字符数(rune数),例如"你好"用len()得6但实际只有2个字符;正确获取字符数必须使用utf8.RuneCountInString(),遍历时应优先用for range而非基于len()的下标循环,避免乱码或panic;转换为[]rune虽能支持随机访问,但有显著内存和性能开销,仅在必要时采用;在API限制、日志截断、数据库存储等真实场景中,必须明确区分字节长度与字符长度,否则极易引发跨语言兼容性问题和线上bug——掌握这一底层差异,是写出健壮国际化Go代码的第一道防线。

Golang怎么获取字符串长度_Golang如何区分字节长度和字符长度【技巧】

Go 里 len() 返回的是字节长度,不是字符个数

这是最常踩的坑:用 len("你好") 得到 6,不是 2。因为 Go 字符串底层是 UTF-8 编码的字节数组,len() 统计的是字节数,不是 Unicode 码点个数。

真正要算“人眼看到的字符数”,得用 utf8.RuneCountInString()

import "unicode/utf8"

s := "Hello 世界"
fmt.Println(len(s))                 // 13(H-e-l-l-o-空格-世-界,后两个各占 3 字节)
fmt.Println(utf8.RuneCountInString(s)) // 8(5 个 ASCII + 3 个汉字)
  • ASCII 字符(如英文、数字)一个字节一个 rune,len()utf8.RuneCountInString() 结果相同
  • 中文、emoji、带变音符号的字母(如 “café” 中的 é)通常占多个字节,但只算一个 rune
  • 别用 strings.Count() 或遍历 []rune 来凑数——前者逻辑错,后者开销大

遍历字符串时别直接用 for i := 0; i

这种写法按字节索引走,遇到多字节 rune 会切在中间,导致乱码或 panic(比如取 s[i] 得到非法 UTF-8 字节)。

正确方式只有两种:

  • for range s —— 自动按 rune 迭代,i 是字节起始位置,r 是当前 rune
  • 显式转成 []rune 再下标访问(仅当真需要随机访问第 N 个字符时才考虑,有内存和性能成本)

反例:for i := 0; i → 可能输出 或崩溃

string[]rune 的开销和适用边界

转成 []rune 是深拷贝,会重新分配内存并解码所有 UTF-8 字节。对长文本(比如几 MB 的 JSON 字符串)频繁转换,GC 压力明显。

  • 只在需要**随机访问**(如 runes[5])、**修改单个字符**(需先转切片再拼回 string)或**稳定索引计算**(比如分页截断)时才转
  • 单纯遍历、统计、查找?用 for rangeutf8.DecodeRuneInString() 流式处理更轻量
  • 注意:[]rune 长度 = 字符数,但它的每个元素是 rune(int32),不是字节,所以 len([]rune(s))utf8.RuneCountInString(s)

JSON、HTTP header 等场景下长度判断容易混淆

API 返回的 Content-Length 是字节长度;前端 JS 的 "中".length 是字符长度(JS 字符串是 UTF-16,但对 BMP 字符表现像 rune 计数)。两边不一致就会出 bug,比如限制“最多 10 个字符”的输入,在 Go 后端按 len() 检查,用户输 10 个 emoji 就可能超 HTTP body 限制。

  • 对外暴露长度限制时,明确文档写清是“Unicode 字符数”还是“UTF-8 字节数”
  • 做截断(如日志打点、数据库字段 truncation)必须统一标准:入库前用 utf8.RuneCountInString() 判断,截断用 []rune 转换后取前 N 个再转回 string
  • 别依赖 strings.RuneCount() —— 它只是 utf8.RuneCountInString() 的别名,名字有误导性

字符和字节的界限在 Go 里始终清晰,但一不留神就掉进默认按字节操作的惯性里。尤其是处理用户输入、国际化文本、协议头字段时,多看一眼 len()utf8.RuneCountInString() 的差别,比事后 debug 快得多。

好了,本文到此结束,带大家了解了《Golang获取字符串长度的实用方法》,希望本文对你有所帮助!关注golang学习网公众号,给大家分享更多Golang知识!

转转官网链接及使用方法详解转转官网链接及使用方法详解
上一篇
转转官网链接及使用方法详解
Windows10任务栏图标修复教程
下一篇
Windows10任务栏图标修复教程
查看更多
最新文章
资料下载
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    516次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    500次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    485次学习
查看更多
AI推荐
  • ChatExcel酷表:告别Excel难题,北大团队AI助手助您轻松处理数据
    ChatExcel酷表
    ChatExcel酷表是由北京大学团队打造的Excel聊天机器人,用自然语言操控表格,简化数据处理,告别繁琐操作,提升工作效率!适用于学生、上班族及政府人员。
    4214次使用
  • Any绘本:开源免费AI绘本创作工具深度解析
    Any绘本
    探索Any绘本(anypicturebook.com/zh),一款开源免费的AI绘本创作工具,基于Google Gemini与Flux AI模型,让您轻松创作个性化绘本。适用于家庭、教育、创作等多种场景,零门槛,高自由度,技术透明,本地可控。
    4572次使用
  • 可赞AI:AI驱动办公可视化智能工具,一键高效生成文档图表脑图
    可赞AI
    可赞AI,AI驱动的办公可视化智能工具,助您轻松实现文本与可视化元素高效转化。无论是智能文档生成、多格式文本解析,还是一键生成专业图表、脑图、知识卡片,可赞AI都能让信息处理更清晰高效。覆盖数据汇报、会议纪要、内容营销等全场景,大幅提升办公效率,降低专业门槛,是您提升工作效率的得力助手。
    4454次使用
  • 星月写作:AI网文创作神器,助力爆款小说速成
    星月写作
    星月写作是国内首款聚焦中文网络小说创作的AI辅助工具,解决网文作者从构思到变现的全流程痛点。AI扫榜、专属模板、全链路适配,助力新人快速上手,资深作者效率倍增。
    6102次使用
  • MagicLight.ai:叙事驱动AI动画视频创作平台 | 高效生成专业级故事动画
    MagicLight
    MagicLight.ai是全球首款叙事驱动型AI动画视频创作平台,专注于解决从故事想法到完整动画的全流程痛点。它通过自研AI模型,保障角色、风格、场景高度一致性,让零动画经验者也能高效产出专业级叙事内容。广泛适用于独立创作者、动画工作室、教育机构及企业营销,助您轻松实现创意落地与商业化。
    4820次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码