博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Go语言中byte类型和rune类型(五)
阅读量:4884 次
发布时间:2019-06-11

本文共 1040 字,大约阅读时间需要 3 分钟。

本篇内容本来准备在上一篇写的,想了想还是拆开写。

 

go语言中字符串需要使用用双引号,而单引号用来表示单个的字符,字符也是组成字符串的元素。go语言的字符有两种:

  1. uint8类型,或者叫 byte 型,代表了ASCII码的一个字符。
  2. rune类型,代表一个 UTF-8字符

ASCII编码是1个字节,而UTF-8是可变长的编码,当要表示中文等非ASCll编码的字符时,需要使用UTF-8编码来保证不会乱码。

 

举个例子,来遍历打印一个字符串,当使用byte类型时:

func main() {    str:="hello 世界"    for i:=0;i

上面结果,英文字符正确打印,但中文乱码。是因为UTF8编码下一个中文汉字由3~4个字节组成,而字符串是由byte字节组成,所以长度也是byte字符长度,这样遍历时遇到中文就乱码了。

 

遇到这种带中文的字符串,可以使用go提供的另一个方法来遍历:

func main() {    str:="hello 世界"    for _,r:=range str{        fmt.Printf("%c",r) // hello 世界    }}

使用range,其实是使用rune类型来编码的,rune类型用来表示utf8字符,一个rune字符由一个或多个byte组成。

 

修改字符串

所谓对字符串的修改其实不是对字符串本身的修改,而是复制字符串,同时修改值,即重新分配来内存。

在go中修改字符串,需要先将字符串转化成数组,[]byte 或 []rune,然后再转换成 string型。

 

对于全是ASCII编码的字符串:

func main() {    str:="abc"    s2:=[]byte(str)    s2[0]='b'    fmt.Println(string(s2)) //bbc}

 

对于包含非ASCII编码的字符串:

func main() {    str:="白猫"    s2:=[]rune(str)    s2[0]='黑'    fmt.Println(string(s2)) //黑猫}

上面使用到的 string(),表示强制类型转换,转换为字符串。

 

本篇主要介绍 byte 和 rune 两种类型的字符,涉及到的for循环和强制类型转换可以简单了解下,有编程基础的很容易懂。

转载于:https://www.cnblogs.com/wjaaron/p/11485685.html

你可能感兴趣的文章
CocoaPods 1.0之前版本无法pod install和pod update! 更新后CocoaPods 1.1.1 Podfile新的写法....
查看>>
Java复习第一天——数组存储位置
查看>>
Java复习-基础类库
查看>>
Log4j rootLogger配置
查看>>
TCP、UDP、HTTP知识整理
查看>>
ORACLE 内置函数之GREATEST和LEAST
查看>>
C#语音朗读文本 — TTS的实现
查看>>
php常用易混淆概念
查看>>
本机搭建iis 开发环境
查看>>
js读取ognl表达式的内容
查看>>
layer弹出层全屏及关闭
查看>>
容器自动补全端口
查看>>
Linux下如何查看哪些进程占用的CPU内存资源最多
查看>>
RabbitMQ与Redis队列对比
查看>>
python:进程
查看>>
在自学django中摸爬滚打一个多月后的总结整理,思维层面
查看>>
递归、模块、正则表达式
查看>>
Idea过期继续激活~
查看>>
标准插件写法
查看>>
权限控制框架---shiro入门
查看>>