Lua 字符串

/ lua / 没有评论 / 1889浏览

Lua 字符串

字符串或串(String)是由数字、字母、下划线组成的一串字符。

Lua 语言中字符串可以使用以下三种方式来表示:

以上三种方式的字符串实例如下:

string1 = "Lua"
print(""字符串 1 是"",string1)
string2 = 'runoob.com'
print("字符串 2 是",string2)

string3 = [["Lua 教程"]]
print("字符串 3 是",string3)

以上代码执行输出结果为:

"字符串 1 是"    Lua
字符串 2 是    runoob.com
字符串 3 是    "Lua 教程"

转义字符用于表示不能直接显示的字符,比如后退键,回车键,等。如在字符串转换双引号可以使用 """。

所有的转义字符和所对应的意义:

转义字符意义ASCII码值(十进制)
\a响铃(BEL)007
\b退格(BS) ,将当前位置移到前一列008
\f换页(FF),将当前位置移到下页开头012
\n换行(LF) ,将当前位置移到下一行开头010
\r回车(CR) ,将当前位置移到本行开头013
\t水平制表(HT) (跳到下一个TAB位置)009
\v垂直制表(VT)011
\代表一个反斜线字符'''092
'代表一个单引号(撇号)字符039
"代表一个双引号字符034
\0空字符(NULL)000
\ddd1到3位八进制数所代表的任意字符三位八进制
\xhh1到2位十六进制所代表的任意字符二位十六进制

字符串操作

Lua 提供了很多的方法来支持字符串的操作:

  1. string.upper(argument): 字符串全部转为大写字母。

  2. string.lower(argument): 字符串全部转为小写字母。

  3. string.gsub(mainString,findString,replaceString,num) 在字符串中替换。mainString 为要操作的字符串, findString 为被替换的字符,replaceString 要替换的字符,num 替换次数(可以忽略,则全部替换),如:

    > string.gsub("aaaa","a","z",3);
    zzza    3
    
  4. string.find (str, substr, [init, [end]]) 在一个指定的目标字符串中搜索指定的内容(第三个参数为索引),返回其具体位置。不存在则返回 nil。

    > string.find("Hello Lua user", "Lua", 1) 
    7    9
    
  5. string.reverse(arg) 字符串反转

    > string.reverse("Lua")
    auL
    
  6. string.format(...) 返回一个类似printf的格式化字符串

    > string.format("the value is:%d",4)
    the value is:4
    
  7. string.char(arg) 和 string.byte(arg[,int])

    char 将整型数字转成字符并连接, byte 转换字符为整数值(可以指定某个字符,默认第一个字符)。

    > string.char(97,98,99,100)
    abcd
    > string.byte("ABCD",4)
    68
    > string.byte("ABCD")
    65
    >
    
  8. string.len(arg)

    计算字符串长度。

    string.len("abc")
    3
    
  9. string.rep(string, n)

    返回字符串string的n个拷贝

    > string.rep("abcd",2)
    abcdabcd
    
  10. .. 链接两个字符串

    > print("www.runoob.".."com")
    www.runoob.com
    
  11. string.gmatch(str, pattern)

    回一个迭代器函数,每一次调用这个函数,返回一个在字符串 str 找到的下一个符合 pattern 描述的子串。如果参数 pattern 描述的字符串没有找到,迭代函数返回nil。

    > for word in string.gmatch("Hello Lua user", "%a+") do print(word) end
    Hello
    Lua
    user
    
  12. string.match(str, pattern, init) string.match()只寻找源字串str中的第一个配对. 参数init可选, 指定搜寻过程的起点, 默认为1。 在成功配对时, 函数将返回配对表达式中的所有捕获结果; 如果没有设置捕获标记, 则返回整个配对字符串. 当没有成功的配对时, 返回nil。

    > = string.match("I have 2 questions for you.", "%d+ %a+")
    2 questions
    
    > = string.format("%d, %q", string.match("I have 2 questions for you.", "(%d+) (%a+)"))
    2, "questions"
    

字符串大小写转换

以下实例演示了如何对字符串大小写进行转换:

string1 = "Lua";
print(string.upper(string1))
print(string.lower(string1))

以上代码执行结果为:

LUA
lua

字符串查找与反转

以下实例演示了如何对字符串进行查找与反转操作:

string = "Lua Tutorial"
-- 查找字符串
print(string.find(string,"Tutorial"))
reversedString = string.reverse(string)
print("新字符串为",reversedString)

以上代码执行结果为:

5    12
新字符串为    lairotuT auL

字符串格式化

Lua 提供了 string.format() 函数来生成具有特定格式的字符串, 函数的第一个参数是格式 , 之后是对应格式中每个代号的各种数据。

由于格式字符串的存在, 使得产生的长字符串可读性大大提高了。这个函数的格式很像 C 语言中的 printf()。

以下实例演示了如何对字符串进行格式化操作:

格式字符串可能包含以下的转义码:

为进一步细化格式, 可以在%号后添加参数. 参数将以如下的顺序读入:

string1 = "Lua"
string2 = "Tutorial"
number1 = 10
number2 = 20
-- 基本字符串格式化
print(string.format("基本格式化 %s %s",string1,string2))
-- 日期格式化
date = 2; month = 1; year = 2014
print(string.format("日期格式化 %02d/%02d/%03d", date, month, year))
-- 十进制格式化
print(string.format("%.4f",1/3))

以上代码执行结果为:

基本格式化 Lua Tutorial
日期格式化 02/01/2014
0.3333

其他例子:

string.format("%c", 83)                 -- 输出S
string.format("%+d", 17.0)              -- 输出+17
string.format("%05d", 17)               -- 输出00017
string.format("%o", 17)                 -- 输出21
string.format("%u", 3.14)               -- 输出3
string.format("%x", 13)                 -- 输出d
string.format("%X", 13)                 -- 输出D
string.format("%e", 1000)               -- 输出1.000000e+03
string.format("%E", 1000)               -- 输出1.000000E+03
string.format("%6.3f", 13)              -- 输出13.000
string.format("%q", "One\nTwo")         -- 输出"One\
                                        --   Two"
string.format("%s", "monkey")           -- 输出monkey
string.format("%10s", "monkey")         -- 输出    monkey
string.format("%5.3s", "monkey")        -- 输出  mon

字符与整数相互转换

以下实例演示了字符与整数相互转换:

实例

-- 字符转换
-- 转换第一个字符
print(string.byte("Lua"))
-- 转换第三个字符
print(string.byte("Lua",3))
-- 转换末尾第一个字符
print(string.byte("Lua",-1))
-- 第二个字符
print(string.byte("Lua",2))
-- 转换末尾第二个字符
print(string.byte("Lua",-2))

-- 整数 ASCII 码转换为字符
print(string.char(97))

以上代码执行结果为:

76
97
97
117
117
a

其他常用函数

以下实例演示了其他字符串操作,如计算字符串长度,字符串连接,字符串复制等:

string1 = "www."
string2 = "runoob"
string3 = ".com"
-- 使用 .. 进行字符串连接
print("连接字符串",string1..string2..string3)

-- 字符串长度
print("字符串长度 ",string.len(string2))

-- 字符串复制 2 次
repeatedString = string.rep(string2,2)
print(repeatedString)

以上代码执行结果为:

连接字符串    www.runoob.com
字符串长度     6
runoobrunoob

匹配模式

Lua 中的匹配模式直接用常规的字符串来描述。 它用于模式匹配函数 string.find, string.gmatch, string.gsub, string.match

你还可以在模式串中使用字符类。

字符类指可以匹配一个特定字符集合内任何字符的模式项。比如,字符类 %d 匹配任意数字。所以你可以使用模式串 %d%d/%d%d/%d%d%d%d 搜索 dd/mm/yyyy 格式的日期:

s = "Deadline is 30/05/1999, firm"
date = "%d%d/%d%d/%d%d%d%d"
print(string.sub(s, string.find(s, date)))    --> 30/05/1999

下面的表列出了Lua支持的所有字符类:

单个字符(除 ^$()%.[]*+-? 外): 与该字符自身配对

当上述的字符类用大写书写时, 表示与非此字符类的任何字符配对. 例如, %S表示与任何非空白字符配对.例如,'%A'非字母的字符:

> print(string.gsub("hello, up-down!", "%A", "."))
hello..up.down.    4

数字4不是字符串结果的一部分,他是gsub返回的第二个结果,代表发生替换的次数。

在模式匹配中有一些特殊字符,他们有特殊的意义,Lua中的特殊字符如下:

( ) . % + - * ? [ ^ $

'%' 用作特殊字符的转义字符,因此 '%.' 匹配点;'%%' 匹配字符 '%'。转义字符 '%'不仅可以用来转义特殊字符,还可以用于所有的非字母的字符。

模式条目可以是:

模式:

模式 指一个模式条目的序列。 在模式最前面加上符号 '^' 将锚定从字符串的开始处做匹配。 在模式最后面加上符号 '$' 将使匹配过程锚定到字符串的结尾。 如果 '^' 和 '$' 出现在其它位置,它们均没有特殊含义,只表示自身。

捕获:

模式可以在内部用小括号括起一个子模式; 这些子模式被称为 捕获物。 当匹配成功时,由 捕获物 匹配到的字符串中的子串被保存起来用于未来的用途。 捕获物以它们左括号的次序来编号。 例如,对于模式 "(a*(.)%w(%s*))" , 字符串中匹配到 "a*(.)%w(%s*)" 的部分保存在第一个捕获物中 (因此是编号 1 ); 由 "." 匹配到的字符是 2 号捕获物, 匹配到 "%s*" 的那部分是 3 号。

作为一个特例,空的捕获 () 将捕获到当前字符串的位置(它是一个数字)。 例如,如果将模式 "()aa()" 作用到字符串 "flaaap" 上,将产生两个捕获物: 3 和 5 。

笔记

  1. 将阿拉伯数字转换为语文汉字数字:

    local function NumToCN(num)
        local size = #tostring(num)
        local CN = ""
        local StrCN = {"一","二","三","四","五","六","七","八","九"}
        for i = 1 , size do
            CN = CN .. StrCN[tonumber(string.sub(tostring(num), i , i))]
        end
        return CN
    end
    print(NumToCN(56665))
    
  2. 移除中文部分:

    function StrSplit(inputstr, sep)
        if sep == nil then
          sep = "%s"
        end
        local t={}
        local i=1
        for str in string.gmatch(inputstr, "([^"..sep.."]+)") do
           t[i] = str
           i = i + 1
        end
        return t
    end
    local a = "23245023496830,汉字。。。。"
    local b = ":"
    b = StrSplit(a,",")
    print(b[1])
    
    ----輸出: 23245023496830
    
  3. 去除字符串首尾的空格

    function trim(s)
      return (string.gsub(s, "^%s*(.-)%s*$", "%1")) 
    end
    string1 = "   RUNOOB        "
    string2 = trim(string1)
    print(string2)
    
  4. %f 的使用

    需求获取特殊边界的字符串。

    举例:"123 h123 hds45678 fdaga123ad h123s"

    需求:获取左边界为字母,右边界为空格的数字字符串。

    1.获取所有带边界的数字串

    str1 =  "123 h123 hds45678 fdaga123ad  h123s"
    string.gmatch(str1,"%D%d+%D")
    

    匹配结果:123 h123 s45678 a123a h123s

    确定边界:左:%a 右:%s

    string.gmatch(str1,"%f[%A]%d+%f[%s]")
    
    匹配结果:45678
    
  5. string.gsub 函数替代是按照字节来替代的。如本例中:

    > print(string.gsub("hello,up-down!", "%A", "."))
    

    输出为:

    hello..up.down. 4
    

    原因是 hello 后的逗号为中文全角,占两个字节,所以替换两次。

  6. string.gsub 函数替代是按照字节来替代的。如本例中:

    > print(string.gsub("hello, up-down!", "%A", "."))
    

    输出为:

    hello..up.down. 4
    

    原因是逗号后面是有一个空格的,占一个字节,所以 ", 空格 - ! ",一个四个,共四次,前面说的中文逗号虽然也能解释,但是我觉得还是空格比较符合官方的意思。