«

Python字符串的字符转换、字符串劈分、字符串合并问题怎么解决

时间:2024-8-6 09:04     作者:韩俊     分类: Python


这篇文章主要介绍了Python字符串的字符转换、字符串劈分、字符串合并问题怎么解决的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇Python字符串的字符转换、字符串劈分、字符串合并问题怎么解决文章都会有所收获,下面我们一起来看看吧。

    1.字符串的字符转换

    1.1.字符转换的概念

    在前面说的的字符串替换,是将字符串中的一个子串替换成了新的子串,如果我们想对字符串中的某些字符进行转换,也就是对字符串中的单个字符进行替换,可以调用方法maketrans和translate来实现。

    首先调用maketrans方法创建一个转换表,在转换表中声明要将那些字符转换成什么字符,然后将创建的转换表作为参数传给translate方法,实现字符的转换。

    maketrans方法创建转换表的语法:

    str.maketrans('转换的字符', '转换后的字符','删除的字符')

    maketrans方法可以传入三个参数:

      第一个参数用于指定被转换的字符,如果指定了多个字符,那么转换后的字符也需要指定多个,且数量都要相同,被转换的第一个字符会转换成第二个参数中的第一个字符,案例中会说明。

      第二个参数用于指定转换后的字符。

      第三个参数用于指定删除那些字符。

    定义好一个转换表之后,使用print可以打印这个转换表的内容,此时返回的是一个字典,字典中的每个key:value都是字符对应的ordinal value值。

    translate方法将转换表当做参数传入,再被定义的字符串调用,最终实现字符的转换。

    1.2.字符转换的应用案例

    1)转换表的创建

    定义转换表时,如果指定了多个被转换的字符,那么转换后的字符数量要与被转换的字符数量相同,此时第一个参数和第二个参数会交叉转换,代码如下。

    contable = str.maketrans('agx', '789')
    print(contable)
    
    '''
    代码解释:
        str.maketrans('agx', '789')定义了一个转换表,其中字符a转换成字符7,字符g转换成字符8,字符x转换成字符9
        当使用print函数打印定义的转换表时,返回的是一个字典,key是被转换的字符,value是转换后的字符,并且返回的是字符的ordinal value值
        返回结果:{97: 55, 103: 56, 120: 57}
            {97是字符a: 55是字符7, 103是字符g: 56是字符8, 120是字符x: 57是字符9}
    '''

    可以使用print函数打印转换表,返回结果是一个字典,在字典中的值是对应字符的ordinal value值,在字典中可以明确的看到什么字符会被转换成什么字符,如下图,97是字符a,55是字符7,97对应的字符会转换成55对应的字符。

    除了直接以字符串的形式声明被转换字符和转换后字符的原始值外,还可以使用字典的方法声明转换与被转换的字符,因为转换表返回的结果就是一个字典,但是用的最普遍的方法还是直接在转换表中声明被转换的字符。

    #使用字典的形式,在字典中声明转换的字符、被转换字符的原始值
    contable = str.maketrans({'a': '7', 'g': '8', 'x': '9'})
    print(contable)
    '''
        此时使用print打印转换表时,就会发现转换后的字符会以原始值的形式记录在字典中,被转换的字符还是以ordinal value值表示
    '''
    #输出结果:{97: '7', 103: '8', 120: '9'}
    
    #还是使用字典的行驶,在字典中声明被转换字符、转换字符的ordinal value值
    contable = str.maketrans({97: 55, 103: 56, 120: 57})
    print(contable)
    '''
        这种方法需要实现使用ord函数获取被转换字符、转换字符的ordinal value值,然后在字典中直接声明字符的ordinal value值
    '''
    #输出结果:{97: 55, 103: 56, 120: 57}

    2)字符的转换

    #首先定义一个转换表,这个转换表可以被任意字符串调用使用
    contable = str.maketrans('agx', '789')
    
    #定义一个字符串
    mystr = 'jiangxluplader'
    
    #使用translate方法将转换表以参数的形式传入,然后由字符串调用这个方法实现字符的转换
    print(mystr.translate(contable))
    
    #输出结果:ji7n89lupl7der

    发现字符串中所有的a字符都被转换成了7,所有的g字符都被转换成了8,所有的x字符都被转换成了9。

    3)maketrans方法定义转换表时 还可以指定要删除的字符,例如删除字符u、p

    contable = str.maketrans('agx', '789', 'up')
    mystr = 'jiangxluplader'
    print(mystr.translate(contable))
    
    '''
        maketrans方法创建转换表时,第三个参数是指定删除的字符
    '''
    
    #输出结果:ji7n89ll7der

    4)maketrans方法定义转换表中,还可以不对字符进行转换,只对某些字符进行删除,例如只删除字符u、p

    contable = str.maketrans('', '', 'up')
    mystr = 'jiangxluplader'
    print(mystr.translate(contable))
    
    #输出结果:jiangxllader

    当指定第三个参数时,会将指定的字符删除,其实就是将指定的字符设置成了None对象。

    2.字符串的劈分

    2.1.字符串劈分的概念

    所谓的字符串劈分指的是,根据指定的分隔符,将字符串一分为N个,例如字符串“aaa bbb”,默认的分隔符是空格,根据分隔符可以将这个字符串分为“aaa”,“bbb”,这就是字符串的劈分。字符串的劈分共有两种方法:

    1)调用方法split或者rsplit劈分字符串

      split方法是从字符串的左侧开始劈分字符串,从前往后开始劈分。

      rsplit方法是从字符串的右侧开始劈分字符串,从后往前开始劈分。

    split和rsplit方法会根据分隔符对字符串中所有出现分隔符的地方进行劈分。

    默认的分隔符是空格字符串,这两个方法如果不指定最大的劈分次数,输出的内容没有任何区别,并且这两个方法的返回值都是一个列表。

    当字符串中没有指定的分隔符时,这两个方法都会返回字符串本身,但是也会将字符串本身放在列表中。

    2)调用方法partition或者rpartition劈分字符串

    partition和rpartition这两个方法在调用的时候必须指定分隔符,然后对字符串进行劈分,这两个方法对字符串劈分后会返回一个元组。

      partition方法是左劈分,从左往右找到分隔符第一次出现的位置,然后开始劈分字符串,始终劈分成三个元素,第一个元素是分隔符左侧的部分,第二个元素是分隔符,第三个元素是分隔符后面的部分。

      rpartition方法是右劈分,从右往左找到分隔符第一次出现的位置,或者从左往右找到分隔符最后一次出现的位置,然后开始劈分字符串,始终劈分成三个元素,第一个元素是分隔符左侧的部分,第二个元素是分隔符,第三个元素是分隔符后面的部分。

    partition方法和rpartition只会将字符串中第一次出现分隔符的位置,进行劈分,一分为三,这就是与split方法的最大区别

    partition方法和rpartition两个方法只是开始劈分的位置处不同,然后将字符串劈分为三个元素:

      分隔符前面的部分

      分隔符

      分隔符后面的部分

    如果字符串中不存在指定的分隔符,两个方法都会返回字符串本身,partition方法劈分的三个元素顺序依次为:字符串本身、空字符串、空字符串,rpartition方法劈分的三个元素依次为:空字符串、空字符串、字符串本身。

    2.2.调用方法split或者rsplit劈分字符串

    1)基本的劈分案例

    #原始字符串
    mystr = "DevOps Jenkins Kubernetes"
    
    #左劈分
    print(mystr.split())
    
    #右劈分
    print(mystr.rsplit())
    
    '''
        左劈分是从DevOps第一个空格字符串处开始劈分,右劈分是从Kubernetes最后一个空格字符串处开始劈分
        默认的劈分字符串是空格字符串,只要遇到空格字符串,就将空格字符串左侧的字符串劈分出来。
    '''

    可以看到split和rsplit两个方法对字符串劈分后,并没有明显的区别。

    2)通过参数sep指定分隔符劈分字符串

    在split和rsplit方法中都可以使用sep参数指定分隔符,从而根据指定的分隔符去劈分字符串。

    mystr = "DevOps|Jenkins|Kubernetes"
    print(mystr.split(sep='|'))
    print(mystr.rsplit(sep='|'))
    
    '''
        split(sep='|')、rsplit(sep='|')指定分隔符为“|”
    '''

    可以看到split和rsplit两个方法对字符串劈分后,并没有明显的区别。

    当指定的分隔符字符串不存在时,则会返回字符串本身,但是也会将字符串本身放在列表中。

    mystr = "DevOps Jenkins Kubernetes"
    print(mystr.split(sep='|'))
    print(mystr.rsplit(sep='|'))

    3)通过参数maxsplit指定劈分字符串的最大劈分次数

    在split和rsplit方法中都可以使用maxsplit参数指定劈分字符串的最大劈分次数,什么意思呢?原本一个字符串可以被劈分6次,但是我们只需要劈分2次就行,就可以使用maxsplit参数指定指定劈分字符串的最大劈分次数。

    当指定了最大的劈分次数时,当超过最大的劈分次数后,剩余的子串会单独作为一部分输出,此时split和rsplit两个劈分方法就会有明显的区别。

    #定义原始字符串
    mystr = "DevOps|Jenkins|Kubernetes|Python|Gitlab"
    
    '''
        使用split方法是从左往右开始劈分,从第一个子串位置处开始劈分,分隔符为"|",劈分次数为2,本身这个字符串可以被劈分5次,我们只劈分2次,那么DevOps、Jenkins会被劈分出来作为列表的单独元素,而剩余的子串Kubernetes|Python|Gitlab会被作为一部分放在列表的一个元素内
    '''
    print(mystr.split(sep='|', maxsplit=2))
    #输出结果:['DevOps', 'Jenkins', 'Kubernetes|Python|Gitlab']
    
    '''
        使用rsplit方法是从右往左开始劈分,从最后一个子串处开始劈分,分隔符为"|",劈分次数为2,本身这个字符串可以被劈分5次,我们只劈分2次,那么Gitlab、Python这两个字符串会被劈分出来作为列表的单独元素,而剩余的字符DevOps|Jenkins|Kubernetes会被作为一部分,放在列表的一个元素内
    '''
    print(mystr.rsplit(sep='|', maxsplit=2))
    #输出结果:['DevOps|Jenkins|Kubernetes', 'Python', 'Gitlab']

    当在劈分方法内指定了最大的劈分次数的参数时,split左劈分和rsplit右劈分就会有明显的区别,split方法是从前往后根据分隔符进行劈分,rsplit方法是从后往前根据分隔符进行劈分。

    2.3.调用方法partition或者rpartition劈分字符串

    partition方法是左劈分,从左往右找到分隔符第一次出现的位置,然后开始劈分字符串,始终劈分成三个元素,第一个元素是分隔符左侧的部分,第二个元素是分隔符,第三个元素是分隔符后面的部分。

    rpartition方法是右劈分,从右往左找到分隔符第一次出现的位置,或者从左往右找到分隔符最后一次出现的位置,然后开始劈分字符串,始终劈分成三个元素,第一个元素是分隔符左侧的部分,第二个元素是分隔符,第三个元素是分隔符后面的部分。

    这两个方法,只会根据一个分隔符进行劈分字符串,且始终劈分成三个元素,partition方法的分隔符取决于在字符串中第一次出现的分隔符,rpartition方法的分隔符取决于字符串中最后一次出现的分隔符。

    1)调用方法partition劈分字符串

    mystr = "DevOps|Jenkins|Kubernetes|Python|Gitlab"
    print(mystr.partition('|'))
    
    '''
        partition从左往右找到第一次出现分隔字符串的位置,从这里开始劈分字符串,分隔符左侧的部分(DevOps)为第一个元素,分隔符(|)为第二个元素,分隔符右侧的部分(Jenkins|Kubernetes|Python|Gitlab)为第三个元素。
    '''
    
    #输出结果:('DevOps', '|', 'Jenkins|Kubernetes|Python|Gitlab')

    2)调用方法rpartition劈分字符串

    mystr = "DevOps|Jenkins|Kubernetes|Python|Gitlab"
    print(mystr.rpartition('|'))
    
    '''
        rpartition从左往右找到最后一次出现分隔字符串的位置,分隔符左侧的部分(DevOps)为第一个元素,分隔符(|)为第二个元素,分隔符右侧的部分(Jenkins|Kubernetes|Python|Gitlab)为第三个元素。
    '''
    
    #输出结果:('DevOps|Jenkins|Kubernetes|Python', '|', 'Gitlab')

    确实和理论说明的一样,从左往右找到最后一次分隔符出现的位置,分隔符左侧的部分为元组中的第一个元素,分隔符为第二个元素,分隔符右侧的部分为元组中的第三个元素。

    3)当字符串中只有一个分隔符字符串且分隔符后没有任何字符时

    当字符串中只有一个分隔符字符串时,且分隔符后面没有任何字符串,此时无论是partition方法还是rpartition方法,劈分的字符串第三个元素一定为空。

    mystr = "DevOps|"
    print(mystr.partition('|'))
    print(mystr.rpartition('|'))

    第三个元素取的都是分隔符后面的部分,分隔符后面的部分什么也没有,因此就会输出空字符串。

    4)当字符串中不存在指定的分隔符字符串(partition方法)

    如果字符串中不存在指定的分隔符,partition方法劈分的三个元素顺序依次为:字符串本身、空字符串、空字符串。

    mystr = "DevOps|Jenkins|Kubernetes|Python|Gitlab"
    print(mystr.partition('*'))
    
    #输出结果:('DevOps|Jenkins|Kubernetes|Python|Gitlab', '', '')

    第一个元素是字符串的本身,第二个元素是空字符串,第三个元素也是空字符串。

    4)当字符串中不存在指定的分隔符字符串(rpartition方法)

    如果字符串中不存在指定的分隔符,rpartition方法劈分的三个元素顺序依次为:空字符串、空字符串、字符串本身。

    mystr = "DevOps|Jenkins|Kubernetes|Python|Gitlab"
    print(mystr.rpartition('*'))

    第一个元素是空字符串,第二个元素是空字符串,第三个元素是字符串的本身。

    3.字符串的合并

    可以调用方法join将多个字符串合并成一个字符串。语法格式如下:

    '字符串的间隔符'.join(列表|数组)
    
    字符串的间隔符可以指定,也可以不指定,指定后,每个元素字符串在合并时都会在后面添加一个分隔符。

    1)使用join方法将列表中多个字符串进行合并

    使用join方法可以将列表中的多个元素,元素也都是字符串,将这些字符串进行合并。

    print(''.join(["Python", "Go", "K8S"]))
    
    #输出结果:PythonGoK8S

    使用join方法将列表中的每个元素合并时添加一个分隔符“|”

    print('|'.join(["Python", "Go", "K8S"]))
    
    #输出结果:Python|Go|K8S

    2)使用join方法将元组中的多个字符串进行合并

    join方法也可以将元组中的元素合并。

    print('|'.join(("Python", "Go", "K8S")))
    
    #输出结果:Python|Go|K8S

    3)可以把字符串看成是字符的列表,然后使用join方法将这些字符合并成字符串

    可以把字符串看成是字符的列表,然后使用join将这些字符加上分隔符合并成新的字符串。

    print('|'.join("Python"))
    
    #输出结果:P|y|t|h|o|n

    标签: python

    热门推荐