Python字符串函数
涤生手记大数据 人气:0Python的友好在于提供了非常好强大的功能函数模块,对于字符串的使用,同样提供许多简单便捷的字符串函数。Python 字符串自带了很多有用的函数,在字符串函数之前先介绍一个非常实用的dir()内置函数,因为对每一个初学者还是大佬级别的python程序员,都不能完全记住所有方法。而该函数可以查看所有这些函数,可调用 dir 并将参数指定为任何字符串(如 dir("")),其返回值包括字符串可以使用的变量、方法和定义的类型。
>>> dir("") ['__add__', '__class__', '__contains__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getnewargs__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__mod__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__rmod__', '__rmul__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'capitalize', 'casefold', 'center', 'count', 'encode', 'endswith', 'expandtabs', 'find', 'format', 'format_map', 'index', 'isalnum', 'isalpha', 'isdecimal', 'isdigit', 'isidentifier', 'islower', 'isnumeric', 'isprintable', 'isspace', 'istitle', 'isupper', 'join', 'ljust', 'lower', 'lstrip', 'maketrans', 'partition', 'replace', 'rfind', 'rindex', 'rjust', 'rpartition', 'rsplit', 'rstrip', 'split', 'splitlines', 'startswith', 'strip', 'swapcase', 'title', 'translate', 'upper', 'zfill']
其也提供对功能函数的查询,比如经常使用的math()函数,所以无论是对后面所阐述的字符串函数还是其它函数,我们都可以用dir()内置函数来了解其它函数的类型、定义等等。下面所讲述的字符串函数会区分其不同功能来分开介绍,其函数的实现功能大致包含以下六个功能:索引特殊字符串、设置字符格式、修改字符串大小写、查看字符串特定格式、替换特定字符串、拆分特定字符串。
1 搜索字符串函数
假如我们需要在一段字符串中查找特定的子串时,通常涉及以下几个函数:
虽然这几个函数都实现了搜索特定字符串的功能,但还是包含一些区别的:
1. 函数 index 和 find 之间的差别在于没有找到指定子串时的情形 ,示例如下:
函数index会抛出异常 ValueError,而如果没有找到指定的子串,函数find将返回 -1。
2.字符串搜索函数通常从左往右(从开头往末尾)搜索,但以 r 打头的函数从右往左搜索。例如:
可以看到, 函数 find 和 index 返回传入字符串第一次出现时的起始位置索引,而 rfind 和 rindex 返回传入字符串最后一次出现时的起始位置索引。
2 设置字符串格式函数
下表列出了一些设置字符串格式的函数:
center(),ljust()和rjust()函数在日常用的使用很少,反倒是Python2.6以后的format()受到了广大字符串处理者的使用。使用format函数需要给它提供变量或者值,一个简单的例子:字符串中的 {0} 和 {1} 引用 format 的参数:它们将被替换为相应字符串或变量的值。也可以使用关键字参数的名称,
>>> '{0} like eat {1}'.format('Wangzi','banana') 'Wangzi like eat banana' >>> '{who} {id} is Linda'.format(who='My',id='name') 'My name is Linda'
这是一些比较简单的例子,还有更多细节方面的使用可以参考string — Common string operations — Python 3.10.1 documentation。下面举一个在抓取jmx数值的实际使用案例。在大数据组件使用过程中,我们通常抓取jmx接口的数据获取详情,然后将数据接到相关的展示系统中来监控和展示:例如我们需要抓取一个队列任务扥id,使用者,运行时间等指标值(此处IP做了处理,有问题可以咨询博主)。
import json import urllib3 import re def get_ative_resourcemanager(rm1, rm2): http = urllib3.PoolManager() rm_list = [rm1, rm2] for resourcemanager in rm_list: url = 'http://{0}/ws/v1/cluster/info'.format(resourcemanager) response = http.request('GET', url) data = json.loads(response.data) ha_state = data['clusterInfo']['haState'] if ha_state == "ACTIVE": return resourcemanager '''Conversion time function''' # 毫秒级转化为hour/minutes def conver_time(allTime): hours = (allTime/(60*60*1000)) return hours '''get active resourcemanager yarn application metrics''' def get_queue_metrics(): active_resoucemanager = get_ative_resourcemanager('ip1:port', 'ip2:port') http = urllib3.PoolManager() url = 'http://{0}/ws/v1/cluster/apps'.format(active_resoucemanager) response = http.request('GET', url) data = json.loads(response.data).get('apps').get('app') length = len(data) for i in range(length): '''判断application状态''' application_state = data[i]['state'] queue = data[i]['queue'] queue_name = re.findall(r'root.*',queue,re.IGNORECASE) #print(mobdi_queue) if (application_state == 'RUNNING' or application_state == 'ACCEPTED'): if queue_name: id_metric = data[i]['id'] user_metric = data[i]['user'] queue_metrics = data[i]['queue'] elapsed_time = data[i]['elapsedTime'] runtime_metric = conver_time(elapsed_time) print(str(id_metric) + " " + str(user_metric) + " " + str(queue_metrics) + " " + str(runtime_metric)) if __name__ == '__main__': '''''' get_queue_metrics()
执行结果:
3 改变字符串大小写函数
提供改变字符串大小写的函数有以下五个函数:
Python 提供了各种修改字母大小写的函数,如上表。但注意标红的地方,Python并没有修改字符串,而是在这几个函数中,创建并返回一个新字符串,并没有真正修改string源字符串。
4 选定字符串函数
选定字符串函数通常用于删除字符串开头或者末尾多余的字符串,具体有striip,lstrip和rstrip三个函数。
1.如果不加字符串,将删除空白字符串:
2.删除字符串情况:
5 拆分字符串函数
Python提供了以下几个拆分字符串的函数,主要将字符串拆分成多个子串。
注意示例中存在string和string1两个字符串,函数 partition 和 rpartition 将字符串拆分为3部分,这两个函数总是返回一个这样的值:由3个字符串组成, 形式为 (head, sep, tail) ;而函数 split 以指定字符串为分隔符,将 字符串划分为一系列子串,返回一个字符串列表,列表总是分别以 [ 和 ] 打头和结尾,并用逗号分隔元素。splitlines函数按照行('\r', '\r\n', \n')分隔,返回一个包含各行作为元素的列表,使用很少,而且会自行判断字符串是否包含换行符。
6 替换字符串函数
Python内置两个字符串替换函数,包括:
加载全部内容