Pandas 类型转换astype()
山茶花开时。 人气:0Python中和Pandas中数据类型对应关系如下:
- 果数据是纯净的数据,可以转化为数字
- astype基本也就是两种用作,数字转化为单纯字符串,单纯数字的字符串转化为数字,含有其他的非数字的字符串是不能通过astype进行转化的。
- 需要引入其他的方法进行转化,也就有了下面的自定义函数方法
astype()是最常见也是最通用的数据类型转换方法
import pandas as pd df = pd.DataFrame([['liver','E',89,21,24,64], ['Arry','C',36,37,37,57], ['Ack','A',57,60,18,84], ['Eorge','C',93,96,71,78], ['Oah','D',65,49,61,86] ], columns = ['name','team','Q1','Q2','Q3','Q4']) res = df.dtypes df.Q1.astype('int32').dtypes # dtype('int32') df.astype({'Q1':'int32','Q2':'int32'}).dtypes
结果展示
df
res
扩展
# 以下是一些使用示例: df.index.astype('int64') # 索引类型转换 df.astype('int32') # 所有数据转换为int32 df.astype({'col1':'int32'}) # 指定字段转指定类型 s.astype('int64') s.astype('int64',copy = False) # 不与原数据关联 df['name'].astype('object') data['Q4'].astype('float') s.astype('datatime64[ns]') # 转为时间类型 data['状态'].astype('bool')
数据类型
df.dtypes会返回每个字段的数据类型及DataFrame整体的类型
如果是Series,需要用s.dtype
import pandas as pd df = pd.DataFrame([['liver','E',89,21,24,64], ['Arry','C',36,37,37,57], ['Ack','A',57,60,18,84], ['Eorge','C',93,96,71,78], ['Oah','D',65,49,61,86] ], columns = ['name','team','Q1','Q2','Q3','Q4']) df.dtypes s = pd.Series(['One','Two','Three']) s.dtype
结果展示
df
s
当数据的格式不具备转换为目标类型的条件时,需要先对数据进行处理
例如“89.3%”是一个字符串,要转换为数字,要先去掉百分号:
# 将"89.3%"这样的文本转为浮点数 data.rate.apply(lambda x:x.replace('%','')).astype('float')/100
加载数据时可以指定数据各列的类型:
import pandas as pd # 对所有字段指定统一类型 df = pd.DataFrame(data, dtype = 'float32') # 对每个字段分别指定 df = pd.read_excel(data, dtype = {'team':'string','Q1':'int32'})
加载全部内容