python文档读写操作神经网络数据准备
心之所向521 人气:01.python实现对doc文档的读取
#读取docx中的文本代码示例 import docx #获取文档对象 file=docx.Document("path") print("段落数:"+str(len(file.paragraphs)))#段落数为13,每个回车隔离一段 #输出每一段的内容 for para in file.paragraphs: print(para.text) #输出段落编号及段落内容 for i in range(len(file.paragraphs)): print("第"+str(i)+"段的内容是:"+file.paragraphs[i].text)
2.python实现对txt文档的读取
filename = 'tangqing.txt' # txt文件和当前脚本在同一目录下,所以不用写具体路径 pos = [] Efield = [] with open(filename, 'r') as file_to_read: while True: lines = file_to_read.readline() # 整行读取数据 if not lines: break p_tmp= [float(i) for i in lines.split()] # 将整行数据分割处理,如果分割符是空格,括号里就不用传入参数,如果是逗号, 则传入‘,'字符。 pos = np.array(p_tmp) # 将数据从list类型转换为array类型。 print(pos)
3.python实现对xls表格的读取
import xdrlib ,sys import xlrd def open_excel(file= 'path'): try: data = xlrd.open_workbook(file) return data except Exception as e: print(str(e)) #根据索引获取Excel表格中的数据 参数:file:Excel文件路径 colnameindex:表头列名所在行的索引 ,by_index:表的索引 def excel_table_byindex(file= 'path/xxx.xls',colnameindex=0,by_index=0): data = open_excel(file) table = data.sheets()[by_index] nrows = table.nrows #行数 ncols = table.ncols #列数 colnames = table.row_values(colnameindex) #某一行数据 list =[] for rownum in range(1,nrows): row = table.row_values(rownum) if row: app = {} for i in range(len(colnames)): app[colnames[i]] = row[i] list.append(app) return list #根据名称获取Excel表格中的数据 参数:file:Excel文件路径 colnameindex:表头列名所在行的所以 ,by_name:Sheet1名称 def excel_table_byname(file= 'E:\\个人文件\\6-desktop\\丰沙点表-配电所.xls',colnameindex=0,by_name=u'电度'): data = open_excel(file) table = data.sheet_by_name(by_name) nrows = table.nrows #行数 colnames = table.row_values(colnameindex) #某一行数据 list =[] for rownum in range(1,nrows): row = table.row_values(rownum) if row: app = {} for i in range(len(colnames)): app[colnames[i]] = row[i] list.append(app) return list def main(): tables = excel_table_byindex() for row in tables: print(row) tables = excel_table_byname() for row in tables: print(row) if __name__=="__main__": main()
加载全部内容