亲宝软件园·资讯

展开

python文档读写操作神经网络数据准备

心之所向521 人气:0

1.python实现对doc文档的读取

#读取docx中的文本代码示例
import docx
#获取文档对象
file=docx.Document("path")
print("段落数:"+str(len(file.paragraphs)))#段落数为13,每个回车隔离一段
​
#输出每一段的内容
for para in file.paragraphs:
    print(para.text)
​
#输出段落编号及段落内容
for i in range(len(file.paragraphs)):
    print("第"+str(i)+"段的内容是:"+file.paragraphs[i].text)

2.python实现对txt文档的读取

filename = 'tangqing.txt' # txt文件和当前脚本在同一目录下,所以不用写具体路径
pos = []
Efield = []
with open(filename, 'r') as file_to_read:
  while True:
    lines = file_to_read.readline() # 整行读取数据
    if not lines:
      break
    p_tmp= [float(i) for i in lines.split()] # 将整行数据分割处理,如果分割符是空格,括号里就不用传入参数,如果是逗号, 则传入‘,'字符。
    pos = np.array(p_tmp) # 将数据从list类型转换为array类型。
    print(pos)

3.python实现对xls表格的读取

import  xdrlib ,sys
import xlrd
def open_excel(file= 'path'):
    try:
        data = xlrd.open_workbook(file)
        return data
    except Exception as e:
        print(str(e))
​
#根据索引获取Excel表格中的数据   参数:file:Excel文件路径     colnameindex:表头列名所在行的索引  ,by_index:表的索引
def excel_table_byindex(file= 'path/xxx.xls',colnameindex=0,by_index=0):
    data = open_excel(file)
    table = data.sheets()[by_index]
    nrows = table.nrows #行数
    ncols = table.ncols #列数
    colnames =  table.row_values(colnameindex) #某一行数据 
    list =[]
    for rownum in range(1,nrows):
         row = table.row_values(rownum)
         if row:
             app = {}
             for i in range(len(colnames)):
                app[colnames[i]] = row[i] 
             list.append(app)
    return list
​
#根据名称获取Excel表格中的数据   参数:file:Excel文件路径     colnameindex:表头列名所在行的所以  ,by_name:Sheet1名称
def excel_table_byname(file= 'E:\\个人文件\\6-desktop\\丰沙点表-配电所.xls',colnameindex=0,by_name=u'电度'):
    data = open_excel(file)
    table = data.sheet_by_name(by_name)
    nrows = table.nrows #行数 
    colnames =  table.row_values(colnameindex) #某一行数据 
    list =[]
    for rownum in range(1,nrows):
         row = table.row_values(rownum)
         if row:
             app = {}
             for i in range(len(colnames)):
                app[colnames[i]] = row[i]
             list.append(app)
    return list
​
def main():
   tables = excel_table_byindex()
   for row in tables:
       print(row)
           
​
   tables = excel_table_byname()
   for row in tables:
       print(row)
           
​
if __name__=="__main__":
    main()

加载全部内容

相关教程
猜你喜欢
用户评论