文章详情页

python 读取以空格分开的文件操作

浏览：22日期：2022-06-22 10:58:36

在查找数据集的时候发现，并不是所有的数据集都是以csv的格式存储，也就是每一列特征数据的分割并不是都以逗号分割，有的数据格式是以空格为分割

例如.data格式，

接下来就实现对.data格式数据的读取：

(数据来源于Boston房价预测数据集，文件名称为“housing.data”)

import pandas as pddata = pd.read_csv(’./housing.data’, delim_whiteshape=True)

以上代码就是实现了对空格的分割，但是不知道针对也是以一列存储，并且数据分割也是空格的csv文件此方法还行得通不。

另外pd.read_csv()中的参数sep和delimiter表示的意义一样，具体如何使用不清楚，目前用到不多。

遇到读取文件不知如何操作的，最后要访问下官方文档或者google查询。

pd.read_csv官方文档

另外，可以直接在原数据集文件加后缀名.csv即可转换成csv文件，但前提是data中的数据已经以，分割好了。

pd.read_csv()中读取文件时，默认第一行作为列名，但有时候第一行也是我们需要的数据，这时需制定参数header=None，或者给每列提前设置好名字，names=[‘column0’,‘column1’,…]

补充：python 实现以空格分隔的文件读写及二维数组按列折半查找

最近文件读写的工作比较多，每一次读文件都会写单独的函数来适应文件格式，所以写了一个类对文件进行操作。

（用pandas.read_csv读取文件更好用）

import osclass DealData: # 数据加载函数 def load(self, filename):data = []file = open(filename, ’r’)for line in file.readlines(): line = line.strip(’n’) # 除去换行 line = line.split(’ ’) # 文件以“ ”分隔 if '' in line: # 解决每行结尾有空格的问题line.remove('') data.append(line)file.close()return data # 折半查找 # array是一个二维数组，函数实现的功能是按照array的第lie列折半查找 def search(self, array, lie, target):low = 0high = len(array) - 1while array[low][lie] <= array[high][lie]: mid = int((low + high) / 2) midval = array[mid][lie] if midval < target:low = mid + 1 elif midval > target:high = mid - 1 if high < 0 or low >= len(array):breakreturn high # 将数据保存到文件 def save(self, data, filename):file = open(filename, ’w’)for i in range(0, len(data), 1): for k in range(0, len(data[i]), 1):file.write(str(data[i][k]))file.write(' ') file.write('n')file.close()

可以将Dealdata类单独创建一个python文件，命名为Dealdata，调用方法如下：

from DealData import DealData deal = DealData()totaldata = deal.load('E:low_data.txt')

之前先引用类：from Dealdata import Dealdata，其中第一个Dealdata为被调用的python文件名，第二个Dealdata为被调用的类名。

以上为个人经验，希望能给大家一个参考，也希望大家多多支持好吧啦网。如有错误或未考虑完全的地方，望不吝赐教。

Python 编程

上一条：Python 通过分隔符分割文件后按特定次序重新组合的操作下一条：Python 如何将字符串每两个用空格隔开

相关文章：

1. CSS3中Transition属性详解以及示例分享2. XHTML 1.0：标记新的开端3. css代码优化的12个技巧4. xpath简介_动力节点Java学院整理5. 告别AJAX实现无刷新提交表单6. 三个不常见的 HTML5 实用新特性简介7. 利用CSS3新特性创建透明边框三角8. CSS3使用过度动画和缓动效果案例讲解9. XML解析错误：未组织好的解决办法10. 使用css实现全兼容浏览器的三角形

排行榜

					
					Django正则URL匹配实现流程解析
Docker 制作镜像Dockerfile和commit操作
使用Docker的NFS-Ganesha镜像搭建nfs服务器的详细过程
docker容器调用yum报错的解决办法
jsp EL表达式详解
解决vue axios跨域 Request Method: OPTIONS问题(预检请求)
Python实现图片指定位置加图片水印（附Pyinstaller打包exe)
XML解析错误：未组织好 的解决办法
Nginx+php配置文件及原理解析
使用JavaScript 实现时间轴与动画效果的示例代码(前端组件化)
如何基于http代理解决Java固定ip问题
				

热门标签