使用python处理csv数据的常规做法

发布时间：2024-11-24 20:07

数据分析：Python的Pandas库数据处理 #生活知识# #编程教程#

1. 导入数据

2. 处理数据

3. 分析数据

1. 导入数据

在程序开始的地方，导入所有需要的包，这里是专门用来处理csv文件的包。如果是excel表格，可以把它的后缀改为.csv，后面处理方法则相同。

import csv

file_path = 'C:/Users/Mytest/test.csv'

file = open(file_path)

data = []

for i in file.readlines():

data.append(i)

file.close()

上面的file.readlines()就是把csv文件中的每一行都读出来。如果是file.readline(),则只会读首行出来。

另外，最后记得file.close()，养成良好的习惯。当然，也可以用with * open as*的方法。

2. 处理数据

现在我们把csv的数据一行行地读到了data这个列表里了。csv里数据有多少行，data的length就是多么大。

然后，先来清洗一下数据。

现在data[0]是一个尾端带'\n'的字符串。我们想把data的每一行都处理成像表格里一样，可以在上面读数据的程序中加入这么几行。

如下

new_data = []

for row in data:

tmp = row.strip('\n')

tmp = tmp.split(',')

new_data.append(tmp)

3. 分析数据

我们拿到new_data后，可以初步分析数据了。比如，可以看它的长度，每一行的数据个数等等。还可以进一步清洗数据。

len_data = len(new_data)

len_element = len(len_data[0])

如果csv的第3列是数字类型的数据，我们想把new_data中对应的数据转换类型，可以如下操作：

for i in new_data:

tmp = i[2]

new_tmp = int(tmp)

i[2] = new_tmp

如果我们想把第3列中数值大于100的那一行数据提出来，可以再做如下操作：

select_data = []

for i in new_data:

if i[2]>100:

select_data.append(i) #这是复制了符合条件的整个行的数据到新的list里

后记：

为了更方便地处理数据，我们可以把select_data转换成numpy array格式。

import numpy as np

select_data1 = np.array(select_data)

select_data1.shape

更多学习资料，请关注下面的公众号：不定期分享

深度学习网络总结机器学习算法及其应用场景算法与数据结构（leetcode 题解）cuda编程与并行优化其他读书分享如：《战国策》，《智囊全集》宇宙常识科普与星座辨别等等

来自 <https://mp.csdn.net/mdeditor/102913743>

网址：使用python处理csv数据的常规做法 https://www.yuejiaxmz.com/news/view/242104

⬅️上一篇：JSP页面打印输出，两种方法。o

➡️下一篇：24个生活小技巧，让生活质量得以

使用python处理csv数据的常规做法

相关内容

随便看看

最新动态分享

热点动态分享

专题

推荐动态分享