[学习交流] 【上海校区】python处理文本文件

初始的数据集一般存放在txt文件，如何将其从文本文件中提取出来进行处理。下面就刚学的一种方法，进行试探性总结：

这里我用下面的一个txt文件为例：

上图这个文本文件中一共有20行数据，每行数据有四列，前三列为属性列，最后一列为类别标签。

我想将这个文件最终划分为两个列表，一个是样本列表，只包含前三列数据，另一个是标签列表，只包含最后一列数据

首先看一看readline这个函数的用法：

输出为：

这里每一行之间为什么会空一行，我的看法是，文本文档中的每一行末尾都有一个换行符，输出的时候也会输出换行符，导致了这个结果

下面给出主要代码：

上述代码实现后，line内的元素将会呈现较为有秩序的状态

下面以第一行输出为准：

算是达到了预期效果

下面开始将其录入到我们的数据集中

返回的值为：

虽然看起来丑了点，但还是可以用的。

总的源码为：

下面我换个函数试一试：

总的来说没多大改变，直接贴代码和输出了

输出为：

这是第一行的输出，最终返回的是一样的，就不放了

wuqiong · wuqiong

不二晨 · 不二晨

奈斯，很赞

吴琼老师 · 吴琼老师

帐号		自动登录	找回密码
密码			加入黑马

3 个回复