A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

初始的数据集一般存放在txt文件,如何将其从文本文件中提取出来进行处理。下面就刚学的一种方法,进行试探性总结:

这里我用下面的一个txt文件为例:

上图这个文本文件中一共有20行数据,每行数据有四列,前三列为属性列,最后一列为类别标签。

我想将这个文件最终划分为两个列表,一个是样本列表,只包含前三列数据,另一个是标签列表,只包含最后一列数据

首先看一看readline这个函数的用法:

输出为:

这里每一行之间为什么会空一行,我的看法是,文本文档中的每一行末尾都有一个换行符,输出的时候也会输出换行符,导致了这个结果

下面给出主要代码:

上述代码实现后,line内的元素将会呈现较为有秩序的状态

下面以第一行输出为准:

算是达到了预期效果

下面开始将其录入到我们的数据集中

返回的值为:

虽然看起来丑了点,但还是可以用的。

总的源码为:

下面我换个函数试一试:

总的来说没多大改变,直接贴代码和输出了

输出为:

这是第一行的输出,最终返回的是一样的,就不放了


3 个回复

倒序浏览
回复 使用道具 举报
奈斯,很赞
回复 使用道具 举报
回复 使用道具 举报
您需要登录后才可以回帖 登录 | 加入黑马