初始的数据集一般存放在txt文件,如何将其从文本文件中提取出来进行处理。下面就刚学的一种方法,进行试探性总结: 这里我用下面的一个txt文件为例: 上图这个文本文件中一共有20行数据,每行数据有四列,前三列为属性列,最后一列为类别标签。 我想将这个文件最终划分为两个列表,一个是样本列表,只包含前三列数据,另一个是标签列表,只包含最后一列数据 首先看一看readline这个函数的用法: 输出为: 这里每一行之间为什么会空一行,我的看法是,文本文档中的每一行末尾都有一个换行符,输出的时候也会输出换行符,导致了这个结果 下面给出主要代码: 上述代码实现后,line内的元素将会呈现较为有秩序的状态 下面以第一行输出为准: 算是达到了预期效果 下面开始将其录入到我们的数据集中 返回的值为: 虽然看起来丑了点,但还是可以用的。 总的源码为: 下面我换个函数试一试: 总的来说没多大改变,直接贴代码和输出了 输出为: 这是第一行的输出,最终返回的是一样的,就不放了
|