python获取与读写数据

python基础

浏览数:252

2019-8-28

在机器学习中,可以通过python对数据进行获取与读写操作。通过以下代码可轻松实现:

import pandas as pd

df = pd.read_csv('./data/train.csv')
label = df['TARGET']
df = df.drop(['ID','TARGET'], axis=1) 

import pandas不用说了,使用Python做数据处理需要装好pandas, numpy 和 scipy等几个包。
df = pd.read_csv('./data/train.csv')是读取数据集,label = df['TARGET']是将数据集中的标签即分类结果单独取出来放到label中。df = df.drop(['ID','TARGET'], axis=1)是删除不需要的特征,ID是数据集的顺序,本身并不带有信息量,TARGET之前我们已经放到label里面了,都可以去掉。使用pandas中的drop方法,axis=1就是把整列去掉

作者:AryaHooper