从Numpy数组创建一个Pandas DataFrame。如何指定索引列和列头?
我有一个由列表组成的Numpy数组,代表一个二维数组,其行标和列名如下所示。
data = array([['','Col1','Col2'],['Row1',1,2],['Row2',3,4]])
我希望得到的DataFrame有Row1和Row2作为索引值,而Col1, Col2作为标题值
我可以按以下方式指定索引。
df = pd.DataFrame(data,index=data[:,0]),
但是我不确定如何最好地分配列标题。
229
3
你需要在
DataFrame
构造函数中指定data
、index
和columns
,如图。编辑: 如同@joris的评论,你可能需要将上面的内容改为
np.int_(data[1:,1:])
以获得正确的数据类型。这里有一个容易理解的解决方案
我同意Joris的观点;看起来你应该用不同的方式来做这件事,就像用numpy记录数组。修改一下这个伟大的答案中的"选项2",你可以这样做。