Membuat Panda DataFrame dari Numpy array: Bagaimana cara menentukan indeks kolom dan kolom header?
Saya memiliki Numpy array yang terdiri dari daftar list, mewakili array dua dimensi dengan label baris dan kolom nama-nama seperti yang ditunjukkan di bawah ini:
data = array([['','Col1','Col2'],['Row1',1,2],['Row2',3,4]])
I'd seperti yang dihasilkan DataFrame untuk memiliki Row1 dan Row2 sebagai nilai indeks, dan Col1, Col2 sebagai nilai header
Saya dapat menentukan indeks sebagai berikut:
df = pd.DataFrame(data,index=data[:,0]),
namun saya tidak yakin bagaimana cara terbaik untuk menetapkan kolom header.
229
6
Anda perlu menentukan
data
,index
dankolom
untukDataFrame
pembina, seperti dalam:edit: seperti dalam @joris komentar, anda mungkin perlu mengubah di atas untuk
np.int_(data[1:,1:])
untuk memiliki data yang benar jenis.Berikut ini adalah aplikasi yang mudah untuk memahami solusi
Saya setuju dengan Joris; sepertinya anda harus melakukan ini dengan cara yang berbeda, seperti dengan numpy record array. Memodifikasi "2" dari ini jawaban, anda bisa melakukannya seperti ini:
Hal ini dapat dilakukan hanya dengan menggunakan from_records panda DataFrame
Menambahkan @behzad.nouri 's jawaban - kita bisa menciptakan seorang penolong rutin untuk menangani ini skenario umum:
Let's mencobanya: