Ustvarjanje podatkovnega okvira Pandas DataFrame iz polja Numpy: Kako določim stolpec z indeksom in glave stolpcev?
Imam polje Numpy, sestavljeno iz seznama seznamov, ki predstavlja dvodimenzionalno polje z oznakami vrstic in imeni stolpcev, kot je prikazano spodaj:
data = array([['','Col1','Col2'],['Row1',1,2],['Row2',3,4]])
Želel bi, da ima rezultat DataFrame vrstico1 in vrstico2 kot indeksni vrednosti ter stolpca1, stolpec2 kot vrednosti glave
Indeks lahko določim na naslednji način:
df = pd.DataFrame(data,index=data[:,0]),
vendar nisem prepričan, kako najbolje dodeliti glave stolpcev.
229
3
V konstruktorju
DataFrame
morate navestipodatke
,indeks
instolpce
, kot v naslednjem primeru:edit: kot v komentarju @joris, boste morda morali spremeniti zgornji vnos v
np.int_(data[1:,1:])
, da boste imeli pravilen tip podatkov.Tukaj je preprosta in razumljiva rešitev
Strinjam se z Jorisom; zdi se, da bi morali to narediti drugače, kot z numpy record arrays. Če spremenite "možnost 2" iz tega odličnega odgovora, lahko to storite takole: