Więcej
Tworzenie Pandas DataFrame z tablicy Numpy: Jak określić kolumnę indeksu i nagłówki kolumn?
Mam tablicę Numpy składającą się z listy list, reprezentującą dwuwymiarową tablicę z etykietami wierszy i nazwami kolumn, jak pokazano poniżej:
data = array([['','Col1','Col2'],['Row1',1,2],['Row2',3,4]])
Chciałbym, aby wynikowa DataFrame miała Row1 i Row2 jako wartości indeksu, a Col1, Col2 jako wartości nagłówka
Mogę określić indeks w następujący sposób:
df = pd.DataFrame(data,index=data[:,0]),
jednak nie jestem pewien, jak najlepiej przypisać nagłówki kolumn.
229
3
Musisz określić
data
,index
icolumns
w konstruktorzeDataFrame
, tak jak w:edit: jak w komentarzu @joris, możesz potrzebować zmienić powyższe na
np.int_(data[1:,1:])
, aby mieć poprawny typ danych.Oto łatwe do zrozumienia rozwiązanie
Zgadzam się z Jorisem; wydaje się, że powinieneś robić to inaczej, jak w przypadku numpy record arrays. Modyfikując "opcję 2" z tej wspaniałej odpowiedzi, mógłbyś to zrobić w ten sposób: