Erstellen eines Pandas DataFrame aus einem Numpy-Array: Wie gebe ich die Indexspalte und die Spaltenüberschriften an?
Ich habe ein Numpy-Array, das aus einer Liste von Listen besteht und ein zweidimensionales Array mit Zeilenbeschriftungen und Spaltennamen darstellt, wie unten gezeigt:
data = array([['','Col1','Col2'],['Row1',1,2],['Row2',3,4]])
Ich möchte, dass der resultierende DataFrame Row1 und Row2 als Indexwerte und Col1, Col2 als Kopfwerte hat
Ich kann den Index wie folgt angeben:
df = pd.DataFrame(data,index=data[:,0]),
Ich bin mir jedoch nicht sicher, wie ich die Spaltenüberschriften am besten zuweisen kann.
229
3
Sie müssen
data
,index
undcolumns
imDataFrame
Konstruktor angeben, wie in:edit: wie im @joris-Kommentar, müssen Sie möglicherweise oben in
np.int_(data[1:,1:])
ändern, um den richtigen Datentyp zu haben.Hier ist eine leicht verständliche Lösung
Ich stimme mit Joris; es scheint, wie Sie dies anders tun sollten, wie mit numpy Datensatz-Arrays. In Abwandlung von "Option 2" aus diese großartige Antwort, könnten Sie es so machen: