Περισσότερα
Δημιουργία ενός Pandas DataFrame από έναν πίνακα Numpy: Πώς μπορώ να καθορίσω τη στήλη δείκτη και τις επικεφαλίδες των στηλών;
Έχω έναν πίνακα Numpy που αποτελείται από μια λίστα από λίστες, που αναπαριστούν έναν δισδιάστατο πίνακα με ετικέτες γραμμών και ονόματα στηλών, όπως φαίνεται παρακάτω:
data = array([['','Col1','Col2'],['Row1',1,2],['Row2',3,4]])
Θα ήθελα το DataFrame που προκύπτει να έχει Row1 και Row2 ως τιμές δείκτη και Col1, Col2 ως τιμές κεφαλίδας
Μπορώ να καθορίσω το δείκτη ως εξής:
df = pd.DataFrame(data,index=data[:,0]),
Ωστόσο, δεν είμαι σίγουρος για το πώς να εκχωρήσω καλύτερα τις επικεφαλίδες των στηλών.
229
3
Πρέπει να καθορίσετε τα
data
,index
καιcolumns
στον κατασκευαστήDataFrame
, όπως στο:edit: όπως στο σχόλιο του @joris, ίσως χρειαστεί να αλλάξετε το παραπάνω σε
np.int_(data[1:,1:])
για να έχετε σωστό τύπο δεδομένων.Ακολουθεί μια εύκολα κατανοητή λύση
Συμφωνώ με τον Joris- φαίνεται ότι θα έπρεπε να το κάνετε αυτό με διαφορετικό τρόπο, όπως με numpy record arrays. Τροποποιώντας την "επιλογή 2" από αυτή την εξαιρετική απάντηση, θα μπορούσατε να το κάνετε ως εξής: