Comment itérer sur les lignes d'un DataFrame dans Pandas ?

Question

Détails

Source Version non AMP Editer

Comment itérer sur les lignes d'un DataFrame dans Pandas ?

J'ai un DataFrame de pandas :

import pandas as pd
inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}]
df = pd.DataFrame(inp)
print df

Sortie :

Maintenant, je veux itérer sur les lignes de ce cadre. Pour chaque ligne, je veux pouvoir accéder à ses éléments (valeurs dans les cellules) par le nom des colonnes. Par exemple :

for row in df.rows:
   print row['c1'], row['c2']

Est-il possible de faire cela dans pandas ?

J'ai trouvé cette [question similaire][1]. Mais cela ne me donne pas la réponse dont j'ai besoin. Par exemple, il y est suggéré d'utiliser :

for date, row in df.T.iteritems():

ou

for row in df.iterrows():

Mais je ne comprends pas ce qu'est l'objet row et comment je peux travailler avec lui.

[1] : https://stackoverflow.com/questions/7837722/what-is-the-most-efficient-way-to-loop-through-dataframes-with-pandas

petezurich

Question modifiée 24 août 2018 в 7:20

Programmation

python rows pandas dataframe

10 mai 2013 в 7:04

14 vues

Wes McKinney

Source Version non AMP Editer

Vous devriez utiliser [df.iterrows()][1]. Bien que l'itération ligne par ligne ne soit pas particulièrement efficace puisque les objets Series doivent être créés.

[1] : http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.iterrows.html

arekolek

Réponse modifiée 25 octobre 2015 в 12:06

188

0

Commentaires (3)

cheekybastard

Source Version non AMP Editer

Vous pouvez également utiliser df.apply() pour itérer sur les lignes et accéder à plusieurs colonnes pour une fonction.

[docs : DataFrame.apply()] [1]

def valuation_formula(x, y):
    return x * y * 0.5

df['price'] = df.apply(lambda row: valuation_formula(row['x'], row['y']), axis=1)

[1] : http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.apply.html

80

0

Commentaires (6)

waitingkuo · Accepted Answer · 2013-05-10T07:07:58+00:00

Solution

waitingkuo

Source Version non AMP Editer

DataFrame.iterrows est un générateur qui produit à la fois l'index et la ligne.

import pandas as pd
import numpy as np

df = pd.DataFrame([{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}])

for index, row in df.iterrows():
    print(row['c1'], row['c2'])

Output: 
   10 100
   11 110
   12 120

cs95

Réponse modifiée 21 juin 2019 в 3:26

2114

0

Commentaires (7)