2つのpandas Dataframeカラムの辞書を作成する最も効率的な方法は何ですか?
次のpandas Dataframeを整理する最も効率的な方法は何ですか?
データ
Position Letter
1 a
2 b
3 c
4 d
5 e
を alphabet[1 : 'a', 2 : 'b', 3 : 'c', 4 : 'd', 5 : 'e']
のような辞書に変換しますか?
100
4
スピード比較(Wouterの方法を使用)
少なくとも現実的な大きさのデータセットでは、この問題をより速く解決する方法を見つけた: df.set_index(KEY).to_dict()[VALUE]`を使います。
50,000行での証明:
出力:
TL; DR。 ====。
長い間。 ====。
説明ソリューション:
dict(sorted(df.values.to list()))
。与えられた:
[アウト]:
試す:
[アウト]:
次にオプションで:
または:
[アウト]:
最後に、2つの要素のリストをディクストにキャストします。
[アウト]:
-----。
関連。 ====。
@sbradbioコメントへの回答:
特定のキーに複数の値があり、それらすべてを保持したい場合、それは最も効率的ではありませんが、最も直感的な方法は次のとおりです。
[アウト]:
Python 3.6では最速の方法はまだWouterOvermeireのものです。Kikohs' の提案は他の2つの選択肢より遅いです。
結果