Ho un elenco di dizionari e voglio che ogni elemento sia ordinato in base a valori di proprietà specifici.
Prendi in considerazione la matrice sottostante,
[{'name':'Homer', 'age':39}, {'name':'Bart', 'age':10}]
Quando ordinato per name
, dovrebbe diventare
[{'name':'Bart', 'age':10}, {'name':'Homer', 'age':39}]
Può sembrare più pulito utilizzando una chiave invece di un cmp:
newlist = sorted(list_to_be_sorted, key=lambda k: k['name'])
o come suggerito da J.F.Sebastian e altri,
from operator import itemgetter
newlist = sorted(list_to_be_sorted, key=itemgetter('name'))
Per completezza (come indicato nei commenti di fitzgeraldsteele), aggiungere reverse=True
per ordinare discendente
newlist = sorted(l, key=itemgetter('name'), reverse=True)
import operator
Per ordinare l'elenco dei dizionari con il tasto = 'nome':
list_of_dicts.sort(key=operator.itemgetter('name'))
Per ordinare l'elenco dei dizionari per tasto = 'età':
list_of_dicts.sort(key=operator.itemgetter('age'))
Se vuoi ordinare l'elenco con più chiavi, puoi fare quanto segue:
my_list = [{'name':'Homer', 'age':39}, {'name':'Milhouse', 'age':10}, {'name':'Bart', 'age':10} ]
sortedlist = sorted(my_list , key=lambda elem: "%02d %s" % (elem['age'], elem['name']))
È piuttosto hacker, poiché si basa sulla conversione dei valori in una singola rappresentazione di stringa per il confronto, ma funziona come previsto per i numeri compresi quelli negativi (sebbene sia necessario formattare la stringa in modo appropriato con paddate pari a zero se si utilizzano numeri)
my_list = [{'name':'Homer', 'age':39}, {'name':'Bart', 'age':10}]
my_list.sort(lambda x,y : cmp(x['name'], y['name']))
my_list
sarà ora quello che vuoi.
(3 anni dopo) Modificato per aggiungere:
Il nuovo argomento key
è più efficiente e più ordinato. Una risposta migliore ora sembra:
my_list = sorted(my_list, key=lambda k: k['name'])
... il lambda è, IMO, più facile da capire di operator.itemgetter
, ma YMMV.
import operator
a_list_of_dicts.sort(key=operator.itemgetter('name'))
'chiave' è usata per ordinare secondo un valore arbitrario e 'itemgetter' imposta quel valore sull'attributo 'nome' di ogni oggetto.
Immagino che tu abbia inteso:
[{'name':'Homer', 'age':39}, {'name':'Bart', 'age':10}]
Questo sarebbe ordinato in questo modo:
sorted(l,cmp=lambda x,y: cmp(x['name'],y['name']))
Usando la trasformazione di Schwartzian da Perl,
py = [{'name':'Homer', 'age':39}, {'name':'Bart', 'age':10}]
fare
sort_on = "name"
decorated = [(dict_[sort_on], dict_) for dict_ in py]
decorated.sort()
result = [dict_ for (key, dict_) in decorated]
dà
>>> result
[{'age': 10, 'name': 'Bart'}, {'age': 39, 'name': 'Homer'}]
Altro su Trasformazione di Perl Schwartzian
Nell'informatica, la trasformazione di Schwartz è una programmazione Perl idioma utilizzato per migliorare l'efficienza di ordinare un elenco di elementi. Questo l'idioma è appropriato per l'ordinamento basato sul confronto quando l'ordinamento è in realtà basato sull'ordinamento di una determinata proprietà (la chiave) del elementi, dove calcolare quella proprietà è un'operazione intensiva che dovrebbe essere eseguito un numero minimo di volte. Lo Schwartzian La trasformazione è notevole in quanto non utilizza gli array temporanei denominati.
a = [{'name':'Homer', 'age':39}, ...]
# This changes the list a
a.sort(key=lambda k : k['name'])
# This returns a new list (a is not modified)
sorted(a, key=lambda k : k['name'])
È possibile utilizzare una funzione di confronto personalizzata oppure è possibile passare una funzione che calcola una chiave di ordinamento personalizzata. Di solito è più efficiente poiché la chiave viene calcolata una sola volta per articolo, mentre la funzione di confronto viene chiamata molte più volte.
Potresti farlo in questo modo:
def mykey(adict): return adict['name']
x = [{'name': 'Homer', 'age': 39}, {'name': 'Bart', 'age':10}]
sorted(x, key=mykey)
Ma la libreria standard contiene una routine generica per ottenere oggetti di oggetti arbitrari: itemgetter
. Quindi prova questo invece:
from operator import itemgetter
x = [{'name': 'Homer', 'age': 39}, {'name': 'Bart', 'age':10}]
sorted(x, key=itemgetter('name'))
Devi implementare la tua funzione di confronto che confronterà i dizionari con i valori delle chiavi dei nomi. Vedi Ordinamento di Mini-HOW TO da PythonInfo Wiki
Ho provato qualcosa di simile a questo:
my_list.sort(key=lambda x: x['name'])
Ha funzionato anche per i numeri interi.
a volte abbiamo bisogno di usare lower()
per esempio
lists = [{'name':'Homer', 'age':39},
{'name':'Bart', 'age':10},
{'name':'abby', 'age':9}]
lists = sorted(lists, key=lambda k: k['name'])
print(lists)
# [{'name':'Bart', 'age':10}, {'name':'Homer', 'age':39}, {'name':'abby', 'age':9}]
lists = sorted(lists, key=lambda k: k['name'].lower())
print(lists)
# [ {'name':'abby', 'age':9}, {'name':'Bart', 'age':10}, {'name':'Homer', 'age':39}]
Ecco la soluzione generale alternativa - ordina gli elementi di dict con chiavi e valori . Il vantaggio di esso - non c'è bisogno di specificare le chiavi, e funzionerebbe ancora se alcuni tasti mancano in alcuni dizionari.
def sort_key_func(item):
""" helper function used to sort list of dicts
:param item: dict
:return: sorted list of tuples (k, v)
"""
pairs = []
for k, v in item.items():
pairs.append((k, v))
return sorted(pairs)
sorted(A, key=sort_key_func)
L'utilizzo del pacchetto pandas è un altro metodo, anche se il runtime su larga scala è molto più lento rispetto ai metodi più tradizionali proposti da altri:
import pandas as pd
listOfDicts = [{'name':'Homer', 'age':39}, {'name':'Bart', 'age':10}]
df = pd.DataFrame(listOfDicts)
df = df.sort_values('name')
sorted_listOfDicts = df.T.to_dict().values()
Ecco alcuni valori di riferimento per una piccola lista e una grande lista (di 100k +) di dict:
setup_large = "listOfDicts = [];\
[listOfDicts.extend(({'name':'Homer', 'age':39}, {'name':'Bart', 'age':10})) for _ in range(50000)];\
from operator import itemgetter;import pandas as pd;\
df = pd.DataFrame(listOfDicts);"
setup_small = "listOfDicts = [];\
listOfDicts.extend(({'name':'Homer', 'age':39}, {'name':'Bart', 'age':10}));\
from operator import itemgetter;import pandas as pd;\
df = pd.DataFrame(listOfDicts);"
method1 = "newlist = sorted(listOfDicts, key=lambda k: k['name'])"
method2 = "newlist = sorted(listOfDicts, key=itemgetter('name')) "
method3 = "df = df.sort_values('name');\
sorted_listOfDicts = df.T.to_dict().values()"
import timeit
t = timeit.Timer(method1, setup_small)
print('Small Method LC: ' + str(t.timeit(100)))
t = timeit.Timer(method2, setup_small)
print('Small Method LC2: ' + str(t.timeit(100)))
t = timeit.Timer(method3, setup_small)
print('Small Method Pandas: ' + str(t.timeit(100)))
t = timeit.Timer(method1, setup_large)
print('Large Method LC: ' + str(t.timeit(100)))
t = timeit.Timer(method2, setup_large)
print('Large Method LC2: ' + str(t.timeit(100)))
t = timeit.Timer(method3, setup_large)
print('Large Method Pandas: ' + str(t.timeit(1)))
#Small Method LC: 0.000163078308105
#Small Method LC2: 0.000134944915771
#Small Method Pandas: 0.0712950229645
#Large Method LC: 0.0321750640869
#Large Method LC2: 0.0206089019775
#Large Method Pandas: 5.81405615807
Diciamo che ho un dizionario D con gli elementi qui sotto. Per ordinare basta usare l'argomento chiave in ordine per passare la funzione personalizzata come sotto
D = {'eggs': 3, 'ham': 1, 'spam': 2}
def get_count(Tuple):
return Tuple[1]
sorted(D.items(), key = get_count, reverse=True)
or
sorted(D.items(), key = lambda x: x[1], reverse=True) avoiding get_count function call
Ecco la mia risposta a una domanda correlata sull'ordinamento per colonne multiple . Funziona anche per il caso degenere in cui il numero di colonne è solo uno.
Se non hai bisogno dell'originale list
di dictionaries
, puoi modificarlo sul posto con il metodo sort()
utilizzando una funzione chiave personalizzata.
Funzione chiave:
def get_name(d):
""" Return the value of a key in a dictionary. """
return d["name"]
list
da ordinare:
data_one = [{'name': 'Homer', 'age': 39}, {'name': 'Bart', 'age': 10}]
Ordinamento sul posto:
data_one.sort(key=get_name)
Se hai bisogno dell'originale list
, chiama la funzione sorted()
passandogli list
e la funzione chiave, quindi assegna il list
restituito ordinato a una nuova variabile:
data_two = [{'name': 'Homer', 'age': 39}, {'name': 'Bart', 'age': 10}]
new_data = sorted(data_two, key=get_name)
Stampa data_one
e new_data
.
>>> print(data_one)
[{'name': 'Bart', 'age': 10}, {'name': 'Homer', 'age': 39}]
>>> print(new_data)
[{'name': 'Bart', 'age': 10}, {'name': 'Homer', 'age': 39}]
Puoi usare itemgetter , se vuoi considerare la performance. itemgetter tipicamente esegue bit più veloce di lambda .
from operator import itemgetter
result = sorted(data, key=itemgetter('age')) # this will sort list by property order 'age'.
Puoi usare il seguente codice
sorted_dct = sorted(dct_name.items(), key = lambda x : x[1])