Для того, чтобы определить, какие значения не являются уникальными, в библиотеке Pandas используется метод
Ninique
Duplicated
Unique
import pandas as pd
data = {'name': ['John', 'Tom', 'John', 'Anna']}
df = pd.DataFrame(data)
duplicates = df.duplicated('name')
print(duplicates)
Этот код выведет:
0 False
1 False
2 True
3 False
dtype: bool
В этом примере вторая строка (индекс 2) имеет значение True, так как это дубликат имени "John".
2. Метод `unique` - возвращает массив всех уникальных значений.
Например, для того же DataFrame из предыдущего примера можно использовать метод `unique` для получения всех уникальных значений в колонке "name":
import pandas as pd
data = {'name': ['John', 'Tom', 'John', 'Anna']}
df = pd.DataFrame(data)
unique_values = df['name'].unique()
print(unique_values)
Этот код выведет:
['John' 'Tom' 'Anna']
Видно, что повторяющееся значение "John" не выводится дважды - массив содержит только уникальные значения.
3. Метод `nunique` - возвращает количество уникальных значений.
Пример использования:
import pandas as pd
data = {'name': ['John', 'Tom', 'John', 'Anna']}
df = pd.DataFrame(data)
unique_count = df['name'].nunique()
print(unique_count)
Этот код выведет:
3
Полученное число 3 указывает на то, что в колонке "name" есть только 3 уникальных значения.
Таким образом, в заданном списке методов `Duplicated`, `Unique`, `Nunique` только `Duplicated` позволяет нам определить, какие значения не являются уникальными. Два других метода, `Unique` и `Nunique`, используются для определения уникальных значений.Нажимая «Регистрация» или «Войти через Google», вы соглашаетесь с Публичной офертой, даете Согласие на обработку персональных данных, а также подтверждаете что вам есть 18 лет
Нажимая «Регистрация» или «Войти через Google», вы соглашаетесь с Публичной офертой, даете Согласие на обработку персональных данных, а также подтверждаете что вам есть 18 лет