Для того, чтобы определить, какие значения не являются уникальными, в библиотеке Pandas используется метод
Ninique
Duplicated
Unique
python
import pandas as pd
# создаем серию с повторяющимися значениями
s = pd.Series([1, 2, 3, 1, 2, 3, 4, 5])
# используем метод unique()
unique_values = s.unique()
print(unique_values)
Вывод:
[1 2 3 4 5]
Как видно из примера, метод `unique()` вернул массив, содержащий только уникальные значения из исходной серии. Обратите внимание, что порядок элементов в массиве сохраняется, поэтому значения остаются в том же порядке, в котором они встречаются в исходной серии.
### Метод duplicated()
Метод `duplicated()` позволяет определить, какие значения в столбце или серии являются дубликатами. Он возвращает логический массив той же формы, что и исходный, в котором элементы, являющиеся дубликатами, равны `True`, а остальные - `False`. Давайте рассмотрим пример:
python
import pandas as pd
# создаем серию с повторяющимися значениями
s = pd.Series([1, 2, 3, 1, 2, 3, 4, 5])
# используем метод duplicated()
duplicates = s.duplicated()
print(duplicates)
Вывод:
0 False
1 False
2 False
3 True
4 True
5 True
6 False
7 False
dtype: bool
Как видно из примера, метод `duplicated()` вернул серию-результат, в которой `True` указывает на то, что соответствующий элемент является дубликатом, а `False` - на то, что элемент уникален. В данном примере дубликатами являются значения 1, 2 и 3.
### Метод nunique()
Метод `nunique()` позволяет нам получить количество уникальных значений в столбце или серии. Он возвращает количество значений, которые встречаются только один раз. Давайте рассмотрим пример:
python
import pandas as pd
# создаем серию с повторяющимися значениями
s = pd.Series([1, 2, 3, 1, 2, 3, 4, 5])
# используем метод nunique()
unique_count = s.nunique()
print(unique_count)
Вывод:
5
Как видно из примера, метод `nunique()` вернул количество уникальных значений в исходной серии, в данном случае - 5.
### Комбинированное использование методов
Методы `unique()`, `duplicated()` и `nunique()` могут быть использованы вместе для выполнения более сложных операций. Например, мы можем использовать метод `unique()` для получения списка уникальных значений, метод `duplicated()` для поиска дубликатов и метод `nunique()` для получения количества уникальных значений. Давайте рассмотрим пример:
python
import pandas as pd
# создаем серию с повторяющимися значениями
s = pd.Series([1, 2, 3, 1, 2, 3, 4, 5])
# используем методы unique(), duplicated() и nunique()
unique_values = s.unique()
duplicates = s.duplicated()
unique_count = s.nunique()
print(unique_values)
print(duplicates)
print(unique_count)
Вывод:
[1 2 3 4 5]
0 False
1 False
2 False
3 True
4 True
5 True
6 False
7 False
dtype: bool
5
Как видно из примера, мы сначала получаем массив уникальных значений с помощью метода `unique()`, затем находим дубликаты с помощью метода `duplicated()`, и в конце подсчитываем количество уникальных значений с помощью метода `nunique()`.
### Заключение
В этом тексте мы рассмотрели методы `unique()`, `duplicated()` и `nunique()` в библиотеке Pandas. Эти методы позволяют нам определить уникальные значения, дубликаты и количество уникальных значений в столбце или серии. Использование этих методов вместе позволяет нам делать более сложные операции, связанные с уникальными значениями. Эти методы очень полезны при работе с данными и манипуляциями над ними в Pandas.Нажимая «Регистрация» или «Войти через Google», вы соглашаетесь с Публичной офертой, даете Согласие на обработку персональных данных, а также подтверждаете что вам есть 18 лет
Нажимая «Регистрация» или «Войти через Google», вы соглашаетесь с Публичной офертой, даете Согласие на обработку персональных данных, а также подтверждаете что вам есть 18 лет