Pandas Dataframe Уникальный

Самая популярная библиотека Python, используемая в науке о данных, называется Pandas. Он предлагает программистам Python высокопроизводительные, удобные инструменты для анализа данных. Как только вы поймете основные функции и способы их использования, Pandas станет мощным инструментом для изменения данных. В «пандах» стандартными методами хранения данных в табличной форме являются DataFrames. Мы можем использовать некоторые методы «панд» для получения уникальных значений в столбце «панды» DataFrame. Когда нам нужно получить уникальные значения в столбцах DataFrame и мы не хотим дублирования значений в столбце DataFrame «pandas», мы можем использовать методы, которые «pandas» предоставляет для этого. Давайте рассмотрим такие методы в этом руководстве вместе с некоторыми примерами и выводом, чтобы получить уникальные значения в столбце «панды» DataFrame.

Методы получения уникальных значений в столбцах «панд» DataFrame

Мы можем использовать два метода для получения уникальных значений в столбцах DataFrame «pandas». Мы удаляем повторяющиеся значения и получаем только уникальные значения в столбцах DataFrames. Методы, которые «панды» предоставляют для выполнения этой задачи:

Используя метод unique().
Используя метод drop_dupliactes().

Теперь мы будем использовать оба метода в кодах «pandas» для получения уникальных значений в столбцах DataFrame «pandas».

Пример #01

Приложение «Spyder» используется здесь для генерации этих кодов «панд», чтобы использовать те методы, которые помогают нам получать уникальные значения в столбцах «панд» DataFrame. Мы должны импортировать модули «панд», которые необходимы для кода «панд», перед созданием DataFrame. Используя термин «импорт» и помещая «панды как pd», мы импортируем эти модули.

Теперь с помощью «pd» мы можем быстро получить функции или методы «панд». Затем мы помещаем «Subject_data», в который мы добавляем «Имя», а в «Имя» мы добавляем данные имени, которые являются «Роман, Уильям, Питер, Смит, Джон, Милли, Томас и Джеймс». Затем мы добавляем предметные данные в «Subj», а именно «Математика, экономика, наука, математика, статистика, статистика, статистика и компьютер». Затем мы преобразуем эти «Subject_data» в «Subject_df» DataFrame с помощью метода «pd.DataFrame()». Мы помещаем «Subject_df» в метод «print ()», чтобы он отображался на терминале.

Теперь мы хотим получить уникальные значения в столбце «Pandas» DataFrame «Subj». Для этой цели мы используем здесь метод «unique ()» и добавляем имя столбца, а также имя DataFrame, как показано ниже. Мы добавляем этот метод в «print ()», чтобы результат также отображался на терминале.

Теперь мы нажимаем «Shift + Enter», чтобы получить результат этого кода, и он отображается на терминале, а также показан здесь, который содержит DataFrame со всеми значениями. Это оригинальный DataFrame, который мы добавили в код, и под ним отображаются уникальные значения столбца «Subj». Он удаляет повторяющиеся значения и отображает уникальные значения столбца «Subj» DataFrame.

Пример #02

Мы создаем «Sample_list», который содержит некоторую информацию. Мы вставляем «Layla, 21, 28, 31, 14 и 39», которые появятся в качестве первого столбца, когда мы преобразуем этот список в DataFrame. Затем мы добавляем «Lusy, 31, 25, 34, 26 и 21» в качестве второй строки DataFrame. После этого у нас есть «Питер, 38, 20, 20, 35 и 24» и «Лейла 38, 23, 39, 24, 23», которые будут третьей и четвертой строками DataFrame. Мы также вставляем еще три данных: «Стелла, 21, 24, 24, 28, 31», «Лейла, 33, 32, 26, 30, 25», а также «Питер, 21, 21, 31, 21, 29». .

Теперь мы преобразуем «Sample_list» в «DF_Sample», который является именем DataFrame здесь, помещая функцию «pd.DataFrame ()». Кроме того, мы устанавливаем имя столбцов этого DataFrame, и эти имена: «Имя, Ass_1, Ass_2, Ass_3, Ass_4 и Ass_5». Затем мы используем «print ()», который помогает отображать DataFrame «DF_Sample». Теперь в этом примере мы используем другой метод для получения уникальных значений в столбце DataFrame. Этот метод является методом «drop_duplicates ()» для «панд».

В методе «drop_duplicates ()» мы устанавливаем имя столбца, в котором мы хотим получить уникальные значения в столбце DataFrame. Мы получаем уникальные значения столбца «Имя», удаляя повторяющиеся значения в этом столбце с помощью метода «drop_duplicates()», а также отображаем эти уникальные значения с помощью функции «print()».

Дублированные имена удаляются, а уникальные значения отображаются после применения метода «drop_duplicates()». Вы можете заметить, что имя «Лейла» появляется в трех ячейках столбца «Имя». Но когда к этому столбцу применяется метод «drop_duplicates()», все повторяющиеся значения отбрасываются и на экране появляется одно имя «Лейла». После удаления повторяющихся значений появился новый DataFrame, который содержит уникальные значения в этом столбце «Имя». Таким образом, мы можем удалить повторяющиеся значения и получить уникальное значение в столбце DataFrame с помощью метода «drop_duplicates()».

Пример #03

Тот же DataFrame используется снова, и теперь мы применяем здесь метод «unique ()». С помощью метода «уникальный ()» мы помещаем имя столбца, а также имя кадра данных, к которому мы хотим применить этот метод «уникальный ()» для получения уникальных значений. Это будет отображать только уникальные значения этого столбца и не будет отображать эти значения в форме DataFrame.

Здесь DataFrame содержит семь значений в столбце «Имя», но когда мы применяем метод «unique ()» к этому столбцу, появляются только четыре значения, и это уникальные значения этого столбца. Он не отображает повторяющиеся значения.

Пример #04

DataFrame, который мы создаем в этом примере, называется «F_G_df». Мы вставляем «My_fruits» и «my_Vegs» в этот DataFrame. Столбец «Мои_фрукты» содержит «Яблоко, апельсин, яблоко, груша, личи, яблоко, яблоко, груша и яблоко». Затем у нас есть «My_Vegs», который содержит названия овощей: «Чили, Брингл, Морковь, Картофель, Картофель, Морковь, Лук, Чеснок и Имбирь». Этот DataFrame содержит только два столбца.

Теперь мы получаем уникальные значения в обоих столбцах с помощью метода «unique()». Мы упоминаем имя DataFrame. Затем поместите столбец первым именем столбца. После этого мы используем метод append(). В этом добавлении мы снова помещаем имя DataFrame и имя второго столбца и помещаем метод «unique ()». Это позволит получить уникальные значения обоих столбцов, а затем добавить уникальные значения обоих столбцов и отобразить их на экране.

Сначала визуализируется DataFrame, содержащий все значения. После этого применяется метод «unique()», и уникальные значения обоих столбцов отображаются ниже. В этом коде мы получаем уникальные значения в нескольких столбцах DataFrame с помощью метода «unique()».

Вывод

Полное объяснение получения уникальных значений в столбце DataFrame можно найти в этом руководстве. Мы обсудили методы «unique ()» и «drop_duplicates ()», которые помогают нам получать уникальные значения столбца DataFrame. Мы изучили, как использовать эти методы в коде «панд», используя эти методы здесь, в наших кодах. В этом руководстве мы проиллюстрировали различные примеры и показали, как получить уникальные значения одного столбца с помощью метода «unique()», а также метода «drop_duplicates()». В этом руководстве мы также рассмотрели, как получить уникальные значения в нескольких столбцах с помощью метода «unique()».

Pandas Dataframe Уникальный

Методы получения уникальных значений в столбцах «панд» DataFrame

Пример #01

Пример #02

Пример #03

Пример #04

Вывод

Категория

Популярные посты

Что такое атрибут «rowspan» и как его использовать с элементом «td» в HTML?

Что такое свойство стиля элемента HTML DOM в JavaScript

Какие существуют типы балансировщиков нагрузки в Amazon ECS?

Как использовать аннотации Kubernetes

Как запустить программу с повышенными правами с помощью контекстного меню в Windows 7 / Vista? - Winhelponline

Стоит ли ноутбук с частотой 120 Гц своих денег

Как установить драйверы VirtIO и гостевой агент QEMU на виртуальные машины Proxmox VE под управлением Windows 10/11

Как составить список процессов, выполняющихся в контейнере Docker?

Резервное копирование и восстановление сетевых профилей Wi-Fi в Windows - Winhelponline

В чем разница между нечетким запросом и запросом на совпадение?

Как настроить сторожевой таймер на Raspberry Pi (автоматическая перезагрузка не отвечает на Raspberry Pi)

Как установить Conky System Monitoring Tool на Raspberry Pi

Как подробно показать незафиксированные изменения в Git и некоторые различия Git?

Портал Нижнего мира: все, что вам нужно знать

Isnumber в C++

Что означает Dall-E2 и стабильная диффузия, имеющие одинаковую подсказку, но разные результаты

Как установить Windows 7 (виртуальную машину) в VMware?

Как удалить набор данных об обнимании лица — пошаговый метод

Как установить и настроить MySQL Workbench в Fedora Linux

Как установить Windows на ноутбук после замены жесткого диска?