Pandas Dataframe Уникальный

Pandas Dataframe Unikal Nyj



Самая популярная библиотека Python, используемая в науке о данных, называется Pandas. Он предлагает программистам Python высокопроизводительные, удобные инструменты для анализа данных. Как только вы поймете основные функции и способы их использования, Pandas станет мощным инструментом для изменения данных. В «пандах» стандартными методами хранения данных в табличной форме являются DataFrames. Мы можем использовать некоторые методы «панд» для получения уникальных значений в столбце «панды» DataFrame. Когда нам нужно получить уникальные значения в столбцах DataFrame и мы не хотим дублирования значений в столбце DataFrame «pandas», мы можем использовать методы, которые «pandas» предоставляет для этого. Давайте рассмотрим такие методы в этом руководстве вместе с некоторыми примерами и выводом, чтобы получить уникальные значения в столбце «панды» DataFrame.

Методы получения уникальных значений в столбцах «панд» DataFrame

Мы можем использовать два метода для получения уникальных значений в столбцах DataFrame «pandas». Мы удаляем повторяющиеся значения и получаем только уникальные значения в столбцах DataFrames. Методы, которые «панды» предоставляют для выполнения этой задачи:







  • Используя метод unique().
  • Используя метод drop_dupliactes().

Теперь мы будем использовать оба метода в кодах «pandas» для получения уникальных значений в столбцах DataFrame «pandas».



Пример #01

Приложение «Spyder» используется здесь для генерации этих кодов «панд», чтобы использовать те методы, которые помогают нам получать уникальные значения в столбцах «панд» DataFrame. Мы должны импортировать модули «панд», которые необходимы для кода «панд», перед созданием DataFrame. Используя термин «импорт» и помещая «панды как pd», мы импортируем эти модули.



Теперь с помощью «pd» мы можем быстро получить функции или методы «панд». Затем мы помещаем «Subject_data», в который мы добавляем «Имя», а в «Имя» мы добавляем данные имени, которые являются «Роман, Уильям, Питер, Смит, Джон, Милли, Томас и Джеймс». Затем мы добавляем предметные данные в «Subj», а именно «Математика, экономика, наука, математика, статистика, статистика, статистика и компьютер». Затем мы преобразуем эти «Subject_data» в «Subject_df» DataFrame с помощью метода «pd.DataFrame()». Мы помещаем «Subject_df» в метод «print ()», чтобы он отображался на терминале.





Теперь мы хотим получить уникальные значения в столбце «Pandas» DataFrame «Subj». Для этой цели мы используем здесь метод «unique ()» и добавляем имя столбца, а также имя DataFrame, как показано ниже. Мы добавляем этот метод в «print ()», чтобы результат также отображался на терминале.



Теперь мы нажимаем «Shift + Enter», чтобы получить результат этого кода, и он отображается на терминале, а также показан здесь, который содержит DataFrame со всеми значениями. Это оригинальный DataFrame, который мы добавили в код, и под ним отображаются уникальные значения столбца «Subj». Он удаляет повторяющиеся значения и отображает уникальные значения столбца «Subj» DataFrame.

Пример #02

Мы создаем «Sample_list», который содержит некоторую информацию. Мы вставляем «Layla, 21, 28, 31, 14 и 39», которые появятся в качестве первого столбца, когда мы преобразуем этот список в DataFrame. Затем мы добавляем «Lusy, 31, 25, 34, 26 и 21» в качестве второй строки DataFrame. После этого у нас есть «Питер, 38, 20, 20, 35 и 24» и «Лейла 38, 23, 39, 24, 23», которые будут третьей и четвертой строками DataFrame. Мы также вставляем еще три данных: «Стелла, 21, 24, 24, 28, 31», «Лейла, 33, 32, 26, 30, 25», а также «Питер, 21, 21, 31, 21, 29». .

Теперь мы преобразуем «Sample_list» в «DF_Sample», который является именем DataFrame здесь, помещая функцию «pd.DataFrame ()». Кроме того, мы устанавливаем имя столбцов этого DataFrame, и эти имена: «Имя, Ass_1, Ass_2, Ass_3, Ass_4 и Ass_5». Затем мы используем «print ()», который помогает отображать DataFrame «DF_Sample». Теперь в этом примере мы используем другой метод для получения уникальных значений в столбце DataFrame. Этот метод является методом «drop_duplicates ()» для «панд».

В методе «drop_duplicates ()» мы устанавливаем имя столбца, в котором мы хотим получить уникальные значения в столбце DataFrame. Мы получаем уникальные значения столбца «Имя», удаляя повторяющиеся значения в этом столбце с помощью метода «drop_duplicates()», а также отображаем эти уникальные значения с помощью функции «print()».

Дублированные имена удаляются, а уникальные значения отображаются после применения метода «drop_duplicates()». Вы можете заметить, что имя «Лейла» появляется в трех ячейках столбца «Имя». Но когда к этому столбцу применяется метод «drop_duplicates()», все повторяющиеся значения отбрасываются и на экране появляется одно имя «Лейла». После удаления повторяющихся значений появился новый DataFrame, который содержит уникальные значения в этом столбце «Имя». Таким образом, мы можем удалить повторяющиеся значения и получить уникальное значение в столбце DataFrame с помощью метода «drop_duplicates()».

Пример #03

Тот же DataFrame используется снова, и теперь мы применяем здесь метод «unique ()». С помощью метода «уникальный ()» мы помещаем имя столбца, а также имя кадра данных, к которому мы хотим применить этот метод «уникальный ()» для получения уникальных значений. Это будет отображать только уникальные значения этого столбца и не будет отображать эти значения в форме DataFrame.

Здесь DataFrame содержит семь значений в столбце «Имя», но когда мы применяем метод «unique ()» к этому столбцу, появляются только четыре значения, и это уникальные значения этого столбца. Он не отображает повторяющиеся значения.

Пример #04

DataFrame, который мы создаем в этом примере, называется «F_G_df». Мы вставляем «My_fruits» и «my_Vegs» в этот DataFrame. Столбец «Мои_фрукты» содержит «Яблоко, апельсин, яблоко, груша, личи, яблоко, яблоко, груша и яблоко». Затем у нас есть «My_Vegs», который содержит названия овощей: «Чили, Брингл, Морковь, Картофель, Картофель, Морковь, Лук, Чеснок и Имбирь». Этот DataFrame содержит только два столбца.

Теперь мы получаем уникальные значения в обоих столбцах с помощью метода «unique()». Мы упоминаем имя DataFrame. Затем поместите столбец первым именем столбца. После этого мы используем метод append(). В этом добавлении мы снова помещаем имя DataFrame и имя второго столбца и помещаем метод «unique ()». Это позволит получить уникальные значения обоих столбцов, а затем добавить уникальные значения обоих столбцов и отобразить их на экране.

Сначала визуализируется DataFrame, содержащий все значения. После этого применяется метод «unique()», и уникальные значения обоих столбцов отображаются ниже. В этом коде мы получаем уникальные значения в нескольких столбцах DataFrame с помощью метода «unique()».

Вывод

Полное объяснение получения уникальных значений в столбце DataFrame можно найти в этом руководстве. Мы обсудили методы «unique ()» и «drop_duplicates ()», которые помогают нам получать уникальные значения столбца DataFrame. Мы изучили, как использовать эти методы в коде «панд», используя эти методы здесь, в наших кодах. В этом руководстве мы проиллюстрировали различные примеры и показали, как получить уникальные значения одного столбца с помощью метода «unique()», а также метода «drop_duplicates()». В этом руководстве мы также рассмотрели, как получить уникальные значения в нескольких столбцах с помощью метода «unique()».