Рубрики
Без рубрики

Как конвертировать список списков в PandaS DataFrame

https://youtu.be/pcf4ryfqs34 Проблема: Вам дан список списков. Ваша цель – преобразовать его в панды DataFrame. Пример: скажем, вы хотите сравнить зарплатные данные различных компаний и описания работы. Вы получили следующие данные о заработной плате в виде списка списка: зарплата = [[«Google», «Инженер по обучению машин», 121000], [«Google», «Ученый Data», 109000], … Как конвертировать список списков в PandaS DataFrame Подробнее »

Автор оригинала: Chris.

Проблема : Вам дано Список списков Отказ Ваша цель – преобразовать его в Пандас Dataframe.

Пример : Скажем, вы хотите сравнить зарплатные данные разных компаний и описания работы. Вы получили следующие данные о заработной плате в виде списка списка:

salary = [['Google', 'Machine Learning Engineer', 121000],
          ['Google', 'Data Scientist', 109000],
          ['Google', 'Tech Lead', 129000],
          ['Facebook', 'Data Scientist', 103000]]

Как вы можете преобразовать это в Панда Dataframe?

Dataframe ()

Решение : Прямое решение – использовать панда. Dataframe () Конструктор, который создает новый объект DataFrame от различных типов входных данных, таких как numpy массивы или списки.

Вот как это сделать для данного примера:

import pandas as pd

salary = [['Google', 'Machine Learning Engineer', 121000],
          ['Google', 'Data Scientist', 109000],
          ['Google', 'Tech Lead', 129000],
          ['Facebook', 'Data Scientist', 103000]]

df = pd.DataFrame(salary)

Это приводит к следующему Dataframe:

print(df)

'''
          0                          1       2
0    Google  Machine Learning Engineer  121000
1    Google             Data Scientist  109000
2    Google                  Tech Lead  129000
3  Facebook             Data Scientist  103000
'''

Попробуйте сами : Запустите этот код в нашей интерактивной оболочке Python, нажав кнопку «Запустить».

Dataframe.from_records ()

Альтернатива – это панда. Dataframe.from_records () Способ, который генерирует тот же выход:

import pandas as pd

salary = [['Company', 'Job', 'Salary($)'],
          ['Google', 'Machine Learning Engineer', 121000],
          ['Google', 'Data Scientist', 109000],
          ['Google', 'Tech Lead', 129000],
          ['Facebook', 'Data Scientist', 103000]]

df = pd.DataFrame.from_records(salary)
print(df)
'''
          0                          1       2
0    Google  Machine Learning Engineer  121000
1    Google             Data Scientist  109000
2    Google                  Tech Lead  129000
3  Facebook             Data Scientist  103000
'''

Попробуйте сами : Запустите этот код в нашей интерактивной оболочке Python, нажав кнопку «Запустить».

Имена столбцов

Если вы хотите добавить имена столбцов, чтобы сделать вывод красивее, вы также можете передавать их как отдельный аргумент:

import pandas as pd

salary = [['Google', 'Machine Learning Engineer', 121000],
          ['Google', 'Data Scientist', 109000],
          ['Google', 'Tech Lead', 129000],
          ['Facebook', 'Data Scientist', 103000]]

df = pd.DataFrame(salary, columns=['Company', 'Job', 'Salary($)'])
print(df)

'''
    Company                        Job  Salary($)
0    Google  Machine Learning Engineer     121000
1    Google             Data Scientist     109000
2    Google                  Tech Lead     129000
3  Facebook             Data Scientist     103000
'''

Попробуйте сами : Запустите этот код в нашей интерактивной оболочке Python, нажав кнопку «Запустить».

Если первый список списков списков содержит имя столбца, используйте Slicing, чтобы отделить первый список из других списков:

import pandas as pd

salary = [['Company', 'Job', 'Salary($)'],
          ['Google', 'Machine Learning Engineer', 121000],
          ['Google', 'Data Scientist', 109000],
          ['Google', 'Tech Lead', 129000],
          ['Facebook', 'Data Scientist', 103000]]

df = pd.DataFrame(salary[1:], columns=salary[0])
print(df)

'''
    Company                        Job  Salary($)
0    Google  Machine Learning Engineer     121000
1    Google             Data Scientist     109000
2    Google                  Tech Lead     129000
3  Facebook             Data Scientist     103000
'''

Slicing – это мощная функция Python, и прежде чем вы сможете освоить панды, вам нужно освоить нарезку. Чтобы обновить навыки нарезки Python, скачайте мою электронную книгу «Кофе-брейк Python Slicing» бесплатно.

Резюме : Чтобы преобразовать список списков в PandaS DataFrame, используйте портить Dataframe () Конструктор и пройдите список списков в качестве аргумента. Дополнительные столбцы аргумент могут помочь вам структурировать вывод.

Куда пойти отсюда?

Достаточно теории, давайте познакомимся!

Чтобы стать успешным в кодировке, вам нужно выйти туда и решать реальные проблемы для реальных людей. Вот как вы можете легко стать шестифункциональным тренером. И вот как вы польские навыки, которые вам действительно нужны на практике. В конце концов, что такое использование теории обучения, что никто никогда не нуждается?

Практические проекты – это то, как вы обостряете вашу пилу в кодировке!

Вы хотите стать мастером кода, сосредоточившись на практических кодовых проектах, которые фактически зарабатывают вам деньги и решают проблемы для людей?

Затем станьте питоном независимым разработчиком! Это лучший способ приближения к задаче улучшения ваших навыков Python – даже если вы являетесь полным новичком.

Присоединяйтесь к моему бесплатным вебинаре «Как создать свой навык высокого дохода Python» и посмотреть, как я вырос на моем кодированном бизнесе в Интернете и как вы можете, слишком от комфорта вашего собственного дома.

Присоединяйтесь к свободному вебинару сейчас!

Работая в качестве исследователя в распределенных системах, доктор Кристиан Майер нашел свою любовь к учению студентов компьютерных наук.

Чтобы помочь студентам достичь более высоких уровней успеха Python, он основал сайт программирования образования Finxter.com Отказ Он автор популярной книги программирования Python одноклассники (Nostarch 2020), Coauthor of Кофе-брейк Python Серия самооставленных книг, энтузиаста компьютерных наук, Фрилансера и владелец одного из лучших 10 крупнейших Питон блоги по всему миру.

Его страсти пишут, чтение и кодирование. Но его величайшая страсть состоит в том, чтобы служить стремлению кодер через Finxter и помогать им повысить свои навыки. Вы можете присоединиться к его бесплатной академии электронной почты здесь.

Оригинал: “https://blog.finxter.com/how-to-convert-list-of-lists-to-a-pandas-dataframe/”