Страница 1 из 2 12 ПоследняяПоследняя
Показано с 1 по 10 из 11

Тема: Как делать итерацию по строкам dataframe python: помощь!

  1. Как делать итерацию по строкам dataframe python: помощь!

    Привет, ребят! Столкнулся с проблемой работы с DataFrame в Python. Мне нужно пройтись по всем строкам в DataFrame и выполнить определенные действия для каждой строки. Пробовал разные методы, но что-то не совсем получается. Кто может подсказать рабочий способ итерации, чтобы не тормозило и код был читаемым? Буду признателен за любые предложения и примеры! Спасибо заранее!



  2. Ждём вас в нашем чате в Телеграмм ==>> @pythoneer_chat

    А ТАКЖЕ: Канал о Python, статьи и книги ==>>
    @pythoneer_ru

  3. Привет! Я обычно использую метод iterrows() для итерации по строкам DataFrame. Вот пример:
    Программный код:
    import pandas as pd

    df 
    pd.DataFrame({'A': [123], 'B': [456]})

    for 
    indexrow in df.iterrows():
        print(
    f'Index: {index}, A: {row["A"]}, B: {row["B"]}'
    Надеюсь, это поможет! Удачи с кодингом.

  4. Цитата Сообщение от Othello
    Привет! Я обычно использую метод iterrows() для итерации по строкам DataFrame. Вот пример:
    Программный код:
    import pandas as pd

    df 
    pd.DataFrame({'A': [123], 'B': [456]})

    for 
    indexrow in df.iterrows():
        print(
    f'Index: {index}, A: {row["A"]}, B: {row["B"]}'
    Надеюсь, это поможет! Удачи с кодингом.
    О, iterrows() - это классика! Понятно и легко. Но как насчет других методов? Бывает, что iterrows() не самый быстрый способ.

  5. Здарова! Попробуй метод itertuples(), он быстрее. Пример кода:
    Программный код:
    import pandas as pd

    df 
    pd.DataFrame({'A': [123], 'B': [456]})

    for 
    row in df.itertuples():
        print(
    f'Index: {row.Index}, A: {row.A}, B: {row.B}'
    itertuples() создаёт namedtuples, и это реально ускоряет выполнение.

  6. Цитата Сообщение от RustyCollins
    Здарова! Попробуй метод itertuples(), он быстрее. Пример кода:
    Программный код:
    import pandas as pd

    df 
    pd.DataFrame({'A': [123], 'B': [456]})

    for 
    row in df.itertuples():
        print(
    f'Index: {row.Index}, A: {row.A}, B: {row.B}'
    itertuples() создаёт namedtuples, и это реально ускоряет выполнение.
    Да, itertuples() реально быстрее! Но строки у него иногда на заморочки напрашиваются, особенно если dataframe большой.

  7. Парни, вы чего, pandas.apply() забыли? Если вам прям сверхбыстро надо, то через apply можно многое оптимизировать.
    Программный код:
    import pandas as pd

    df 
    pd.DataFrame({'A': [123], 'B': [456]})

    def process_row(row):
        print(
    f'Processing A: {row["A"]} B: {row["B"]}')

    df.apply(process_rowaxis=1
    Ну а так, кому что нравится.

  8. Цитата Сообщение от Алексей Викторович
    Парни, вы чего, pandas.apply() забыли? Если вам прям сверхбыстро надо, то через apply можно многое оптимизировать.
    Программный код:
    import pandas as pd

    df 
    pd.DataFrame({'A': [123], 'B': [456]})

    def process_row(row):
        print(
    f'Processing A: {row["A"]} B: {row["B"]}')

    df.apply(process_rowaxis=1
    Ну а так, кому что нравится.
    Тоже вариант! apply() мне нравится за свою универсальность. Но иногда логику сложно вложить в одну функцию.

  9. Можно и просто с Numpy ещё запариться, если DataFrame очень большой.
    Программный код:
    import pandas as pd
    import numpy 
    as np

    df 
    pd.DataFrame({'A': [123], 'B': [456]})

    def process_rows(arr):
    for 
    row in arr:
    print(
    f'A: {row[0]}, B: {row[1]}')

    process_rows(df.values
    Преобразуем DataFrame в numpy array. Это иногда лютый буст для производительности.

  10. Цитата Сообщение от Екатерина Петровна
    Можно и просто с Numpy ещё запариться, если DataFrame очень большой.
    Программный код:
    import pandas as pd
    import numpy 
    as np

    df 
    pd.DataFrame({'A': [123], 'B': [456]})

    def process_rows(arr):
    for 
    row in arr:
    print(
    f'A: {row[0]}, B: {row[1]}')

    process_rows(df.values
    Преобразуем DataFrame в numpy array. Это иногда лютый буст для производительности.
    Интересная идея сходу с numpy залететь! Но на больших данных без библиотек сложно оценить выгоду.

Страница 1 из 2 12 ПоследняяПоследняя