Страница 1 из 2 12 ПоследняяПоследняя
Показано с 1 по 10 из 12

Тема: Как используется функция describe в питоне для анализа данных?

  1. Как используется функция describe в питоне для анализа данных?

    Привет, народ! Я недавно начал изучать питон и наткнулся на функцию `describe`. Немного не понял, как она работает и где её можно применять. Кто-нибудь может подсказать с примерчиками, что эта функция делает, почему её стоит использовать и как она помогает в анализе данных? Был бы благодарен за поподробнее с пояснениями кодулина и примерами из реальных проектов. Спасибо заранее всем откликнувшимся!



  2. Ждём вас в нашем чате в Телеграмм ==>> @pythoneer_chat

    А ТАКЖЕ: Канал о Python, статьи и книги ==>>
    @pythoneer_ru

  3. Привет! Функция `describe` используется в библиотеке pandas для получения быстрого статистического обзора по твоим данным. Вот пример:

    Программный код:
    import pandas as pd

    data 
    = {'Цена': [100200300400500], 'Количество': [12345]}
    df pd.DataFrame(data)

    print(
    df.describe()) 
    Эта функция выдаст среднее, стандартное отклонение, минимальные и максимальные значения и другие полезные статистики. Очень удобно при первичном оглядывании на данные или для EDA (Exploratory Data Analysis). Надеюсь, помог

  4. Цитата Сообщение от AsteroidPatrol303
    Привет! Функция `describe` используется в библиотеке pandas для получения быстрого статистического обзора по твоим данным. Вот пример:

    Программный код:
    import pandas as pd

    data 
    = {'Цена': [100200300400500], 'Количество': [12345]}
    df pd.DataFrame(data)

    print(
    df.describe()) 
    Эта функция выдаст среднее, стандартное отклонение, минимальные и максимальные значения и другие полезные статистики. Очень удобно при первичном оглядывании на данные или для EDA (Exploratory Data Analysis). Надеюсь, помог
    Блин, здорово объяснил! Насчёт EDA прям в точку, а то часто забываю об этой аббревиатуре, спасибо чувак.

  5. Йо! Ещё могу добавить, что describe не только для числовых, но и для категориальных данных работает, если передать параметр `include`. Например:

    Программный код:
    pd.DataFrame([["a","b"],["c","d"]]).describe(include='all'

  6. Цитата Сообщение от Venom
    Йо! Ещё могу добавить, что describe не только для числовых, но и для категориальных данных работает, если передать параметр `include`. Например:

    Программный код:
    pd.DataFrame([["a","b"],["c","d"]]).describe(include='all'
    Хорошее уточнение, бро! Часто забывают про include='all'.

  7. Всё верно, ребят! А вообще, `describe` можно использовать даже с временными рядами и многомерными датасетами. Просто добавляешь свои данные и bam — у тебя уже куча инфы про них.

  8. Цитата Сообщение от Галя
    Всё верно, ребят! А вообще, `describe` можно использовать даже с временными рядами и многомерными датасетами. Просто добавляешь свои данные и bam — у тебя уже куча инфы про них.
    Ага, именно. Особенно полезно на первых этапах анализа, чтобы быстро нащупать, какие данные надо подчищать/исследовать.

  9. Бонусный совет: когда делаешь отчёты или презентации, много инфы можно пихать в визуализации, после прогонки через `describe`. Тогда начальство вообще чётко понимает, что ты анализировал.

  10. Цитата Сообщение от Alexeig20
    Бонусный совет: когда делаешь отчёты или презентации, много инфы можно пихать в визуализации, после прогонки через `describe`. Тогда начальство вообще чётко понимает, что ты анализировал.
    Хаха, точняк! Менеджеры любят красивые графики и красивые цифры.

Страница 1 из 2 12 ПоследняяПоследняя