Страница 1 из 2 12 ПоследняяПоследняя
Показано с 1 по 10 из 12

Тема: Как использовать ttest ind python для сравнения выборок?

  1. Как использовать ttest ind python для сравнения выборок?

    Ребята, нужна помощь с ttest ind python. У меня есть две выборки данных, и я хотел бы их сравнить, используя t-test (независимый выборочный тест).
    Не могу понять, как правильно реализовать этот тест в Python. Может кто-то поделиться кодом или объяснить, как это делается?
    Спасибо!



  2. Ждём вас в нашем чате в Телеграмм ==>> @pythoneer_chat

    А ТАКЖЕ: Канал о Python, статьи и книги ==>>
    @pythoneer_ru

  3. Тут всё просто! Для начала нужно импортировать необходимые библиотеки:
    Программный код:
    import numpy as np
    from scipy import stats

    # Создание двух выборок
    sample1 np.array([1215141013])
    sample2 np.array([101211149])

    # Проведение t-теста
    t_statp_value stats.ttest_ind(sample1sample2)

    print(
    "t-статистика:"t_stat)
    print(
    "p-значение:"p_value
    Этот код поможет тебе сравнить две выборки. Если p-значение меньше 0.05, то группы отличаются значимо.

  4. Цитата Сообщение от Серов
    Тут всё просто! Для начала нужно импортировать необходимые библиотеки:
    Программный код:
    import numpy as np
    from scipy import stats

    # Создание двух выборок
    sample1 np.array([1215141013])
    sample2 np.array([101211149])

    # Проведение t-теста
    t_statp_value stats.ttest_ind(sample1sample2)

    print(
    "t-статистика:"t_stat)
    print(
    "p-значение:"p_value
    Этот код поможет тебе сравнить две выборки. Если p-значение меньше 0.05, то группы отличаются значимо.
    Ого, спасибо, брат! Сразу видно, что шаришь. Надо потестить у себя.

  5. Ещё можно использовать pandas для работы с данными. Вот примерчик:
    Программный код:
    import pandas as pd
    from scipy
    .stats import ttest_ind

    df 
    pd.DataFrame({
        
    'group'np.repeat(['A''B'], 5),
        
    'values': [1012111491215141013]
    })

    group_a df[df['group'] == 'A']['values']
    group_b df[df['group'] == 'B']['values']

    t_statp_value ttest_ind(group_agroup_b)

    print(
    f"t-статистика: {t_stat}, p-значение: {p_value}"
    Обрати внимание на структуру данных. Pandas очень удобен для таких целей.

  6. Цитата Сообщение от SofiaRanger
    Ещё можно использовать pandas для работы с данными. Вот примерчик:
    Программный код:
    import pandas as pd
    from scipy
    .stats import ttest_ind

    df 
    pd.DataFrame({
        
    'group'np.repeat(['A''B'], 5),
        
    'values': [1012111491215141013]
    })

    group_a df[df['group'] == 'A']['values']
    group_b df[df['group'] == 'B']['values']

    t_statp_value ttest_ind(group_agroup_b)

    print(
    f"t-статистика: {t_stat}, p-значение: {p_value}"
    Обрати внимание на структуру данных. Pandas очень удобен для таких целей.
    О, да, pandas рулит! Спасибо за наводкую. Нужно попробовать этот подход.

  7. Важная фигня: перед тестом убедись, что выборки нормально распределены и имеют одинаковую дисперсию. Для проверки нормальности можно использовать тест Шапиро-Уилка.
    Программный код:
    from scipy.stats import shapirolevene

    stat
    p1 shapiro(sample1)
    statp2 shapiro(sample2)

    print(
    f"p-value нормальности для выборки 1: {p1}, выборки 2: {p2}")

    # Проверка равенства дисперсий
    statp_variance levene(sample1sample2)
    print(
    "p-значение проверки равенства дисперсий:"p_variance
    Если обе проверки пройдены, тогда t-test можно юзать.

  8. Цитата Сообщение от Сергей Демидов
    Важная фигня: перед тестом убедись, что выборки нормально распределены и имеют одинаковую дисперсию. Для проверки нормальности можно использовать тест Шапиро-Уилка.
    Программный код:
    from scipy.stats import shapirolevene

    stat
    p1 shapiro(sample1)
    statp2 shapiro(sample2)

    print(
    f"p-value нормальности для выборки 1: {p1}, выборки 2: {p2}")

    # Проверка равенства дисперсий
    statp_variance levene(sample1sample2)
    print(
    "p-значение проверки равенства дисперсий:"p_variance
    Если обе проверки пройдены, тогда t-test можно юзать.
    Точно, про нормальность всегда забываю! Круто что напомнил.

  9. Я добавлю к этому: можно ещё визуализировать данные, чтобы лучше понять их распределение. Мой любимый инструмент для визуализации - Seaborn.
    Программный код:
    import seaborn as sns
    import matplotlib
    .pyplot as plt

    sns
    .histplot(sample1kde=Truelabel='Sample 1')
    sns.histplot(sample2kde=Truelabel='Sample 2')
    plt.legend()
    plt.show() 
    Визуализация всегда помогает увидеть любую странность в данных.

  10. Цитата Сообщение от ViktorDancer
    Я добавлю к этому: можно ещё визуализировать данные, чтобы лучше понять их распределение. Мой любимый инструмент для визуализации - Seaborn.
    Программный код:
    import seaborn as sns
    import matplotlib
    .pyplot as plt

    sns
    .histplot(sample1kde=Truelabel='Sample 1')
    sns.histplot(sample2kde=Truelabel='Sample 2')
    plt.legend()
    plt.show() 
    Визуализация всегда помогает увидеть любую странность в данных.
    Визуал лучше всего, помогает понять всей картину. Классно, попробую твой совет, братан.

Страница 1 из 2 12 ПоследняяПоследняя