Stemming в Python - это короче процесс, когда убираем окончания слов, чтоб свести их к одной основе. Например, 'running' и 'ran' приводим к 'run'. Это важно для поисковых систем, анализа текстов и т.д.
В Python часто юзают библиотеку nltk. Вот короткий пример:
Программный код:
import nltk
from nltk.stem import PorterStemmer
nltk.download('punkt')
ps = PorterStemmer()
words = ['pythoning', 'pythonic', 'pythonista', 'pythonista']
for w in words:
print(ps.stem(w))
Так можно привести все словоформы к одной основе, чтобы дальше работать с текстом.