Страница 1 из 2 12 ПоследняяПоследняя
Показано с 1 по 10 из 12

Тема: Как на Python extract text from text?

  1. Как на Python extract text from text?

    Всем привет! Недавно начал изучать Python и наткнулся на проблему. Мне нужно из одного текста достать другой текст. Как это лучше всего сделать? Есть ли какие-то встроенные методы? Буду рад примерчикам с кодом, как бы всё это можно было реализовать. Спасибо!



  2. Ждём вас в нашем чате в Телеграмм ==>> @pythoneer_chat

    А ТАКЖЕ: Канал о Python, статьи и книги ==>>
    @pythoneer_ru

  3. Йоу, чувак! В Python можно использовать встроенные методы строк, например, `find` и `slice`, чтобы вытаскивать текст. Если нужно что-то по умному, юзай регулярки (модуль re). Вот те примерчик:

    Программный код:

    import re



    text 
    'Пример текста, из которого нужно что-то вытащить'

    pattern 'нужно(.*?)вытащить'

    result re.search(patterntext)

    if 
    result:

        print(
    result.group(1).strip()) 
    Это вытащит всё между 'нужно' и 'вытащить'. Ловкость рук и никакого мошенничества!

  4. Цитата Сообщение от Olchiko
    Йоу, чувак! В Python можно использовать встроенные методы строк, например, `find` и `slice`, чтобы вытаскивать текст. Если нужно что-то по умному, юзай регулярки (модуль re). Вот те примерчик:

    Программный код:

    import re



    text 
    'Пример текста, из которого нужно что-то вытащить'

    pattern 'нужно(.*?)вытащить'

    result re.search(patterntext)

    if 
    result:

        print(
    result.group(1).strip()) 
    Это вытащит всё между 'нужно' и 'вытащить'. Ловкость рук и никакого мошенничества!
    Ага, регулярок тока не бойся. Чёткая тема! Если знаешь, как их юзать, можно вообще всё достать из текста.

  5. Если регулярные выражения кажутся сложными, можно использовать метод строк `split`. Правда, это займет больше времени:

    Программный код:

    text 
    'Пример текста, из которого нужно что-то вытащить'

    split_text text.split('нужно')

    if 
    len(split_text) > 1:

        
    result split_text[1].split('вытащить')[0].strip()

        print(
    result

  6. Цитата Сообщение от Мария Владимировна
    Если регулярные выражения кажутся сложными, можно использовать метод строк `split`. Правда, это займет больше времени:

    Программный код:

    text 
    'Пример текста, из которого нужно что-то вытащить'

    split_text text.split('нужно')

    if 
    len(split_text) > 1:

        
    result split_text[1].split('вытащить')[0].strip()

        print(
    result
    Еее, split рулит когда регулярки страшные. Но да, побольше кода будет. Регулярки лучше.

  7. Гугли модуль `BeautifulSoup` если работаешь с HTML в текстах. Это зачётная либка для парсинга текста из всяких веб-страничек. Код:

    Программный код:

    from bs4 import BeautifulSoup



    html 
    '<div>Тут текст который надо достать</div>'

    soup BeautifulSoup(html'html.parser')

    text soup.div.text

    print(text

  8. Цитата Сообщение от Рада
    Гугли модуль `BeautifulSoup` если работаешь с HTML в текстах. Это зачётная либка для парсинга текста из всяких веб-страничек. Код:

    Программный код:

    from bs4 import BeautifulSoup



    html 
    '<div>Тут текст который надо достать</div>'

    soup BeautifulSoup(html'html.parser')

    text soup.div.text

    print(text
    Круто, а как установить BeautifulSoup? Не сталкивался с ним ещё.

  9. Может, тебе подойдут методы `find` и `slice`:

    Программный код:

    text 
    'Пример текста, из которого нужно что-то вытащить'

    start text.find('нужно')

    end text.find('вытащить')

    if 
    start != -and end != -1:

        
    result text[start+len('нужно'):end].strip()

        print(
    result

  10. Цитата Сообщение от Aleksandra
    Может, тебе подойдут методы `find` и `slice`:

    Программный код:

    text 
    'Пример текста, из которого нужно что-то вытащить'

    start text.find('нужно')

    end text.find('вытащить')

    if 
    start != -and end != -1:

        
    result text[start+len('нужно'):end].strip()

        print(
    result
    Простой и понятный метод. Постоянно юзаю, реально помогает!

Страница 1 из 2 12 ПоследняяПоследняя