lenta-ru-extractor
CLI-утилита для извлечения структурированного контента со страниц Lenta.ru.
Асинхронный парсер и лингвистический экстрактор Lenta.ru: собирает статьи, ищет предложения по слову (с учётом лемм) и сохраняет в DOCX. Во время ассоциативного анализа столкнулся с необходимостью большого количества данных, что и побудило к созданию данного парсера. Удобство и преимущество в том, что контекст к слову можно регулировать, то есть брать на несколько предложений до него, или несколько предложений после него, или вообще сразу