Data Science. Разработка с нуля. 1. Модуль для обработки текстов отчетов. Загружаются 20 отчетов (число наугад), они попадают в модуль обработки, там из отчета выделяются ФИО студента, курс (и др информация, для которой есть поля в бд), текст отчета проходит предобработку (нижний регистр, разбиение на слова, приведение к общей форме, в общем все по стандарту предобработки Естественного языка, чуть подробнее могу рассказать позже, если нужно), далее необходимо либо с помощью модели для выделения навыков студентов из текста выделять их навыки, либо с помощью какого-либо собственного алгоритма (к сожалению, просто составить словарь нельзя). Далее результаты модуля должны в формате |id студента - id навыка| попасть в БД в таблицу связи СтудентыНавыки. Необходимо реализовать обработку и выделение навыков студентов из отчетов.