Докладчики: Илона Роландовна Теблоева
Тема доклада: Методология автоматизированного формирования текстового корпуса
Аннотация: В докладе рассматривается методология автоматизированного формирования текстового корпуса из разнородных цифровых источников: социальных сетей, мессенджеров, научных публикаций и сайтов. Особое внимание уделяется приведению данных к единому формату, базовой тематической разметке по ключевым словам, а также дальнейшему развитию подхода через контекстный анализ и подготовку датасета для дообучения BERT.
Следующий анонс Предыдущий анонс