Skip to content

тестовое задание на стажировку в проекте "Построение системы анализа комментариев" @ JetBrains Research

Notifications You must be signed in to change notification settings

dsashulya/roberta-tweets

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

19 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Определение расистских/сексистских твитов с помощью RoBERTa

Содержание:

Задание состоит из 3 частей:

  • Возьмите предобученую модель RoBERTa из библиотеки transformers от 🤗. Дообучите модель определять является ли твит расистским или сексистким с использованием соответствующего датасета. Не забудьте поделить датасет на тренировочную и тестовую выборку.

  • Оцените качество тестовой модели с использованием метрики Accuracy до и после дообучения. Проанализируйте, как выбор порога классификации влияет на точность с помощью PR-curve.

  • (Опционально) Реализуйте простой CLI, который принимает на вход предложение и выводит в консоль результат оценки модели, а также время, которое понадобилось модели на обработку этого предложения.

Примеры работы CLI:

About

тестовое задание на стажировку в проекте "Построение системы анализа комментариев" @ JetBrains Research

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published