Для работы Хочу получать ответы на вопросы по теории, где что-то не до конца понятно. Например, в трансформерах, почему разные головы внимания аттендятся на разные токены. Или, получив новую метрику на датасете, как понять, что изменение статистически значимо.