You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
🖇 Приложение: описание параметров в исследовании телеграм каналов
Обкачивание каналов происходит автоматически на сервере AWS Лаборатории примерно раз в месяц начиная с декабря 2022.
Исследуемые параметры
Параметры из telegram-api
Feature engineering
Описание канала (бинарная переменная - есть или нет)
Средняя длина постов в канале (в количестве символов)
Количество постов всего в канале (с момента наблюдения)
Посты в день (среднее количество постов в день в канале)
Количество постов, которые являются репостами из других источников (с момента наблюдения)
Посты в неделю (среднее количество постов в неделю в канале)
Количество постов с приложенными фото в среднем на количество постов в канале
Посты в месяц (среднее количество постов в месяц в канале)
Количество постов с медиафайлами в среднем на количество постов в канале
Эмоджи в постах (среднее количество эмоджи в постах в канале)
Количество приложенных файлов (вид медиафайлов)в постах в среднем на количество постов в канале
Доля негативно-окрашенных постов
Количество ссылок приложенных к постам в среднем на количество постов в канале
Доля позитивно-окрашенных постов
Количество подписчиков на момент обкачивания
Посты типа speech act (процент постов типа speech act в канале. Speech act - это дискурсивный акт, то есть такие посты, например, могут призывать к действию)
Дата создания канала
Отношение к войне в Украине (анти/про/неизвестно или нейтральное). Считается для каждого поста, а потом для определения политической позиции канала смотрим, каких постов больше анти или про военных.
Похожесть первого предложения на весь пост (Считаем косинусное расстояние между вектором первого предложения и остальным текстом, потом считаем среднее значение по всем постам канала. Показывает, насколько лаконичен текст)
Admins ER (наша исходная гипотеза о том, какие параметры окажутся важными для вовлеченности пользователей) = (наличие описания + количество постов + похожесть первого предложения на текст - репосты других источников + средняя длина поста + используются ли медиафайлы + среднее количество постов в день + среднее количество постов в месяц + среднее количество постов в неделю + среднее количество постов с фото + среднее количество постов с веб-ссылками + среднее количество постов с приложенными файлами + среднее количество эмоджи в постах + процент позитивных постов + процент негативных постов + процент постов типа speech act) / максимальное значение по всем этим показателям
Целевые параметры (те, из которых составляется охват и вовлеченность)
Параметры из telegram-api
Feature engineering
Среднее количество просмотров постов
Количество уникальных комментаторов в среднем под постами канала
Среднее количество реакций
Количество репостов поста пользователями в среднем на пост