Skip to content

Latest commit

 

History

History
28 lines (23 loc) · 5.08 KB

parameters_description.md

File metadata and controls

28 lines (23 loc) · 5.08 KB

🖇 Приложение: описание параметров в исследовании телеграм каналов

Обкачивание каналов происходит автоматически на сервере AWS Лаборатории примерно раз в месяц начиная с декабря 2022.

Исследуемые параметры

Параметры из telegram-api Feature engineering
Описание канала (бинарная переменная - есть или нет) Средняя длина постов в канале (в количестве символов)
Количество постов всего в канале (с момента наблюдения) Посты в день (среднее количество постов в день в канале)
Количество постов, которые являются репостами из других источников (с момента наблюдения) Посты в неделю (среднее количество постов в неделю в канале)
Количество постов с приложенными фото в среднем на количество постов в канале Посты в месяц (среднее количество постов в месяц в канале)
Количество постов с медиафайлами в среднем на количество постов в канале Эмоджи в постах (среднее количество эмоджи в постах в канале)
Количество приложенных файлов (вид медиафайлов)в постах в среднем на количество постов в канале Доля негативно-окрашенных постов
Количество ссылок приложенных к постам в среднем на количество постов в канале Доля позитивно-окрашенных постов
Количество подписчиков на момент обкачивания Посты типа speech act (процент постов типа speech act в канале. Speech act - это дискурсивный акт, то есть такие посты, например, могут призывать к действию)
Дата создания канала Отношение к войне в Украине (анти/про/неизвестно или нейтральное). Считается для каждого поста, а потом для определения политической позиции канала смотрим, каких постов больше анти или про военных.
Похожесть первого предложения на весь пост (Считаем косинусное расстояние между вектором первого предложения и остальным текстом, потом считаем среднее значение по всем постам канала. Показывает, насколько лаконичен текст)
Admins ER (наша исходная гипотеза о том, какие параметры окажутся важными для вовлеченности пользователей) = (наличие описания + количество постов + похожесть первого предложения на текст - репосты других источников + средняя длина поста + используются ли медиафайлы + среднее количество постов в день + среднее количество постов в месяц + среднее количество постов в неделю + среднее количество постов с фото + среднее количество постов с веб-ссылками + среднее количество постов с приложенными файлами + среднее количество эмоджи в постах + процент позитивных постов + процент негативных постов + процент постов типа speech act) / максимальное значение по всем этим показателям

Целевые параметры (те, из которых составляется охват и вовлеченность)

Параметры из telegram-api Feature engineering
Среднее количество просмотров постов Количество уникальных комментаторов в среднем под постами канала
Среднее количество реакций
Количество репостов поста пользователями в среднем на пост
Среднее количество комментариев под постами