К основному контенту

Автоматизированный фоносемантический и контент-анализ

 
Часть 1.  Фоносемантический анализ.

Я рассматривала рассказы "Рейс "Ласточки" и "58 дней в огне" В.Богомолова. 
Использовав программу Vaal, я получила анализ эмоционального посыла на основе слов в текстах Оба текста о героизме в Сталинградской битве, но эмоциональный посыл отличается.

Первый текст: акцент на хаосе, немедленной угрозе (бомбардировки, пожар, риск взрыва). Вызывает острый страх и напряжение от беспомощности. Фоносемантика: сильнее подавление светлого (-265), доброго (-206); грубый 311, мужественный 285, суровый 235.



Второй текст: фокус на упорстве, тактике и решимости (разведка, атака, оборона). Вызывает уважение с оттенком холодной жесткости. Фоносемантика: подавление доброго (-260, сильнее), светлого (-130, слабее); суровый 294 (выше), грубый 310, мужественный 286.


Вывод: первый мрачнее и страшнее (ужас выживания), второй суровее и неумолимее (триумф воли). Баллы подтверждают нюансы звучания.

Часть 2. Контент-анализ.

Моделирование тем (topic modeling) в Orange выявило по одной теме на текст, но с низкой целостностью текста (0,42 и 0,25). Это ожидаемо: каждый текст короткий и посвящён единому эпизоду Сталинградской битвы. Ключевые слова точно отражают содержание.

Первый текст: прямо указывают на переправу боеприпасов на «Ласточке» под обстрелом.




Второй текст: чётко передают историю дома Павлова (захват и оборона).




Модель отражает содержание точно, но не даёт новой информации: тексты слишком короткие и последовательные как единое целое, поэтому модель просто вытаскивает центральные лексемы.

Word cloud отражает содержание ещё точнее. Он показывает частотность без попытки группировки.

Первый: идеально передают суть рассказа.




Второй: сразу видно про сержанта Павлова и оборону дома.




Word cloud выигрывает в простоте и наглядности для коротких текстов: сразу видно доминирующие слова без абстракции в «темы».

Для определения тематики коротких последовательных текстов легче и надёжнее использовать word cloud. Topic modeling полезнее на корпусе из многих документов, где нужно найти скрытые группы тем. Здесь же он избыточен и даёт меньше визуальной ясности.

Комментарии

Популярные сообщения из этого блога

Расчет стоимости персонала в медиаэкономике

 Требования по отбору персонала: Творческий (Корреспондент): 1.    Адекватность 2. Возраст и пол (предпочтение молодым) 3. Пуктуальность 4. Грамотная устная и письменная речь 5. Развитые коммуникативные навыки 6. Опыт работы в других холдингах, телеканалах и.т.д Тестовое задание: Написать небольшой новостной сюжет, анонс предстоящего события Технический (Оператор): 1.    Адекватность 2. Возраст и пол (предпочтение молодым) 3.  Пуктуальность 4. Опыт работы 5. Умение пользоваться проф. оборудованием Тестовое задание: Снять и смонтировать короткий видеоролик. Коммерческий (Юрист): 1.  Развитые коммуникативные навыки 2.  Грамотная устная и письменная речь 3. Пунктуальность 4. Адекватность 5. Владение законодательством Тестовое задание: найти ошибки в  договоре ( трудовом, коллективном, о сотрудничестве); подготовить правовое заключение по сделке. Оценка стоимости творческий технический коммерческий ...

Метод свободных ассоциаций

У1 – Корнилова Полина У2 – Жукова Виктория № Раунд 1: первая ассоциация (ключевые слова) Первое впечатление (+,-, neu) Раунд 2: ассоциации после обсуждения Итоговое впечатление (+,-, neu) Есть ли изменения? контент У1 У2 У1 У2 У1 У2 У1 У2 У1 У2 1 Позитивно Странность, морской прибой, фантастика + neu   без изменений без изменений + neu Нет нет 2 Спокойные Спокойствие, дождливость, Питер + +   без изменений без изменений + + нет нет 3 Нейтральная. Не вызывает эмоции   Заинтересованность, опасная безопасность  neu +   без изменений   без изменений neu +  нет нет 4 Нейтральные Нетрально, кинотеатр, переживания neu neu   без изменений романтические переживания, работа neu + нет да 5 Тревожные Тревога, зал ожидания, примерочная - -    без изменений без изменений - - нет нет 6 Тревожные Уют, доверие, империя - +   без изменений   без изменений - + нет нет 7 Нейтральн Негатив, вокза...

Бизнес-план медиакомпании “Городской Вестник”

  Бизнес-план медиакомпании “Городской Вестник” Резюме Название издания:  “Городской Вестник” Объем:  40 страниц в выпуске, 10 материалов в день Периодичность выхода:  Еженедельно Целевая аудитория Пол:  Мужчины и женщины в возрасте от 25 до 55 лет Возраст:  25-55 лет Что объединяет:  Интересы в городской жизни, культуре, бизнесе и развлечениях Где искать:  Социальные сети, городские мероприятия, форумы и сообщества Финансовый план Доходы: Реклама: 50% Подписки: 30% Партнерские программы: 20% Расходы: Производство контента: 30% Маркетинг и продвижение: 20% Административные расходы: 10% Аренда и оборудование: 15% Зарплата сотрудников: 25% Примерный план выпуска номеров: Понедельник: 5 материалов Вторник: 3 материала Среда: 2 материала Четверг: 2 материала Пятница: 3 материала Суббота: 5 материалов Воскресенье: 5 материалов Перспективы развития Принесет прибыль:  При грамотном маркетинге и качественной контентной стратегии, издание может стать ...