четвер, 26 березня 2020 р.

Інформаційний контент-аналіз текстової інформації

Як проводити інформаційний контент-аналіз 
текстової інформації в медіа?

Один з основних етапів контент-аналітичного дослідження - вибір категорій ана­лізу. Вперше таке поняття увів М. Уіллі в 20-і роки нашого століття. Під час проведення дослід­ження «Провінційна газета» він класифікував зміст за трьома критеріями:
1) тема чи сфера соціальної дійсності;
2) форма (новини, передова стаття та ін.),
3) суміш першого і другого (на­приклад, політичні новини).
Ці поняття назвали категоріями. М. Уіллі обґрунтував критерії, за якими виділяються категорії. Треба, щоб їх  можна було застосовувати до всіх газет загального порядку, щоб вони давали можливість порівняти:
·       різні газети в один час,
·       одну газету в різні часи,
·       різні газети у різні часи
(тобто висувається вимо­га універсальної порівнянності) і щоб ті категорії були об’єктивними і точними, а елемент суб’єк­тивізму в них був зведений до мінімуму.
Усього М. Уіллі розробив 49 категорій.

Самостійна пошуково-аналітична робота
Дізнайтеся, що означають слова, і до якої сфери вживання вони належать:
·        стаття;
·        інтерв’ю;
·        рецензія;
·        репортаж;

·        огляд.

У кожному дослідженні - свої категорії. Адже вибір категорій цілком залежить від цілей до­слідження. На це звертав увагу ще О. Р. Холсті
Категорії показують напрямок аналізу, те, на що дослідник звертає увагу. Від правильного підбору категорій багато в чому залежать загальні підсумки дослідження. Категоріальна мережа - це своєрідна схема, за якою дослідник проводить свій інформаційний аналіз. А. Джордж вважав, що дослідник втрачає цінну інформацію, якщо він самовільно застосовує категорії аналізу і вибірку. Той дослід­ник, який розуміє цінність категоріальної мере­жі, спробує сформулювати більш вузькі категорії, щоб з їх допомогою можна було точніше дослід­жувати дану тему.
Тут можна було припуститися двох помилок. Якщо прийняти занадто вузькі категорії, то мож­на втратити частину змісту, яка в них не ввійде. А якщо взяти дуже узагальнені категорії, то багато в чому втрачається оригінальність досліджуваних документів.

Самостійна пошуково-аналітична робота
Дізнайтеся, що означають слова, і до якої сфери вживання вони належать:

·        бэкграундер;
·        байлайнер;
·        факт-лист;
·        фиче;

·        пресс-релиз.

Запитання.
Як визначити оптимальний підхід до вибору категорій і процедур контент- аналізу текстової інформації в медіа?
Вибір категорій - це суто якісний момент дослідження, на базі якого у подальшому засто­совуються кількісні методи.
Деякі дослідники пропонують при проведенні пошукового аналізу не встановлювати заздалегідь категорій: хай сам хід аналізу покаже, куди далі рухатись. З цим не можна погодитися.
Якщо не визначити з самого початку напрямок аналізу, а саме це робиться за допомогою кате­горій, то дослідження ні до чого не приведе.
Як це робили раніше? Радянські дослідники вважали, що загальною підставою для обрання категорій та їх потенційним резервуаром має бути позатекстова реальність в цілому, змодельована на базі діалектико-матеріалістичного розуміння суспільного життя, а не окремий момент, який моделюється у рамках будь-якої однієї соціальної теорії. Це не зовсім правильно.
Навряд чи треба обмежувати коло проблем, які впливають на обрання категорій, тільки позатекстовою реальністю. І, до речі, сам автор, який висунув це положення, трохи далі спростував його.
В. В. Сазонов пише про два типи категорій. Перший охоплює все те, що стосується форми існування текстової реальності. Сюди увійдуть характерні атрибути текстової інформації:
Оперативність повідомлень,
об’єктивність повідомлень,
коментованість повідомлень,
інформованість повідомлень,  
читабельність повідомлень тощо.
Другий тип категорій передбачає, що у тексті ви­діляються відповідні об’єкти, що вказують на явища і відношення, які ре­презентують позатекстову реальність. Тому відбір категорій, виходячи з позатекстової реальності, має сенс тільки тоді, коли дослідження стосується позатекстових подій, та і то не завжди.
Інформаційний аналіз має розглядати ті моменти та аспекти текстового документа, які безпосередньо не відносяться до позатекстової реальності, а фактично служать у тексті індика­торами прихованих задумів комунікатора.
Щодо визначення самого поняття категорій, то тут існують різні думки. Одні вважають, що категорії будуються тільки на базі позатекстової реальності (В. А. Марков: «Засобом контент-аналітичного дослідження служать категорії аналізу, які є теоретичними конструкціями, розробленими на базі позатекстової реальності. Вибір категорій передбачає, які характеристики, параметри су­купності текстів увійдуть у сферу дослідження. Тобто фактично предмет дослідження задається не тільки цілями, а й вибором категорій», але більшість дотримується думки, що категорія - це містке і разом з тим лаконічне висловлення проблеми дослідження, у відповід­ності з якою упорядковуються одиниці інформаційного аналізу і квантифікується зміст.
Які результати дослідження? Конструювання ка­тегоріальної мережі полягає у класифікації, відпо­відному групуванні семантичного простору оди­ниць аналізу. На нашу думку, категорія контент-аналізу - це поняття, яке показує один з аспектів загального напрямку конкретного дослідження текстових документів. У структурному плані категорія являє собою угрупування одиниць аналізу. Джерело категорій - це сам документ як сукупність окремих суджень, а також цілі і завдання дослідження. Категорії контент-аналізу мають бути місткими і разом з тим достатньо конкретними, щоб з одного боку не упускати щось таке, що характеризує даний документ як оригінальне джерело інформації, а з другого, щоб не загубити за дрібницями загального напрямку дослідження.
Успіх будь-якого контент-аналітичного дослід­ження багато в чому залежить саме від прави­льного обрання категорій аналізу. Це обумовлює великі вимоги, які ставляться до категорій:
·       категорії мають бути вичерпними, тобто бути придатними для розгляду всього змісту документа чи в усякому разі тих його частин, які відповідають на питання дослідження;
·       категорії повинні бути виключними, тобто одиниці аналізу мають належати тільки до однієї з категорій;
·       категорії повинні бути об’єктивними, неза­лежними і надійними, щоб будь-який кодирувальник,взявши на озброєння категорії дослідження, розумів їх недвозначно. У нього не повинно вини­кати питань про те, до якої ж категорії віднести ту чи іншу одиницю змісту. Саме у такому випадку дослідження не залежатиме від суб’єктивних думок окремих людей, а праця кодирувальника буде суто технічною;
·       категорії повинні бути доцільними, тобто від­ображати цілі дослідження і зміст об’єкта аналізу.
Звісно, дослідники не раз намагалися стандар­тизувати категорії аналізу, однак це завдання ще не вирішено і незрозуміло, чи може воно бути вирішено взагалі. Справа в тому, що для вироблення стандартизованих категорій необхід­но, щоб, по-перше, всі дослідники дотримувалися однієї моделі і концепції аналізу, а, по-друге, щоб тип і зміст усякого текстового документа рівною мірою підходив до тих категорій. Мабуть, будуть підіб­рані тільки деякі універсальні категорії, а інші дослідник обиратиме залежно від типу та завдань аналізу.
Універсальними можуть бути категорії, які відповідають на найбільш узагальнені питання контент-аналізу, такі, як напрямок комунікаціїпропаговані цінності й засоби їх отримання і подібне.
Як приклад оригінального обрання категорій аналізу можна навести дослідження, яке провів директор Інституту соціальної психології Страсбурзького університету А. Моль на мате­ріалах французької щоденної газети «Монд» за 1 квітня 1960 р.
Він узяв за категорії дослідження такі парамет­ри:
1) об’єктивну кількісно оцінювану значимість (довжина повідомлення),
2) рівень абстрактності чи незрозумілості,
3) рівень глибини розумової структури (тобто дистанція до індивіда). У резу­льтаті дослідження з’явилася така таблиця:
1 - ступінь структурованості публікації з візуалізаціями;
2 - ранг значимості інформації в медіа;
 3 - авторська дистанція до індивіда в статті,
4 - рівень абстракт­ності чи важкості сприйняття термінів;
5 - рівень важливість публікації для соціуму;
6- ступінь наративності(нав’язування оцінок) в публікації;
7 - міра зайвої інформативності в публікації;

Контент-аналіз  газети  за сімома категоріями
Статті в газеті «МОНД»
2
3
4
Промова Кеннеді
1
4
2
«Санта Марія»
2
6
1
Панарабська конференція
4
5
2
Промова Спаака
3
6
1
Страйк учителів
3
3
2
Конгрес по космосу
4
7
2
Геологія Парижа
6
6
4
Шкідливі підприємства
6
5
4
Крадіжка в американському експресі
4
6
2
Зникнення дисертації викладача
5
7
1
Уламки «Білого птаха»
5
7
2
Алжирська економіка
5
4
3
Шимпанзе - космонавт
5
6
1
Погода
5
2
2
Конго і ООН
4
4
1
Конго
3
5
1
Лаос
7
6
1
Старожитності Тайваню
7
7
1
Замки і телебачення
7
4
2
Крадіжка транзистора у водія вантажівки
6
7
1

тому, що в багатьох випадках досліджувана су­купність документів є настільки великою, що не можна вивчати її усю. І тут постає проблема ви­бору з цієї сукупності представників, аналіз яких дав би уявлення про всю сукупність документів.
Перший етап усякої вибірки - це обрання джерела інформації. Учений, залежно від цілей дослідження, обирає ті джерела, які допоможуть виконати поставлені завдання. Вибірка може бути репрезентативною чи типологічною. Репрезента­тивна вибірка претендує на те, щоб представляти всю сукупність, що досліджується, типологічна вказує, що для сукупності характерні певні риси, але не відображає всіх характеристик тих доку­ментів, що вивчаються. Репрезентативна вибірка поділяється на квотну і випадкову. За допомогою квотної вибірки ми беремо від кожної досліджу­ваної сукупності частку документів відповідно до розміру тієї сукупності (наприклад, тиражу газет) та її ролі у досліджуваній проблемі. Як бачимо, цей тип вибірки вимагає певних даних, які дослідник не завжди має. Тому більшість учених застосовує так звану випадкову вибірку.
За цією вибіркою можливість потрапити у склад обраних документів однакова для всіх елементів сукупності, тому ця вибірка також вважається репрезентативною.
Але тут постає інше питання: скільки ж пот­рібно відібрати документів, щоб, з одного боку, їх опрацювання не перевищувало межі тих сил і часу, які виділені для дослідження, а з іншого - щоб ці документи достатньо повно представляли всю сукупність? Цікавий досвід випадкової вибірки накопичений Інститутом по вивченню суспільної думки Геллапа.
Як ми пам’ятаємо, ступінь надійності, якої пот­ребує соціологічне дослідження, складає 95 %. Виходячи з цього, можна підбирати вибіркову сукупність. Як бачимо на таблиці, найоптимальнішою є сукупність із 1500 елементів. Зага­льна помилка за такої сукупності складає всього 2-3 %. Брати сукупність з 3000 елементів немає сенсу, бо це збільшує працю дослідника у два рази, а помилку зменшує тільки на 1 %.
Проводячи вибірку, треба ретельно стежити за тим, як ми бачимо, саме категорії, бо за будь-яких умов  вони дають можливість зв’язати завдання дослід­ження з конкретним об’єктом і, таким чином, забезпечують успішний хід аналізу.
Тепер звернімося до іншої важливої складової частини контент-аналізу. Вибірка відіграє велику роль у процесі контентного аналізу.
Таблиця похибок при контент-аналізі
% думок
3000
примірників.
1500 примірників.
1000 примірників.
600 примірників.
400 примірників.
200 примірників.
10%
2
2
2
4
4
5
20%
2
2
3
4
5
7
30%
2
3
4
5
6
8
40%
2
3
4
5
6
9
50%
2
3
4
5
6
9
60%
2
3
4
5
6
9
70 %
2
3
4
5
6
8
80%
2
2
3
4
5
7
90%
1
2
2
4
4
5

Вчені цього Інституту склали таблицю, яка по­казує у відсотках розмір помилки при випадковій вибірці.
Справа у тім, щоб вона була справді випадкова. Якщо, наприклад, при дослідженні матеріалів районних газет взяти до уваги тільки ті номери, які вихо­дять по середах, то це не дасть повного уявлення про всі номери газети, оскільки номери, які виходять у певні дні, мають свої особливості. Отже, у вибірку повинні потрапити і номери, які виходять в інші дні тижня.
Як приклад можна навести вибірку, яку здійс­нили М. Пайян і Д. Оуен. Із 27 газет з тиражем понад 300 тис. примірників за допомогою випад­кової вибірки вони обрали 8. Потім з кожного номера цих газет за березень 1975 р. взяли по 6 статей, і таким чином, вибіркову сукупність склали 6638 матеріалів.
Ще один тип вибірки, який широко застосовує­ться дослідниками, але не дає надійних гарантій точності, це - вибірка за допомогою експертного опитування.
Для забезпечення високої якості дослідження треба при проведені вибірки користуватися нау­ковими методиками. Відбір документів тільки за власним бажанням дослідника зменшує достовір­ність і вносить зайвий елемент суб’єктивізму.
Які треба робити висновки?  Отже, категорія контент аналізу - це поняття, яке показує один з аспектів загаль­ного напрямку конкретного дослідження  текстових доку­ментів. У структурному плані категорія являє собою угрупування одиниць аналізу. Джерело категорій - це сам документ як сукупність окре­мих суджень, а також цілі і завдання дослід­ження. Категорії контент-аналізу мають бути місткими і разом з тим достатньо конкретними, щоб, з одного боку, не упускати щось таке, що характеризує даний документ як оригінальне джерело інформації, а з іншого - щоб не загуби­ти за дрібницями загального напрямку дослід­ження. Категорії мають бути водночас вичерпними, виключними, об’єктивними, незалежними, надійними і доцільними.
Оскільки стандартизувати категорії складно через об’єктивні обставини, то можливо виробити лише деякі універсальні категорії, які відпові­дають на найбільш узагальнені питання контент- аналізу (напрямок комунікації, пропаговані цін­ності, засоби їх отримання і под.).
Правильний вибір категорій дає можливість зв’язати завдання дослідження з конкретним об’єк­том, а отже, забезпечити успішний хід аналізу.
Обрання певних документів із їх сукупності, створення репрезентативної чи типологічної ви­бірки залежить від цілей дослідження. Частіше всього дослідники обирають випадкову вибірку, яка є репрезентативною. Щоб помилка дослід­ження не перевищувала припустиму межу, роз­роблено відповідні таблиці, які визначають по­трібну кількість вибраних документів випадкової вибірки). Головне на цьому етапі дослідження забезпечити, щоб вибірка і справді була ви­падковою.
Вибірка за допомогою експертного опитування не дає гарантій точності. А відбір документів ті­льки за власним бажанням дослідника зменшує достовірність, оскільки містить елемент суб’єк­тивізму.


Інформаційний аналіз текстової інформації використовує різні методи:

·         контент-аналіз,
·         обґрунтована теорія смислу,
·         етнографічні методи кодування змісту,
·         дискурс-аналіз,
·         символічна політика,
·         методи соціолінгвістики,
·         теорії комунікації,
·         функціональна прагматика;
·         теорія відмінностей,
·         методи, засновані на політичній психології;
·         етнометодології; феноменології;
·         семіотики,
·         лінгвістики тексту;
·         теорії мовних актів і когнітивної лінгвістики;
·         можливості герменевтики;
·         об'єктивна герменевтика;
·         методи психолінгвістики;
·         психосемантики;
·         суггестивной лінгвістик;
·         фоносемантики.

Найпростіша взаємодія онлайн-користувача з сайтами, - для цього досить йому зайти на сайти і там знайти такі приклади використання текстової інформації у вигляді:
·        Гіпертекстової публікації;
·        Мультимедійної публікації;
·        Інтерактивної публікації;
·        Транскордонної публікації. 

Немає коментарів:

Дописати коментар