10 клас. Інформатика. Дистанційне навчання.: Інформаційний контент-аналіз текстової інформації

Як проводити інформаційний контент-аналіз

текстової інформації в медіа?

Один з основних етапів контент-аналітичного дослідження - вибір категорій аналізу. Вперше таке поняття увів М. Уіллі в 20-і роки нашого століття. Під час проведення дослідження «Провінційна газета» він класифікував зміст за трьома критеріями:

1) тема чи сфера соціальної дійсності;

2) форма (новини, передова стаття та ін.),

3) суміш першого і другого (наприклад, політичні новини).

Ці поняття назвали категоріями. М. Уіллі обґрунтував критерії, за якими виділяються категорії. Треба, щоб їх можна було застосовувати до всіх газет загального порядку, щоб вони давали можливість порівняти:

· різні газети в один час,

· одну газету в різні часи,

· різні газети у різні часи

(тобто висувається вимога універсальної порівнянності) і щоб ті категорії були об’єктивними і точними, а елемент суб’єктивізму в них був зведений до мінімуму.

Усього М. Уіллі розробив 49 категорій.

Самостійна пошуково-аналітична робота

Дізнайтеся, що означають слова, і до якої сфери вживання вони належать:

· стаття;

· інтерв’ю;

· рецензія;

· репортаж;

· огляд.

У кожному дослідженні - свої категорії. Адже вибір категорій цілком залежить від цілей дослідження. На це звертав увагу ще О. Р. Холсті

Категорії показують напрямок аналізу, те, на що дослідник звертає увагу. Від правильного підбору категорій багато в чому залежать загальні підсумки дослідження. Категоріальна мережа - це своєрідна схема, за якою дослідник проводить свій інформаційний аналіз. А. Джордж вважав, що дослідник втрачає цінну інформацію, якщо він самовільно застосовує категорії аналізу і вибірку. Той дослідник, який розуміє цінність категоріальної мережі, спробує сформулювати більш вузькі категорії, щоб з їх допомогою можна було точніше досліджувати дану тему.

Тут можна було припуститися двох помилок. Якщо прийняти занадто вузькі категорії, то можна втратити частину змісту, яка в них не ввійде. А якщо взяти дуже узагальнені категорії, то багато в чому втрачається оригінальність досліджуваних документів.

Самостійна пошуково-аналітична робота

Дізнайтеся, що означають слова, і до якої сфери вживання вони належать:

· бэкграундер;

· байлайнер;

· факт-лист;

· фиче;

· пресс-релиз.

Запитання.

Як визначити оптимальний підхід до вибору категорій і процедур контент- аналізу текстової інформації в медіа?

Вибір категорій - це суто якісний момент дослідження, на базі якого у подальшому застосовуються кількісні методи.

Деякі дослідники пропонують при проведенні пошукового аналізу не встановлювати заздалегідь категорій: хай сам хід аналізу покаже, куди далі рухатись. З цим не можна погодитися.

Якщо не визначити з самого початку напрямок аналізу, а саме це робиться за допомогою категорій, то дослідження ні до чого не приведе.

Як це робили раніше? Радянські дослідники вважали, що загальною підставою для обрання категорій та їх потенційним резервуаром має бути позатекстова реальність в цілому, змодельована на базі діалектико-матеріалістичного розуміння суспільного життя, а не окремий момент, який моделюється у рамках будь-якої однієї соціальної теорії. Це не зовсім правильно.

Навряд чи треба обмежувати коло проблем, які впливають на обрання категорій, тільки позатекстовою реальністю. І, до речі, сам автор, який висунув це положення, трохи далі спростував його.

В. В. Сазонов пише про два типи категорій. Перший охоплює все те, що стосується форми існування текстової реальності. Сюди увійдуть характерні атрибути текстової інформації:

Оперативність повідомлень,

об’єктивність повідомлень,

коментованість повідомлень,

інформованість повідомлень,

читабельність повідомлень тощо.

Другий тип категорій передбачає, що у тексті виділяються відповідні об’єкти, що вказують на явища і відношення, які репрезентують позатекстову реальність. Тому відбір категорій, виходячи з позатекстової реальності, має сенс тільки тоді, коли дослідження стосується позатекстових подій, та і то не завжди.

Інформаційний аналіз має розглядати ті моменти та аспекти текстового документа, які безпосередньо не відносяться до позатекстової реальності, а фактично служать у тексті індикаторами прихованих задумів комунікатора.

Щодо визначення самого поняття категорій, то тут існують різні думки. Одні вважають, що категорії будуються тільки на базі позатекстової реальності (В. А. Марков: «Засобом контент-аналітичного дослідження служать категорії аналізу, які є теоретичними конструкціями, розробленими на базі позатекстової реальності. Вибір категорій передбачає, які характеристики, параметри сукупності текстів увійдуть у сферу дослідження. Тобто фактично предмет дослідження задається не тільки цілями, а й вибором категорій», але більшість дотримується думки, що категорія - це містке і разом з тим лаконічне висловлення проблеми дослідження, у відповідності з якою упорядковуються одиниці інформаційного аналізу і квантифікується зміст.

Які результати дослідження? Конструювання категоріальної мережі полягає у класифікації, відповідному групуванні семантичного простору одиниць аналізу. На нашу думку, категорія контент-аналізу - це поняття, яке показує один з аспектів загального напрямку конкретного дослідження текстових документів. У структурному плані категорія являє собою угрупування одиниць аналізу. Джерело категорій - це сам документ як сукупність окремих суджень, а також цілі і завдання дослідження. Категорії контент-аналізу мають бути місткими і разом з тим достатньо конкретними, щоб з одного боку не упускати щось таке, що характеризує даний документ як оригінальне джерело інформації, а з другого, щоб не загубити за дрібницями загального напрямку дослідження.

Успіх будь-якого контент-аналітичного дослідження багато в чому залежить саме від правильного обрання категорій аналізу. Це обумовлює великі вимоги, які ставляться до категорій:

· категорії мають бути вичерпними, тобто бути придатними для розгляду всього змісту документа чи в усякому разі тих його частин, які відповідають на питання дослідження;

· категорії повинні бути виключними, тобто одиниці аналізу мають належати тільки до однієї з категорій;

· категорії повинні бути об’єктивними, незалежними і надійними, щоб будь-який кодирувальник,взявши на озброєння категорії дослідження, розумів їх недвозначно. У нього не повинно виникати питань про те, до якої ж категорії віднести ту чи іншу одиницю змісту. Саме у такому випадку дослідження не залежатиме від суб’єктивних думок окремих людей, а праця кодирувальника буде суто технічною;

· категорії повинні бути доцільними, тобто відображати цілі дослідження і зміст об’єкта аналізу.

Звісно, дослідники не раз намагалися стандартизувати категорії аналізу, однак це завдання ще не вирішено і незрозуміло, чи може воно бути вирішено взагалі. Справа в тому, що для вироблення стандартизованих категорій необхідно, щоб, по-перше, всі дослідники дотримувалися однієї моделі і концепції аналізу, а, по-друге, щоб тип і зміст усякого текстового документа рівною мірою підходив до тих категорій. Мабуть, будуть підібрані тільки деякі універсальні категорії, а інші дослідник обиратиме залежно від типу та завдань аналізу.

Універсальними можуть бути категорії, які відповідають на найбільш узагальнені питання контент-аналізу, такі, як напрямок комунікації, пропаговані цінності й засоби їх отримання і подібне.

Як приклад оригінального обрання категорій аналізу можна навести дослідження, яке провів директор Інституту соціальної психології Страсбурзького університету А. Моль на матеріалах французької щоденної газети «Монд» за 1 квітня 1960 р.

Він узяв за категорії дослідження такі параметри:

1) об’єктивну кількісно оцінювану значимість (довжина повідомлення),

2) рівень абстрактності чи незрозумілості,

3) рівень глибини розумової структури (тобто дистанція до індивіда). У результаті дослідження з’явилася така таблиця:

1 - ступінь структурованості публікації з візуалізаціями;

2 - ранг значимості інформації в медіа;

3 - авторська дистанція до індивіда в статті,

4 - рівень абстрактності чи важкості сприйняття термінів;

5 - рівень важливість публікації для соціуму;

6- ступінь наративності(нав’язування оцінок) в публікації;

7 - міра зайвої інформативності в публікації;

Контент-аналіз газети за сімома категоріями
Статті в газеті «МОНД»	2	3	4
Промова Кеннеді	1	4	2
«Санта Марія»	2	6	1
Панарабська конференція	4	5	2
Промова Спаака	3	6	1
Страйк учителів	3	3	2
Конгрес по космосу	4	7	2
Геологія Парижа	6	6	4
Шкідливі підприємства	6	5	4
Крадіжка в американському експресі	4	6	2
Зникнення дисертації викладача	5	7	1
Уламки «Білого птаха»	5	7	2
Алжирська економіка	5	4	3
Шимпанзе - космонавт	5	6	1
Погода	5	2	2
Конго і ООН	4	4	1
Конго	3	5	1
Лаос	7	6	1
Старожитності Тайваню	7	7	1
Замки і телебачення	7	4	2
Крадіжка транзистора у водія вантажівки	6	7	1

тому, що в багатьох випадках досліджувана сукупність документів є настільки великою, що не можна вивчати її усю. І тут постає проблема вибору з цієї сукупності представників, аналіз яких дав би уявлення про всю сукупність документів.

Перший етап усякої вибірки - це обрання джерела інформації. Учений, залежно від цілей дослідження, обирає ті джерела, які допоможуть виконати поставлені завдання. Вибірка може бути репрезентативною чи типологічною. Репрезентативна вибірка претендує на те, щоб представляти всю сукупність, що досліджується, типологічна вказує, що для сукупності характерні певні риси, але не відображає всіх характеристик тих документів, що вивчаються. Репрезентативна вибірка поділяється на квотну і випадкову. За допомогою квотної вибірки ми беремо від кожної досліджуваної сукупності частку документів відповідно до розміру тієї сукупності (наприклад, тиражу газет) та її ролі у досліджуваній проблемі. Як бачимо, цей тип вибірки вимагає певних даних, які дослідник не завжди має. Тому більшість учених застосовує так звану випадкову вибірку.

За цією вибіркою можливість потрапити у склад обраних документів однакова для всіх елементів сукупності, тому ця вибірка також вважається репрезентативною.

Але тут постає інше питання: скільки ж потрібно відібрати документів, щоб, з одного боку, їх опрацювання не перевищувало межі тих сил і часу, які виділені для дослідження, а з іншого - щоб ці документи достатньо повно представляли всю сукупність? Цікавий досвід випадкової вибірки накопичений Інститутом по вивченню суспільної думки Геллапа.

Як ми пам’ятаємо, ступінь надійності, якої потребує соціологічне дослідження, складає 95 %. Виходячи з цього, можна підбирати вибіркову сукупність. Як бачимо на таблиці, найоптимальнішою є сукупність із 1500 елементів. Загальна помилка за такої сукупності складає всього 2-3 %. Брати сукупність з 3000 елементів немає сенсу, бо це збільшує працю дослідника у два рази, а помилку зменшує тільки на 1 %.

Проводячи вибірку, треба ретельно стежити за тим, як ми бачимо, саме категорії, бо за будь-яких умов вони дають можливість зв’язати завдання дослідження з конкретним об’єктом і, таким чином, забезпечують успішний хід аналізу.

Тепер звернімося до іншої важливої складової частини контент-аналізу. Вибірка відіграє велику роль у процесі контентного аналізу.

Таблиця похибок при контент-аналізі
% думок	3000 примірників.	1500 примірників.	1000 примірників.	600 примірників.	400 примірників.	200 примірників.
10%	2	2	2	4	4	5
20%	2	2	3	4	5	7
30%	2	3	4	5	6	8
40%	2	3	4	5	6	9
50%	2	3	4	5	6	9
60%	2	3	4	5	6	9
70 %	2	3	4	5	6	8
80%	2	2	3	4	5	7
90%	1	2	2	4	4	5

Вчені цього Інституту склали таблицю, яка показує у відсотках розмір помилки при випадковій вибірці.

Справа у тім, щоб вона була справді випадкова. Якщо, наприклад, при дослідженні матеріалів районних газет взяти до уваги тільки ті номери, які виходять по середах, то це не дасть повного уявлення про всі номери газети, оскільки номери, які виходять у певні дні, мають свої особливості. Отже, у вибірку повинні потрапити і номери, які виходять в інші дні тижня.

Як приклад можна навести вибірку, яку здійснили М. Пайян і Д. Оуен. Із 27 газет з тиражем понад 300 тис. примірників за допомогою випадкової вибірки вони обрали 8. Потім з кожного номера цих газет за березень 1975 р. взяли по 6 статей, і таким чином, вибіркову сукупність склали 6638 матеріалів.

Ще один тип вибірки, який широко застосовується дослідниками, але не дає надійних гарантій точності, це - вибірка за допомогою експертного опитування.

Для забезпечення високої якості дослідження треба при проведені вибірки користуватися науковими методиками. Відбір документів тільки за власним бажанням дослідника зменшує достовірність і вносить зайвий елемент суб’єктивізму.

Які треба робити висновки? Отже, категорія контент аналізу - це поняття, яке показує один з аспектів загального напрямку конкретного дослідження текстових документів. У структурному плані категорія являє собою угрупування одиниць аналізу. Джерело категорій - це сам документ як сукупність окремих суджень, а також цілі і завдання дослідження. Категорії контент-аналізу мають бути місткими і разом з тим достатньо конкретними, щоб, з одного боку, не упускати щось таке, що характеризує даний документ як оригінальне джерело інформації, а з іншого - щоб не загубити за дрібницями загального напрямку дослідження. Категорії мають бути водночас вичерпними, виключними, об’єктивними, незалежними, надійними і доцільними.

Оскільки стандартизувати категорії складно через об’єктивні обставини, то можливо виробити лише деякі універсальні категорії, які відповідають на найбільш узагальнені питання контент- аналізу (напрямок комунікації, пропаговані цінності, засоби їх отримання і под.).

Правильний вибір категорій дає можливість зв’язати завдання дослідження з конкретним об’єктом, а отже, забезпечити успішний хід аналізу.

Обрання певних документів із їх сукупності, створення репрезентативної чи типологічної вибірки залежить від цілей дослідження. Частіше всього дослідники обирають випадкову вибірку, яка є репрезентативною. Щоб помилка дослідження не перевищувала припустиму межу, розроблено відповідні таблиці, які визначають потрібну кількість вибраних документів випадкової вибірки). Головне на цьому етапі дослідження забезпечити, щоб вибірка і справді була випадковою.

Вибірка за допомогою експертного опитування не дає гарантій точності. А відбір документів тільки за власним бажанням дослідника зменшує достовірність, оскільки містить елемент суб’єктивізму.

Інформаційний аналіз текстової інформації використовує різні методи:

· контент-аналіз,

· обґрунтована теорія смислу,

· етнографічні методи кодування змісту,

· дискурс-аналіз,

· символічна політика,

· методи соціолінгвістики,

· теорії комунікації,

· функціональна прагматика;

· теорія відмінностей,

· методи, засновані на політичній психології;

· етнометодології; феноменології;

· семіотики,

· лінгвістики тексту;

· теорії мовних актів і когнітивної лінгвістики;

· можливості герменевтики;

· об'єктивна герменевтика;

· методи психолінгвістики;

· психосемантики;

· суггестивной лінгвістик;

· фоносемантики.

Найпростіша взаємодія онлайн-користувача з сайтами, - для цього досить йому зайти на сайти і там знайти такі приклади використання текстової інформації у вигляді:

· Гіпертекстової публікації;

· Мультимедійної публікації;

· Інтерактивної публікації;

· Транскордонної публікації.

10 клас. Інформатика. Дистанційне навчання.

четвер, 26 березня 2020 р.

Інформаційний контент-аналіз текстової інформації

Немає коментарів:

Дописати коментар

четвер, 26 березня 2020 р.

Інформаційний контент-аналіз текстової інформації

Немає коментарів:

Дописати коментар

четвер, 26 березня 2020 р.