НОУ ІНТУЇТ | лекція | дані
- вимірювання Вимірювання - процес присвоєння чисел характеристикам досліджуваних об'єктів згідно з...
вимірювання
Вимірювання - процес присвоєння чисел характеристикам досліджуваних об'єктів згідно з визначеним правилом.
У процесі підготовки даних вимірюється не сам об'єкт, а його характеристики.
Шкала - правило, згідно з яким об'єктам присвоюються числа.
Багато інструменти Data Mining при імпорті даних з інших джерел пропонують вибрати тип шкали для кожної змінної і / або вибрати тип даних для вхідних і вихідних змінних (символьні, числові, дискретні і безперервні). Користувачеві такого інструменту необхідно володіти цими поняттями.
Змінні можуть бути числовими даними або символьними.
Числові дані, в свою чергу, можуть бути дискретними і безперервними.
Дискретні дані є значеннями ознаки, загальне число яких звичайно або нескінченно, але може бути підраховано за допомогою натуральних чисел від одного до нескінченності.
Приклад дискретних даних. Тривалість маршруту тролейбуса (кількість варіантів тривалості звичайно): 10, 15, 25 хв.
Безперервні дані - дані, значення яких можуть брати яке завгодно значення в деякому інтервалі. Вимірювання безперервних даних передбачає велику точність.
Приклад безперервних даних: температура, висота, вага, довжина і т.д.
шкали
Існує п'ять типів шкал вимірювань: номінальна, порядкова, інтервальна, відносна і дихотомическая.
Номінальна шкала (nominal scale) - шкала, яка містить тільки категорії; дані в ній не можуть упорядочиваться, з ними не можуть бути зроблені ніякі арифметичні дії.
Номінальна шкала складається з назв, категорій, імен для класифікації та сортування об'єктів або спостережень за певною ознакою.
Приклад такої шкали: професії, місто проживання, сімейний стан.
Для цієї шкали можна застосовувати лише такі операції: одно (=), не дорівнює ( ).
Порядкова шкала (ordinal scale) - шкала, в якій числа привласнюють об'єктів для позначення відносної позиції об'єктів, але не величини відмінностей між ними.
Шкала вимірювань дає можливість ранжувати значення змінних. Вимірювання ж в порядкової шкалою містять інформацію тільки про порядок проходження величин, але не дозволяють сказати "наскільки одна величина більша за іншу", або "наскільки вона менше інший".
Приклад такої шкали: місце (1, 2, 3-е), яке команда отримала на змаганнях, номер студента в рейтингу успішності (1-й, 23-й, і т.д.), при цьому невідомо, наскільки один студент успішніше іншого, відомий лише його номер в рейтингу.
Для цієї шкали можна застосовувати лише такі операції: одно (=), не дорівнює ( ), Більше (>), менше (<).
Інтервальна шкала (interval scale) - шкала, різниці між значеннями якої можуть бути обчислені, проте їхні стосунки не мають сенсу.
Ця шкала дозволяє знаходити різницю між двома величинами, має властивості номінальної і порядкової шкал, а також дозволяє визначити кількісне зміна ознаки.
Приклад такої шкали: температура води в морі вранці - 19 градусів, ввечері - 24, тобто вечірня на 5 градусів вище, але не можна сказати, що вона в 1,26 разів вище.
Номінальна і порядкова шкали є дискретними, а інтервальна шкала - безперервної, вона дозволяє здійснювати точні вимірювання ознаки і виробляти арифметичні операції додавання, віднімання, множення, ділення.
Для цієї шкали можна застосовувати лише такі операції: одно (=), не дорівнює ( ), Більше (>), менше (<), операції додавання (+) і віднімання (-).
Відносна шкала (ratio scale) - шкала, в якій є певна точка відліку і можливі відносини між значеннями шкали.
Приклад такої шкали: вага новонародженої дитини (4 кг і 3 кг). Перший в 1,33 рази важче.
Ціна на картоплю в супермаркеті вище в 1,2 рази, ніж ціна на базарі.
Відносні і інтервальні шкали є числовими.
Для цієї шкали можна застосовувати лише такі операції: одно (=), не дорівнює ( ), Більше (>), менше (<), операції додавання (+) і віднімання (-), множення (*) і ділення (/).
Дихотомическая шкала (dichotomous scale) - шкала, яка містить тільки дві категорії.
Приклад такої шкали: стать (чоловічий і жіночий).
Приклад використання різних шкал для вимірювання властивостей різних об'єктів, наведено в таблиці даних, зображеної в таблиці 2.2 .
Таблиця 2.2. Безліч вимірювань властивостей різних об'єктів Номер об'єкта Професія (номінальна шкала) Середній бал (інтервальна шкала) Освіта (порядкова шкала) 1 слюсар 22 середнє 2 вчений 55 вища 3 учитель 47 вища
Приклад використання різних шкал для вимірювання властивостей однієї системи, в даному випадку температурних умов, наведено в таблиці даних, зображеної в таблиці 2.3 .
Висновки. У цій частині лекції ми розглянули поняття даних, об'єкта і атрибуту, їх характеристики.
Також ми обговорили типи шкал. Номінальна шкала описує об'єкти або спостереження в термінах якісних ознак. На один крок далі йдуть порядкові шкали, що дозволяють упорядкувати спостереження або об'єкти за певною характеристиці. Інтервальні та відносні шкали більш складні, в них можливе визначення кількісного значення ознаки.