вівторок, 27 жовтня 2015 р.

Це просто (частина 2): Файл. Розмір файлу. Різниця між даними та інформацією.

Отже, в минулій частині ми з’ясували, що дані на логічному рівні дані зберігаються записом одиничок і нуликів.


Щось подібне до 1010101010100010111110011111001111110000111110 :)
Один із символів в послідовності двійкових даних називається бітом (англ. bit, переклад: шматочок).


Файл - це послідовність бітів, яка має якесь ім’я.
1 біта замало щоб закодувати хоч якісь дані. Тому необхідно кодувати дані по декілька біт.
Але ж по скільки? Давайте розмірковувати...
З допомогою 2 біт можна закодувати 4 (2^2) значення 
00 => 0
01 => 1
10 => 2
11 => 3 
З допомогою 3 біт можна закодувати вже 8 (2^3) значень 
000 => 0
001 => 1
010 => 2
011 => 3
100 => 4
101 => 5
110 => 6
111 => 7
З допомогою 4 біт можна закодувати вже 16 (2^4) різних значень.

Прийняли що дані будуть кодуватися по 8 біт. З допомогою 8 біт можна закодувати 256 різних значень (2^8).
8 біт назвали байтом.
Тому розмір файлу - це не що інше, як довжина послідовності одиничок і нуликів, записана в байтах.

Далі для зручності запису розміру великих файлів використовуються більші одиниці вимірювання.
1 кібібайт (КіБ) = 1024 байт
1 мебібайт (МіБ) = 1024 кібібайт
1 гібібайт (ГіБ) = 1024 мебібайт
і т.д.

В народі переважно продовжують замість приставки "кібі", що значить 1024 (2^10), вживати приставку "кіло", яка в системі СІ значить 1000 (10^3).

А для чого взагалі кодувати дані і вимірювати їх байтами?

Якщо ми візьмемо 256 чисел (кодуються з допомогою лише 1 байта) і співставимо кожному числу якийсь символ буквеного алфавіту, то перевівши ці числа в двійкову систему  - ми зможемо записувати текст на носії даних. Наприклад,
A => 0 => 00000000
а => 1 => 00000001
Б => 2 => 00000010
б =>3 => 00000011
і т.д
...
і т.д
Z => 255 => 11111111

А пізніше ми зможемо розкодувати дані в зворотньому напрямку.

Кодуватися та декодуватися дані мають по однаковим таблицям. Інакше - ми не розкодуємо текст, а отримаємо просто абракадабру. Якби в різних операційних системах  використовували різні (не стандартизовані) таблиці, то і обмінюватися файлами було б безглуздо. Адже розкодувати їх було б не можливо.


Але ж на носіях крім текстових файлів зберігаються також файли-зображення, аудіо-файли, відео-файли і т.д.?

Саме тому імена файлів складаються з двох частин, які розділені крапкою. Перша зліва від точки містить назву файлу, а друга частина - це розширення імені файлу. Друга частина призначена для того, щоб операційна система знала що це за тип файлу і як його потрібно декодувати. Хоча в деяких операційних системах певні програми можуть розпізнавати тип вмісту файлу і без розширення.


Тому що без декодування, ми не отримаємо інформації. Інформація - це взаємодія даних та адекватних до них методів. На цифрових носіях записані дані. Інформацією вони стануть тоді, коли ми їх декодуємо з допомогою відповідних таблиць. 
Функцію декодування замість нас бере на себе, як правило, операційна система.
Не завжди передача даних передбачає передачу інформації.


Це так, начебто у нас є "флешка", на якій міститься файл, захищений паролем і цей пароль нам не відомий. В такому разі ми маємо дані. Але інформації ми не отримаємо з цих даних, до тих пір доки не застосуємо адекватні методи по розшифровці документа (відкриємо документ в потрібній програмі та введемо пароль).
При налаштуванні комп’ютерів системні адміністратори переважно оперують даними, а не інформацією.

Немає коментарів:

Дописати коментар