Skip to content

Аналіз предметної області

Вступ

У цьому розділі подано:

  • Опис підходів і моделей вирішення задач;
  • Аналіз наявних рішень (аналогів);
  • Перелік використаних джерел.
  • Порівняльну характеристику відповідно до моделі FURPS;
  • Висновки щодо доцільності створення інформаційної системи;
  • Ключові терміни та скорочення, використані в роботі;

Основні поняття

  • API (Application Programming Interface) — інтерфейс, що забезпечує взаємодію між різними програмами за чітко визначеними правилами.
  • Модель даних — опис структури об’єкта та його параметрів для подальшого збору інформації.
  • Відкриті дані — інформація, яка доступна для вільного використання будь-ким.
  • База даних (БД) — організована система для зберігання, зміни та обробки взаємозалежних даних.

Типи моделей баз даних

  • Ієрархічна — дані зберігаються у вигляді дерева.
  • Реляційна — дані представлені у вигляді пов’язаних таблиць.
  • Об’єктно-орієнтована — базується на понятті об'єктів із властивостями та методами.
  • SQL — мова запитів до реляційних баз даних.

Методи отримання відкритих даних

МетодПеревагиНедоліки
Веб-краулінгАвтоматизований збір великого обсягу данихПотребує технічних навичок, є правові обмеження
Веб-скрейпінгПростота реалізаціїРучний процес, низька масштабованість
КраудфандингМожливість залучення зацікавлених користувачівПотрібна координація, нестабільний результат
APIШвидкість, зручність, автоматизаціяОбмеження запитів, потреба в технічних знаннях

Типи даних та методи їх зберігання

Структуровані дані (таблиці, бази даних)

1. Локальне зберігання
Збереження даних на фізичних носіях (жорсткі диски, флешки).

  • Переваги: повний контроль над даними; не залежить від інтернету.
  • Недоліки: ризик втрати інформації; необхідність резервного копіювання.

2. Хмарні сховища (AWS S3, MongoDB Atlas, Firebase)
Зберігання даних в онлайн-середовищах.

  • Переваги: висока доступність, масштабованість, надійність.
  • Недоліки: залежність від сторонніх сервісів; платна основа.

Неструктуровані дані (текст, зображення, аудіо, відео)

1. Локальне зберігання

  • Переваги: швидкий доступ; повна автономія.
  • Недоліки: обмежений простір зберігання.

2. Хмарні сервіси (Google Cloud Storage, Dropbox, AWS S3)

  • Переваги: легке масштабування; доступ з будь-якого пристрою.
  • Недоліки: вартість зберігання та передавання даних.

Інструменти для аналізу даних

1. Табличні редактори (Excel, Google Tables)

  • Плюси: простота у використанні, швидка візуалізація.
  • Мінуси: обмежена ефективність при обробці великих обсягів даних.

2. Мови програмування (Python, R)

  • Плюси: велика кількість інструментів; гнучкість.
  • Мінуси: необхідні навички програмування.

3. Аналітичні платформи (Tableau, Power BI, Qlik)

  • Плюси: зручність, інтерактивні графіки.
  • Мінуси: обмеження по функціональності, вартість.

4. Хмарна аналітика (Google BigQuery)

  • Плюси: висока швидкість аналізу великих обсягів даних.
  • Мінуси: складне налаштування; оплата за використання.

5. Машинне навчання (TensorFlow, PyTorch)

  • Плюси: глибокий аналіз; автоматизовані рішення.
  • Мінуси: високі вимоги до знань та обчислювальних ресурсів.

Візуалізація даних

Використовується для покращення розуміння складних інформаційних масивів.

Типи візуалізації:

  • Лінійні графіки — відображення змін у часі.
  • Стовпчасті діаграми — зіставлення кількісних показників.
  • Кругові діаграми — візуалізація часток від загального.
  • Теплові карти — акцент на інтенсивність явищ.
  • Scatter plot — показ взаємозв’язків між змінними.
  • Географічні карти — відображення даних за регіонами.
  • Інфографіка — поєднання тексту, графіки та даних.

Інструменти:

Google Charts, Microsoft Excel, Power BI, Tableau, Figma, Polymaps.


Контроль та управління доступом

Система доступу — це набір методів для запобігання несанкціонованому використанню ресурсів.

Моделі контролю доступу:

  • Дискреційна модель — доступ визначає власник ресурсу.
  • Обов’язкова модель — доступ регулюється за рівнями секретності.
  • Рольова модель — права доступу базуються на ролі користувача.
  • Правилоорієнтована модель — доступ залежить від встановлених умов.

Рольова модель доступу

Розмежування прав базується на виконуваних функціях користувача. Ролі можуть бути призначені групам або окремим працівникам.

  • Переваги: простота адміністрування; ефективна масштабованість.
  • Можливість: один користувач може мати кілька ролей; доступ легко змінюється.

Управління на основі правил

Доступ до ресурсів може регулюватися:

  • часом доби,
  • місцем доступу,
  • пристроєм,
  • кількістю спроб входу,
  • або комбінацією цих параметрів.

Цей підхід ідеально підходить для організацій із великою кількістю об’єктів і складним графіком роботи.


Управління доступом

Моделі:

  • Дискреційна — на основі прав власника
  • Мандатна — за ієрархією
  • Рольова — за роллю користувача
  • На основі правил — з урахуванням часу, пристрою, місця

Аналіз існуючих рішень

Gapminder Foundation

Gapminder — незалежна некомерційна організація, яка популяризує розуміння глобальних статистичних фактів і сприяє сталому розвитку. Основна мета — представити дані про проблеми, економічну та екологічну ситуацію у світі. Для візуалізації використовує інструмент Trendalyzer.

DataBank

Це аналітичний сервіс для роботи з часовими рядами даних. Користувачі можуть формувати запити, створювати таблиці, діаграми, карти, а також зберігати або поширювати результати.

Google Public Data Explorer

Сервіс для візуалізації відкритих даних і прогнозів від міжнародних організацій. Підтримує створення графіків, гістограм та інших візуальних форматів. Доступний для публічного перегляду, обміну та завантаження.

Eurostat

Центральне статистичне відомство Європейського Союзу. Публікує дані та індикатори, що дозволяють порівнювати соціально-економічну ситуацію в різних країнах та регіонах ЄС.

Dataverse

Веб-платформа з відкритим кодом для зберігання, публікації та обміну науковими даними. Кожен "простір даних" (Dataverse) містить набори даних із супровідною документацією, метаданими та файлами для досліджень.


Таблиця порівняння систем

🟩 - Критерій повністю виконаний 🟨 - Критерій виконаний частково ❌ - Критерій не виконаний

КритерійНаш проєктGapminderDataBankG.P.D.EEurostatDataverse
Візуалізація
Додавання/редагування
Авторизація
Пошук/фільтри🟨🟨
Підтримка мов🟨
Інтерфейс🟨🟨
Документація🟨🟨
Актуальність🟨🟨🟨
Резервне копіювання
Ліцензія
Надійність/відновлення
Ефективність обробки запитів🟨🟨
Техпідтримка
FAQ
Зворотний зв’язок

Висновки

На основі аналізу існуючих рішень, команда дійшла висновку, що створення власної веб-системи є найбільш доцільним, оскільки:

  • Підтримує додавання та редагування даних — через авторизацію.
  • Доступна для всіх — без обмежень і платних підписок.
  • Має актуальні дані, зручний інтерфейс і швидку обробку запитів.

Джерела