Zpracování dat

0

Informace

Informace je rozdíl neurčitostí (informace je rozdílem stavů poznání).

Stav A (chci dosáhnout cíle, nevím jak) ð Získám data, která zpracuji. ð Rozhodnu se dle získaného poznání. ð Stav B (buď vítězství nebo katastrofický konec).

Zpracování dat

Úlohy zpracování dat

V praxi je často potřeba evidovat údaje o nějaké skutečnosti:

– o skupině lidí (zaměstnanci, studenti, členové sportovního oddílu…)

– o zvířatech či rostlinách (evidence ZOO, botanické zahrady…)

– o množině věcí (knihy v knihovně, inventář firmy, materiál na skladě…)

– o množině jevů (počasí, provedené lékařské výkony…)

Zpracováním dat je nazváno evidování a zpracování velkého množství údajů o velkém množství objektů.

Vést evidenci o objektech znamená:

– zaznamenat vhodně organizované údaje na nějaké médium, provádět změny podle reality

– zaznamenávat vztahy mezi údaji o objektech různých druhů

– udržovat o takových souborech objektů přehled

– údaje mít vhodně uspořádány, aby se v nich údaje:

– dobře vyhledávaly, v případě potřeby opravovaly a doplňovaly

– v některých případech počítaly údaje nové odvozené z původních

– vytvářely různé výsledné přehledné tabulky…

Objekty (lidé, zvířata, věci, jevy), jsou popisovány pomocí jejich vlastností (zaměstnanec firmy má jméno, adresu, funkce, plat; kniha v knihovně má autora, název, rok vydání…). Při evidencích je pak předem rozhodnuto, které vlastnosti je nutno sledovat.

Vybrané vlastnosti jsou nazývány „atributy“. I při ručním zpracování jsou atributy pojmenovány a je zvolena určitá forma evidence:

1. tabulka

V případě tabulky jsou sloupce popsány názvy vybraných evidovaných vlastností, celá tabulka je pojmenována typem evidovaných objektů. Mezi nevýhody tabulky patří zdlouhavé vyhledávání, nutnost přepisu řádků při změnách… – tabulka se stává nepřehlednou.

2. kartotéka

Kartotéka využívá systému kartotéčních listů, na každém je formulář obsahující názvy evidovaných údajů. Každý objekt je zapsán na jednu evidenční kartu, všechny listy jsou umístěny do krabice či šuplíku. Výhodou je možnost ukládat listy v určitém uspořádání (dle čísla, dle abecedy…) – toto uspořádání se musí dodržovat i při všech změnách, přidávání a rušení karet.

Základní pojmy

Údaje versus informace

– údaje: (Novák František, 3, Novák Jiří, 12 000, učitel) – není srozumitelné

– informace z těchto údajů vzniknou upřesněním struktury záznamů (jméno žáka, postupný ročník, jméno otce, plat, povolání)

Data = údaje získané měřením, pozorováním či zaznamenáním reálné skutečnosti.

Informace = smysluplná interpretace dat a vztahů mezi nimi.

Zpracování dat = zpracování velkého množství údajů o velkém množství objektů.

Objekt = člověk, zvíře, věc či jev reálného světa, pokud se tito stali předmětem našeho zájmu z hlediska evidence. Objekt je popisován množinou svých vlastností. Objekty mají velké množství vlastností, z hlediska evidence je nutné sledovat jen některé z nich.

Atribut = údaj o objektu, který je předmětem zájmu evidence.

Typ objektu = název množiny objektů a seznam jejich sledovaných atributů.

Informační systém = organizace údajů vhodná pro systémové zpracování dat (pro jejich sběr, uložení a uchování, zpracování, vyhledávání) pro účely rozhodování.

Agendové zpracování dat

Od historických dob prvních počítačů dodnes se úlohy evidence dat programovaly v dostupných programovacích jazycích, na dostupných počítačích. Většinou nešlo o jediný program, ale o sadu programů, řešících konkrétní úlohy (agendy). Počátečním etapám úloh tohoto typu se říká agendové zpracování dat.

Závislost dat a programů

Každý program řeší nejen vlastní aplikační problém, ale i formát fyzického uložení dat na médiu. Navazující úlohy musí respektovat již vytvořené – deklarované fyzické struktury dat. Při změně datové struktury v jednom programu je nutné měnit a kompilovat i všechny další programy, které s touto strukturou pracují, i když se v jejich funkčnosti nic nemění. Odtud nízká efektivnost datových struktur i programů.

Problémy agendového zpracování

Redundance: některé informace ve více souborech se opakují, jsou redundantní. Redundance jsou zdrojem mnoha dalších problémů.

Konzistence: vzájemná shoda údajů. Postupem času (vlivem nedostatečné kontroly v programech) se stejné hodnoty na různých místech v datových souborech začnou rozcházet.

Integrita: data aktuální, odrážející skutečnost z reálného světa.
Problémem tedy je zabezpečit, aby chybou či nedůsledností uživatele nebyla porušena integrita a konzistence dat.

Obtížná dosažitelnost dat: aplikační programy pro konkrétní požadavky; pro nový požadavek nutno napsat nový aplikační program – bez programátora nelze.

Izolovanost dat: data roztroušena v různých souborech, soubory mohou být různě organizovány, data různě formátována. To komplikuje tvorbu nových aplikačních programů a možnost realizovat vazby mezi datovými strukturami.

Současný přístup více uživatelů: větší systémy vyžadují současný přístup k datům více uživatelů. Pak je nutné, aby programy vzájemně spolupracovaly, jejich činnosti byly koordinovány.

Ochrana proti zneužití: při zpracování důvěrných či tajných dat není přípustné, aby měl kdokoliv přístup ke všem informacím. Při klasickém zpracování však musí programátor aplikačních programů k dispozici tolik podrobnosti, že to ochranu dat prakticky znemožňuje.

Poučení z agendového zpracování

Poučení z agendového zpracování vedlo k návrhu a vytvoření programových systému (systémů řízení báze dat – SŘBD) následujících vlastností:

– existuje seznam datových typů, které jsou v programovém systému definovány; pro tyto typy dat programový systém vytváří fyzickou strukturu na disku a automaticky řeší všechny přístupy k datům

– existují prostředky pro definování všech sledovaných vlastností popisovaných objektů

– existuje soubor instrukcí, které nad definovanými daty provádějí operace; každá instrukce je vlastně mohutnou procedurou, v níž je řešen fyzický přístup k datům i realizace vlastní operace; jinak než prostřednictvím systému nelze s daty pracovat

– programový systém řeší způsob, jak zaznamenat vztahy mezi objekty

Základní pojmy databázového zpracování

Atribut – například zaměstnanec (jméno (křestní, příjmení, titul), adresa (ulice, obec, PSČ), vzdělání: multi,…), jméno a adresa jsou v tomto typu objektu skupinové položky, vzdělání je opakující se položka (neznámý počet opakování).

Při výběru typu položky je rozhodnuto pro ten datový typ, který nejlépe a přitom nejúsporněji z hlediska uložení i zpracování dat zaznamená daný údaj. Položky zaznamenávají jednotlivé údaje o objektu.

Entita – objekt – celá posloupnost položek popisuje objekt. Taková struktura položek, která má ucelený význam (zachycuje všechny potřebné údaje o sledovaném objektu) se nazývá záznamem (větou, recordem). Je to obvykle skupinová položka.

Množina entit – množina objektů – datový soubor – obsah tabulky
Množina záznamů stejného typu, zaznamenávající ucelenou informaci o množině sledovaných objektů a uložená na paměťovém médiu, se nazývá datovým souborem. Množiny záznamů si lze představit ve tvaru tabulky, kde každý objekt je popsán jedním řádkem a každý atribut objektu je v jednom sloupci.

Databáze – množina datových souborů, uchovávajících data o nějakém uceleném úseku reality

Informační systém
Aplikační úlohy nad společnou databází tvoří ucelený systém nazývaný databázovým či informačním systémem (IS) nad použitým systémem řízení báze dat (SŘBD).
V tomto pojetí tedy informační systém je celek řešící rozsáhlejší oblast aplikační, naprogramovaný v jednom SŘBD s vhodně navrženými datovými strukturami tak, aby všechny aplikační úlohy k nim měly optimální přístup. Řeší uložení, uchování, zpracování a vyhledávání informací a umožňuje jejich formátování do uživatelsky přívětivého tvaru.

Systém řízení báze dat (SŘBD)
Systém řízení báze dat je programový systém (prázdný, bez datových souborů a bez aplikačních programů), umožňující definování datových struktur a datových souborů, řešící fyzické uložení dat ve vnější paměti počítače umožňující manipulaci s daty a formátování vstupních i výstupních informací.

Aplikační úloha
Aplikační úloha nad SŘBD je konkrétní program napsaný pomocí programových prostředků použitého SŘBD nad konkrétní databází, pro tuto úlohu vytvořenou.

Comments are closed.