'정보처리기사' 카테고리의 글 목록 (6 Page)

정보처리기사

07. SQL(Structure Query Language) 2017.08.01
06. 관계데이터언어(관계대수) 2017.08.01
05. 관계데이터모델 2017.08.01
04. 정렬, 탐색기법 2017.08.01
03. 자료구조(선형, 비선형) 2017.08.01
02. DBMS의 기능 2017.08.01
01. 정보처리시스템과 데이터베이스의 개념 2017.07.31

07. SQL(Structure Query Language)

2017. 8. 1. 15:39

제1항 SQL 언어(DDL, DML, DCL, Embedded SQL)

(１) 개요

1) SQL은 현재 DBMS 시장에서 관계 DBMS가 압도적인 우위를 차지하는데 중요한 요인 중 하나이다.

2) SQL은 IBM 연구소에서 1974년에 System R이라는 관계 DBMS 시제품을 연구할 때 관계 대수와 관계 해석을 기반으로 집단함수, 그룹화, 갱신 연산등을 추가하여 개발된 언어이다.

3) 1986년에 ANSI(미국 표준 기구)에서 SQL 표준을 채택함으로써 SQL이 널리 사용되는데 기여

4) 다양한 상용 관계 DBMS마다 지원하는 SQL 기능에 다소 차이가 있음.

(２) 정의 (Structure Query Language)

1) 데이터베이스에서 정보를 얻거나 갱신하기 위한 표준화된 언어로서 대화형으로 이용하거나, 또는 프로그램내에 삽입하여 쓸수 있다.

(３) 분류

그림 58. SQL 분류

1) 데이터 정의어(DDL, Data Definition Language)

① 정의

ü 데이터베이스의 구조나 스키마를 가진 오브젝트를 다루는(생성(create), 삭제(drop), 변경(alter) 등) 데이터베이스 언어이다.

ü 키 제약조건, 개체(Entity) 무결성 제약조건, 참조 무결성 제약조건 등을 포함하는 관계 데이터베이스 스키마를 생성한다.

ü 데이터베이스 관리 시스템(DBMS) 에서 사용자의 편의와 구현상의 편의를 위해 명령어를 제공함

2) 데이터 조작어(DML, Data Manipulation Language)

① 정의

ü 사용자나 응용 프로그램과 데이터베이스 관리 시스템(DBMS) 간의 인터페이스를 제공

ü 데이터베이스 사용자에게 적절한 명령어를 사용하여 데이터를 수정하거나 데이터를 질의

3) 데이터 제어어(DCL, Data Control Language)

① 정의

ü 데이터의 보안, 무결성, 데이터 회복, 병행 수행 제어에 관련하여 데이터를 관리하기 위한 데이터 제어를 정의한다.

ü 데이터 관리자가 데이터를 관리할 목적으로 사용한다.

(４) 데이터 정의어(DDL, data definition language)

1) 제약조건

릴레이션 정의에서 다양한 제약 조건을 명시

① 무결성 제약조건

ü 속성(attribute) 제약조건

• Not null

- 널 값을 허용하지 않을 때

• Unique

- 동일한 속성값을 갖는 튜플이 두개 이상 존재하지 않도록 보장

• default

- default 값을 지정

• check

- 속성이 가질수 있는 값들의 범위 지정

ü 기본키(primary key) 제약조건

• 각 릴레이션마다 최소 한 개의 기본키 지정

ü 참조무결성 제약조건

• 외래키의 무결성 보장

• On delete no action

- 다른 테이블의 기존행에 있는 외래키에서 참조하는 키가 포함된 행을 삭제하려고 하면 오류가 발생하고 delete 문이 롤백되도록 지정

• On delete cascade

- 다른 테이블의 기존행에 있는 외래키에서 참조하는 키가 포함된 행을 삭제하려고 하면 해당 외래키가 포함되어 있는 모든 행도 삭제되도록 지정합니다.

• On delete set null

- 내용이 삭제된 외래키의 값을 null로 만든다.

• On delete set default

- 내용이 삭제된 외래키의 값을 default로 설정한다.

• On update no action

- 다른 테이블의 기존행에 있는 외래키에서 참조하는 키가 포함된 행에서 키 값이 업데이트하려고 하면 오류가 발생하고 update 문이 롤백되도록 지정합니다.

• On update cascade

- 다른 테이블의 기존행에 있는 외래키에서 참조하는 키값이 포함된 행에서 키값을 업데이트하려고 하면 해당 외래키를 구성하는 모든값도 키에 지정된 새 값으로 수정되도록 지정합니다.

• On update set null

- 내용이 수정된 외래키의 값을 null로 만든다.

• On update set default

- 내용이 수정된 외래키의 값을 default로 만든다.

2) CREATE

SQL에서는 동일한 데이터베이스 응용에 속하는 릴레이션, 도메인, 제약조건, 뷰, 권한등을 구룹화하기 위해서 스키마 개념을 지원한다.

① CREATE SCHEMA

ü 스키마를 정의한다. 스키마에 대한 정보는 연결한 데이터베이스의 시스템 카탈로그 테이블에 저장된다.

ü 스키마의 식별을 위한 스키마와 해당 스키마의 소유권자/허가권자를 정의함

ü 기본구조

• CREATE SCHEMA schema-name [ AUTHORIZATION schema-owner-name ]

• 여기서 schema-name은 스키마 이름입니다. 이 이름은 카탈로그에 이미 기록된 스키마 내에서 고유해야 합니다. 선택적 authorization절이 지정되어 있으면 schema-owner-name이 스키마의 소유자가 됩니다.

② CREATE DOMAIN

ü 도메인을 정의

ü 정의된 도메인명은 일반적인 데이터 타입처럼 사용

ü 기본구조

• Create domain 도메인이름 data-type default ‘기본값지정’

• Data-type의 종류

- 정수, 실수, 날짜, 시간

- 형식화 된 숫자

- 고정길이 문자, 가변길이 문자

- 고정길이 비트열, 가변길이 비트열

• 예제

- Create domain sung char(1) default ‘여’ constraint valid sung check (value in (‘남’, ‘여’));

③ CREATE TABLE

ü 테이블을 정의

ü 기본 구조

create table 테이블 명칭 {

(속성명 data-type),

Primary key (기본키 속성명),

Unique (대체키 속성명),

Foreign key (외래키 속성명),

References 참조테이블(기본키 속성명),

Check (조건식);

};

ü 예제

Create table 학생 {

학번 char(20),

이름 char(20) not null,

생년월일 date,

Primary key(학번),

Unique(생년월일),

Foreign key(과목코드) references 과목(과목코드)

On delete set null on update cascade,

Check 생년월일>=’1995-03-02’

};

④ CREATE VIEW

ü 사용자에게 접근이 허용된 자료만 보여주기 위해 하나 이상이 테이블에서 유도된 가상 테이블

ü 물리적으로 존재하지 않고 논리적으로만 존재

ü 기본 구조

Create view 뷰이름(속성명, …)

As select 속성명, …

From 테이블명

Where 조건;

[with check option]

ü 예제

Create view 컴퓨터(이름, 과목) as

Select 이름, 과목

From 학생

Where 과목=’DB’;

⑤ CREATE INDEX

ü 검색 성능 향상 위해 사용

ü 기본 구조

• Create [unique] index 인덱스이름 on 기본테이블이름(속성이름 정렬방식)

ü 예제

• Create unique index 인덱스이름 on 고객(속성이름 정렬방식);

• 정렬방식: asc(오름차순), desc(내림차순)

3) ALTER TABLE

① 테이블, 인덱스, 스키마 등에 대한 구조를 변경

② 기본 구조

ü Alter table 테이블이름 add 속성이름 data-type [default 값];

ü Alter table 테이블이름 alter 속성이름 data-type [set default 값];

ü Alter table 테이블이름 drop 속성이름 data-type [cascade];

③ 예제

ü Alter table 학생 add 주민번호 char(18);

ü Alter table 학생 drop 전화번호;

4) DROP

① 스키마, 도메인, 테이블, 뷰, 인덱스를 제거하는 명령문

② 기본 구조

Drop schema 테이블 이름 [cascade | restrict]

Domain

Table

View

Index

Cascade : 릴레이션을 참조하는 뷰, 인덱스, 제약조건, 외래키 모두 삭제

Restrict : 다른 릴레이션에서 참조되지 않는 릴레이션만 제거

③ 예제

ü Drop schema 학교 cascade;

ü Drop table 학생 restrict;

※ 데이터 제어어(dcl)은 데이터의 보안, 무결성, 데이터 회복, 병행 수행 제어 등을 정의하는데 사용하는 언어이다.

(５) 데이터 조작어(DML, data manipulation language)

1) SELECT

① 테이블을 구성하는 튜플들 중에서 조건에 만족하는 튜플을 검색하여 임시 테이블을 만드는 명령

② 기본 구조

Select [all | distinct] 검색대상

From 테이블명

[where 조건식]

[group by 열명칭]

[having 검색조건]

[order by 열명칭 [asc | desc];

• Distinct : 중복된 데이터 한번만 출력

• Asc : 오름차순

• Desc : 내림차순

③ 설명

ü Select

• 질의 결과를 포함하려는 속성들을 열거

• Distinct 절을 사용해서 중복 제거

ü from

• 질의에서 필요로 하는 릴레이션들을 열거

ü where

• 관계대수의 셀렉션 연산의 조건에 해당

ü Group by

• 동일한 값을 갖는 튜플들을 한 그룹으로 묶는다

ü having

• 튜플들의 그룹이 만족해야 하는 조건

④ 별칭(alias)

ü 서로 다른 릴레이션에 동일한 이름을 가진 속성이 속해 있을 때 속성의 이름을 구분하는 방법

ü Select e.dno, d.dno from employee as e, department as d

⑤ 예제

ü 테이블의 전체 속성(*) 보기

• Select * from 테이블명

• 테이블의 존재하는 모든 튜플과 모든 속성을 보여준다.

ü 테이블에서 중복을 없앤 속성(attribute) 보기

• Select distinct 속성명 from 테이블명

• 테이블에서 지정한 속성만을 보여주는데, 중복된 속성은 하나만 보여준다.

ü 테이블에서 조건에 만족하는 튜플만 보기

• Select * from 테이블명 where 속성명 <> ’값’

• 테이블에서 지정된 속성의 값이 일치하는 튜플만을 보여준다.

• 부정연산자 : <>

ü 테이블에서 여러 개의 조건을 만족하는 튜플만 보기

• Select * from 테이블명 where 속성명=’값’and 속성명=’값’

• 테이블에서 지정된 속성들의 값과 일치하는 튜플만을 보여준다.

• 연산자들의 우선순위

ü 테이블에서 % 조건에 만족하는 튜플만 보기

• Select * from 테이블명 where 속성명 like ‘류%’

• 테이블에서 지정된 속성의 값이 ‘류’로 시작하는 모든 튜플을 보여준다.

• ‘%’는 모든 문자를 말하며, ‘_’는 한 문자를 의미함

ü 테이블에서 범위 조건에 만족하는 튜플만 보기

• Select * from 테이블명 where 속성명 between 0 and 100

• Select * from 테이블명 where 속성명 >= 0 and 속성명 <= 100

• 속성명의 값이 0보다 크거나 같고 100보다 작거나 같은 튜플만 보여준다.

ü 테이블에서 지정된 속성의 값이 null인 모든 튜플 보기

• Select * from 테이블명 where 속성명 is null

• Select * from 테이블명 where 속성명 is not null

⑦ Group by 속성 [having 조건]

ü 조건에 맞게 속성들을 그룹별로 처리한다.

ü Group by는 특정 속성을 기준으로 그룹화하여 검색할 때 그룹화 할 속성을 지정한다.

ü Having은 group by와 함께 사용되며, 그룹에 대한 조건을 지정한다.

ü 예제

• Select 속성명, count(*) as 표시명 from 테이블명 where 속성명 >= 90 group by 과목 having count(*)>=2

⑧ Order by 속성 [asc | desc]

ü 지정된 속성으로 정렬을 한다.

ü Asc: 오름차순(a-z, ㄱ-ㅎ), desc: 내림차순(z-a, ㅎ-ㄱ)

ü 예제

• Select * from 속성명 where 속성명=’값’ order by 속성명 desc

• 속성명이 ‘값’이 튜플을 보여주는데, order by에 지정된 속성명으로 내림차순 정렬을 해서 보여준다.

⑨ in

ü 조건절에 명시된 속성값이 in 다음에 나열되는 값들과 일치되는 튜플들만 표시한다.

ü Select * from 테이블명 where 속성명 in (select 속성명 from 테이블명)

⑩ Null 값

ü 널값을 포함한 다른 값과 널값을 +, - 등을 사용하여 연산하면 결과는 널이 됨

ü Count(*)를 제외한 집단 함수들은 널값을 무시함

ü 어떤 속성에 들어 있는 값이 널인지 비교하기 위해서 ‘속성=null’ 처럼 사용하면 안됨

ü 다음과 같은 비교 결과는 모두 거짓

• Null > 300

• Null = 300

• Null <> 300

• Null = null

• Null <> null

ü 바른 표현

• Select * from 테이블명 where 속성 is null;

⑪ 집단함수

ü 정의

• 각 집단함수는 한 릴레이션의 한 개의 속성에 적용되어 단일값을 변환함

• Select절과 having절에만 나타날 수 있음

• count(*)를 제외하고는 모든 집단함수들이 널값을 제거한 후 남아 있는 값들에 대해서 집단 함수의 값을 구함

• count(*)는 결과 릴레이션의 모든 행들의 총 개수를 구함

• count(속성명)는 해당 속성에서 널값이 아닌 값들의 개수를 구함

• distinct가 집단 함수 앞에 사용되면 집단 함수가 적용되기 전에 먼저 중복을 제거함

ü 종류

• Count(속성): 튜플이나 값들의 개수

• Avg(속성): 값들의 평균값

• Sum(속성): 값들의 합

• Max(속성): 값들의 최대값

• Min(속성): 값들의 최소값

⑫ Exists(q), not exists(q)

ü Exists: 질의 q의 결과에 최소한 한 개의 튜플이 있으면 참, 그렇지 않으면 거짓을 반환한다.

ü Not exists: 질의 q의 결과에 튜플이 없다면 참, 그렇지 않으면 거짓을 반환한다.

⑬ 비교연산자

ü = : 같다

ü <> : 같지 않다

ü > :크다

ü < :작다

ü >= : 크거나 같다

ü <= : 작거나 같다

ü In : 포함되어 있다

⑭ select에서의 집합 연산

ü 정의

• 집합연산을 적용하려면 두 릴레이션이 합집합 호환성을 가져야 함

• 입력 릴레이션 결과 릴레이션에서 중복 튜플 배제

- Union(합집합)

- Except(차집합)

- Intersect(교집합)

• 입력 릴레이션 결과 릴레이션에서 중복 튜플 허용

- Union all(합집합)

- Except all(차집합)

- Intersect all(교집합)

⑮ select에서의 조인(join)

ü 정의

• 조인은두개의 릴레이션으로부터 연관된 튜플들을 결합

• 조인의 일반적인 형식은 아래의 select문과 같이 from절에 두개 이상의 릴레이션들이 열거되고, 두 릴레이션에 속하는 애트리뷰트들을 비교하는 조인 조건이 where절에 포함됨

• 조인 조건은 두 릴레이션 사이에 속하는 속성값들을 비교 연산자로 연결한 것

• 가장 흔히 사용되는 비교 연산자 ‘=’

• 조인 조건을 생략했을 때와 조인 조건을 틀리게 표현했을 때는 카티션 곱이 생성됨

• 조인 질의가 수행되는 과정을 개념적으로 살펴보면 먼저 조인 조건을 만족하는 튜플들을 찾고, 이 튜플들로부터 SELECT절에 명시된 속성들만 프로젝트하고, 필요하다면 중복을 배제하는 순서로 진행됨

• 조인 조건이 명확해지도록 속성 이픔 앞에 릴레이션 이름이나 튜플변수를 사용하는 것이 바람직

• 두 리레이션의 조인 속성명이 동일하다면 반드시 속성명앞에 릴레이션 이름이나 튜플변수를 사용해야 함

2) INSERT

① 데이터베이스에 저장된 튜플을 삽입하기 위한 언어

② 기본 구조

Insert into 테이블명

Values (데이터 값, 데이터 값2, …);

③ 예제

ü 테이블에 튜플을 추가해라

• Insert into 테이블명 values (‘값1’, ‘값2’, ‘값3’)

• 지정된 테이블에 튜플을 추가한다.

ü 테이블에 지정된 속성들의 값을 추가해라

• Insert into customers (customerName, ContactName, Address, City, PostalCode, Country) values (‘Cardinal’, “Tom’, ‘Skagen’, ‘Stavanger’, ‘4006’, ‘Norway’);

ü 테이블에 지정된 속성들의 값을 추가해라

• Insert into Customers (CustomerName, City, Country) values (‘Cardinal’, ‘Stavanger’, ‘Norway’)

ü 테이블에 지정된 속성들의 값을 추가해라

• Insert into Customers (CustomerName, City, Country) values (‘Cardinal’, ‘Stavanger’, ‘Norway’)

Customers 테이블

Suppliers 테이블

ü 여러 개의 튜플들을 추가해라

• Insert into Customers (CustomerName, Country) select SupplierName, Country from Suppliers;

• Insert into Customers (CustomerName, Country) select SupplierName, Country from Suppliers where country=’USA’;

3) UPDATE

① 테이블에 있는 튜플들 중에서 지정된 튜플의 내용을 수정할 때 사용하는 언어

② 기본 구조

Update 테이블명

Set 열명칭 = 변경값

[where 조건식];

③ 예제

ü 지정된 튜플의 값을 변경하라.

• Update Customers set ContactName=’Alfred Schmidt’, City=’Hamburg’ where CustomerName=’Alfreds Futterkiste’;

4) DELETE

① 테이블에 있는 튜플들 중에서 지정된 튜플을 삭제할 때 사용하는 언어

② 기본 구조

Delete from 테이블명

[where 조건식];

③ 예제

ü 지정된 튜플을 삭제하라

• Delete from Customers where CustomerName=’Alfreds Futterkiste’;

ü 테이블의 모든 튜플을 삭제하라

• Delete from Customers

• Delete * from Customers

• 테이블에 있는 모든 튜플들이 삭제되는 것이지 테이블 자체가 삭제되는 것은 아니다. 테이블 자체를 삭제하는 명령어는 drop 이다.

(６) 데이터 제어어(DCL, data control language)

1) GRANT

① 데이터베이스 사용자에게 사용권한 부여

② 기본 구조

Grant 권한 on 테이블명 to 사용자명 [with grant option];

③ 예제

• Grant select on 테이블명 to rhk [with grant option];

• 권한: all, insert, delete, update, select 등

• With grant option : 사용자가 받은 권한을 다른 사용자에게 부여할 수 있음

2) REVOKE

① 데이터베이스 사용자의 사용 권한을 취소

② 기본 구조

Revoke 권한 on 테이블명 from 사용자명 [cascade];

③ 예제

• Revoke select on 수강생 from rhk [cascade]

• Cascade : 권한을 부여받은 사용자가 다른 사용자에게 부여한 권한도 취소

3) COMMIT

① 데이터베이스 조작 작업을 영구적으로 반영하여 완료함

4) ROLLBACK

① 데이터베이스 조작 작업이 비정상적으로 종료되었을 때 원래의 상태로 복구

'정보처리기사 > 데이터베이스' 카테고리의 다른 글

09. 개체-관계(E-R) 모델 (0)	2017.08.01
08. 데이터모델링 및 설계 (0)	2017.08.01
06. 관계데이터언어(관계대수) (0)	2017.08.01
05. 관계데이터모델 (0)	2017.08.01
04. 정렬, 탐색기법 (0)	2017.08.01

06. 관계데이터언어(관계대수)

2017. 8. 1. 15:36

제1항 관계데이터언어(관계대수, 관계해석)

관계 데이터베이스의 릴레이션을 조작하기 위한 기본연산에는 관계대수(relational algebra)와 관계해석(relational calculus)이 있다. 이 연산은 사용자의 입장에서 볼 때 데이터를 처리하는 데이터 언어가 되며 관계대수는 절차적 언어이며 관계해석은 비절차적 언어이다.

(１) 관계대수(relational algebra)

1) 대수

① 수 대신 문자를 사용해서 문제를 쉽게 하고, 수학적인 법칙을 간단하고 명확하게 표현하는 것

2) 관계대수 정의

① 관계대수는 E.F. Codd가 관계 데이터 모델을 처음 제안할 때 정의

② 관계 대수(relational algebra)는 관계 해석(relational calculus)과 함께 관계 데이터 모델에서 릴레이션을 처리하기 위한 정형적인 데이터 언어이다. 이 관계 대수는 원하는 데이터를 얻기 위해서 어떻게(how) 질의를 수행할 것인지 일련의 연산을 순서대로 명시해야 하는 절차적 언어이다.

③ 데이터베이스에 저장된 데이터를 문자와 연산을 통해 요청한 데이터를 정보화하여 얻을 수 있는데 그 원리가 산술 연산자와 유사

④ 관계 데이터베이스의 관계(relation), 즉 테이블을 조작하는 언어

⑤ 하나 또는 그 이상의 테이블을 피연산자로 하여 결과로 하나의 테이블을 만들어내는 연산을 말한다.

⑥ 관계대수는 질의에 대한 결과를 생성하기 위해 수행해야 할 연산의 순서를 명시하는 절차적 언어이다.

⑦ 연산자의 종류

3) 순수 관계 연산자

① 디비전(division)

ü 나누어지는 릴레이션인 A는 릴레이션 B의 모든 튜플에 연관되어 있는 A의 튜플을 선택한다.

ü X⊃Y인 2개의 릴레이션에서 R(X)와 S(Y)가 있을 때, R의 속성이 S의 속성값을 모두 가진 튜플에서 S가 가진 속성을 제외한 속성만을 구함

ü R[속성r ÷ 속성s]S

② 프로젝트(project, P)

ü 릴레이션에서 주어진 조건에 만족하는 속성(attribute)만을 검색하는 연산

ü 형식 : P속성리스트(R)

ü 릴레이션의 열(세로)에 해당하는 속성들을 추출하는 연산자로써 수직 연산을 수행

③ 조인(join, ⋈)

ü 릴레이션에서 조건에 만족하는 레코드를 분리해 내는 연산을 의미하는 것으로 하나의 릴레이션에서 수평적인 부분 집합을 취하는 것이다.

ü 두개의 릴레이션으로부터 연관된 튜플들을 결합하는 연산자

ü 공통 속성을 중심으로 두개의 릴레이션을 하나로 합쳐서 새로운 릴레이션을 만듦

• Natural join(자연 조인)

- 동등 조인의 결과 릴레이션에서 조인 속성을 한 개 제외한 조인

- 여러가지 조인 연산자들 중에서 가장 자주 사용됨

• Equi join(동등 조인)

- 동등 조인의 결과 릴레이션에서 조인 속성을 모두 나타낸다.

ü 학생[학번⋈학번]성적

④ 셀렉트(selection, σ)

ü 릴레이션에서 주어진 조건을 만족하는 튜플들을 선택하는 연산자

ü σ조건(R)

ü 튜플 단위로 조건에 만족하는 튜플들을 가져오는 수평 연산을 수행

ü 학생 릴레이션에 대한 셀렉션 연산

4) 일반 집합연산자

① 집합 연산자

ü 릴레이션이 튜플들의 집합이기 때문에 기존의 집합 연산이 릴레이션에 적용

ü 집합 연산자의 입력으로 사용되는 두개의 릴레이션은 합집합 호환(union compatible)이어야 함

② 합집합(union)

ü 합병 가능한 두 릴레이션 A 또는 B에 속하는 튜플들로 구성된 릴레이션이다.

ü 두 릴레이션 R과 S의 합집합 R∪S는 R 또는 S에 있거나 R과 S 모두에 속한 튜플들로 이루어진 릴레이션

ü 결과 릴레이션에서 중복된 튜플들은 제외됨

③ 교집합(intersection)

ü 합병 가능한 두 릴레이션 A와 B에 공통적으로 속하는 튜플들로 구성된 릴레이션이다.

ü 두 릴레이션 R과 S의 교집합 R∩S는 R과 S 무두에 속한 튜플들로 이루어진 릴레이션

④ 차집합(difference)

ü 합병 가능한 두 릴레이션 A에만 있고 B에는 없는 튜플들로 구성된 릴레이션이다.

ü 두 릴레이션 R과 S의 차집합 R – S는 R에는 속하지만 S에는 속하지 않은 튜플들로 이루어진 릴레이션

⑤ 카티션 곱(cartesian product)

ü A에 속한 각 튜플 a에 대하여 B에 속한 튜플 b를 모두 접속시킨 튜플들(a, b)로 구성된 릴레이션이다.

5) 관계 대수의 한계

① 관계 대수는 산술 연산을 할 수 없음

② 집단 함수(aggregate function)를 지원하지 않음

③ 정렬을 나타낼 수 없음

④ 데이터베이스를 수정할 수 없음

⑤ 프로젝션 연산의 결과에 중복된 튜플을 나타내는 것이 필요할 때가 있는데 이를 명시하지 못함.

6) 추가된 관계 대수 연산자

① 집단함수(aggregate function)

ü 모든 사원들의 급여 평균은 얼마인가?

② 그룹화

ü 각 부서별 사원들의 급여 평균은 얼마인가?

③ 외부조인

ü 상대 릴레이션에서 대응되는 튜플을 갖지 못하는 튜플이나 조인 속성에 널값이 들어 있는 튜플들을 다루기 위해서 조인 연산을 확장한 조인

ü 두 릴레이션에서 대응되는 튜플들을 결합하면서, 대응되는 튜플을 갖지 않는 튜플과 조인 애트리뷰트에 널값을 갖는 튜플도 결과에 포함시킴

ü 왼쪽 외부 조인(LEFT OUTER JOIN), 오른쪽 외부 조인(RIGHT OUTER JOIN), 완전 외부 조인(FULL OUTER JOIN)

④ 왼쪽 외부조인

ü 릴레이션 R과 S의 왼쪽 외부 조인 연산은 R의 모든 튜플들을 결과에 포함시키고, 만일 릴레이션 S에 관련된 튜플이 없으면 결과 릴레이션에서 릴레이션 S의 속성값을 널값으로 채움

⑤ 오른쪽 외부조인

ü 릴레이션 R과 S의 오른쪽 외부 조인 연산은 S의 모든 튜플들을 결과에 포함시키고, 만일 릴레이션 R에 관련된 튜플이 없으면 결과 릴레이션에서 릴레이션 R의 속성값을 널값으로 채움

⑥ 완전 외부조인

ü 릴레이션 R과 S의 완전 외부 조인 연산은 R과 S의 모든 튜플들을 결과에 포함시키고, 만일 상대 릴레이션에 관련된 튜플이 없으면 결과 릴레이션에서 상대 릴레이션의 속성값을 널값으로 채움

(２) 관계해석(relational calculus)

1) 정의

① 원하는 데이터만 명시하고 질의를 어떻게 수행할 것인가는 명시하지 않는 선언적인 언어

2) 관계해석의 특징

① 비절차 언어

② 튜플 관계 해석과 도메인 관계 해석이 있다.

③ 기본적으로 관계해석과 관계대수는 관계 데이터베이스를 처리하는 기능과 능력면에서 동등함

④ 수학의 predicate calculus에 기반을 두고 있음

⑤ 관계해석으로 질의어를 표현

⑥ 원하는 릴레이션을 정의하는 방법을 제공, 즉 원하는 정보가 무엇이라는것만 정의하는 비절차적인 언어

⑦ 연산들의 절차(sequence)를 사용하여 데이터를 가져옴

⑧ 기본적인 연산자로 union, intersection, difference를 사용함

⑨ 전체관계를 조작하는데 사용되는 연산들의 집합

'정보처리기사 > 데이터베이스' 카테고리의 다른 글

08. 데이터모델링 및 설계 (0)	2017.08.01
07. SQL(Structure Query Language) (0)	2017.08.01
05. 관계데이터모델 (0)	2017.08.01
04. 정렬, 탐색기법 (0)	2017.08.01
03. 자료구조(선형, 비선형) (0)	2017.08.01

05. 관계데이터모델

2017. 8. 1. 15:35

제1항 관계데이터모델

(１) 정의

1) 열과(column)과 행(row)으로 이루어진 테이블(릴레이션, relation)과 수학적으로 정의된 연산들로 구성된 것

2) 논리적인 데이터 모델에서 데이터간의 관계를 기본키(primary key)와 이를 참조하는 외래키(foreign key)로 표현하는 데이터 모델

3) 개체 집합에 대한 속성 관계를 표현하기 위해 개체를 테이블(table)로 사용하고 개체 집합들 사이의 관계를 공통 속성으로 연결하는 독립된 형태의 데이터 모델

4) 1970년 E.F.Codd의 논문에서 언급된 개념이다.

5) 관계 데이터 모델의 핵심은 릴레이션(relation) 이다.

① 릴레이션(relation)

ü 정의

• 열(column)과 행(row)으로 이루어진 테이블을 말한다.

• 릴레시션 스킴(relation scheme)과 릴레이션 인스턴스(relation instance)로 구성된다.

ü 특성

• 한 릴레이션에는 중복된 투플이 존재하지 않음.

• 한 릴레이션에 저장된 투플들 간에는 순서가 없음.

• 한 릴레이션을 구성하는 속송들간에는 순서가 없음.

• 모든 속성값은 원자값(atomic value) 이다.

그림 42. relation database schema

(２) 특징

1) 데이터와 데이터간의 관계가 테이블로 표현된다.

2) 테이블(table) = 릴레이션(relation)

3) 구조가 간단해서 이해하기 쉬우며, 데이터 조작면에서도 명확하다.

(３) 관계형 모델용어 vs DBMS 용어

1) 릴레이션(relation)

① 열과 행을 가지는 테이블

② 테이블(table), 개체(entity), 파일(file)과 같은 개념

※ 속성(attribute)의 원자값

모든 속성값은 원자값(atomic value) 이다. 이 성질이 뚯하는 것은 더 이상 분해할 수 없는 원자값을 의미한다.

2) 속성(attributes)

① 개체의 성질, 분류, 식별, 수량, 상태 등을 나타내는 세부 정보의 관리 요소로서 개체를 구성하는 항목

② 열(column), 필드(field), 항목(item)과 같은 개념

3) 튜플(tuple)

① 릴레이션의 행을 구성하는 속성(attribute) 값들의 집합

② 행(row), 레코드(record)와 같은 개념

4) 차수(degree)

① 속성(attribute)들의 수

5) 카디날리티(cardinality)

① 튜플(tuple)들의 수

6) 도메인(domain)

① 하나의 속성(attribute)가 취할 수 있는 같은 타입의 원자(atomic) 값들의 집합

② 표현되는 속성 값의 범위를 나타냄

③ 예) 성별의 도메인은 ‘남’, ‘여’ 만이 가능.

7) 릴레이션 인스턴스(relation instance)

① 릴레이션의 어느 시점에 들어 있는 튜플들의 집합 (동적인 성질)

② 튜플들의 집합으로 현재 들어가 있는 실제 데이터를 지칭한다

(４) 키(key)

1) 정의

① 데이터베이스에서 조건에 만족하는 튜플(tuple)을 찾거나 순서대로 정렬할 때 튜플들을 서로 구분할 수 있는 기준이 되는 속성(attribute)들을 말한다.

2) 특성

① Not null

ü 속성의 값은 null이 될수 없다. (null = undefined)

• 기본키의 속성값은 not null이다.

ü Null

• 데이터베이스에서 아직 알려지지 않거나 모르는 값으로서 해당 없음등의 이유로 정보 부재를 나타내기 위해 사용하는 특수한 데이터 값이다. 즉, 공백(space)도, 영(zero)도 아닌 부재정보(missing information)를 나타냄

② 유일성(uniqueness)

ü 하나의 키 값으로 하나의 튜플만을 유일하게 식별할 수 있어야 함

ü 속성의 집합인 키의 내용이 릴레이션 내에서 유일하다는 특성임

ü 즉, 릴레이션 내에서는 중복되는 튜플이 존재하지 않는 것을 말함

ü 유일성을 만족하는 키의 종류

• 기본키(primary key) : 후보키중에서 선택된 키이므로 유일성과 최소성 모두 만족한다.

• 후보키(candidate key) : 유일성과 최소성 모두 만족

• 슈퍼키(super key): 유일성만 만족

③ 최소성(minimality)

ü 속성의 집합인 키가 릴레이션의 모든 튜플을 유일하게 식별하기 위해 꼭 필요한 속성들로 구성된 것을 의미한다.

ü 즉, 속성들의 집합에서 특정 속성 하나를 제거하면 튜플을 유일하게 식별할 수 없는 경우에 해당 함.

ü 최소성을 만족하는 키의 종류

• 후보키(candidate key) : 유일성과 최소성 모두 만족

• 기본키(primary key): 후보키에서 선택된 키이므로 유일성과 최소성 모두를 만족한다.

3) 종류

① 후보키(candidate key)

ü 릴레이션을 구성하는 속성들 중에서 튜플을 유일하게 식별할 수 있는 하나 또는 몇 개의 속성(attribute)의 집합

ü 유일성과 최소성을 모두 만족

② 기본키(primary key)

ü 릴레이션의 유일한 식별자

ü 릴레이션에서 기본키 지정된 속성(attribute)은 같은 값을 가질 수 없다.

ü 후보키 중에서 선정된 키로 중복값을 가질 수 없다.

ü 후보키의 성질을 가짐 (유일성, 최소성 모두 만족)

ü 기본키의 특성

• Not null

• Unique

• 외래키(foreign key)로 참조될 수 있다.

③ 대체키(alternate key)

ü 후보키가 둘 이상 되는 경우에 기본키로 선택되지 못한 후보키들을 대체키라고 한다.

ü 후보키 = 기본키 + 대체키

④ 슈퍼키(super key)

ü 유일성만 있고 최소성이 없는 속성(attribute)의 집합을 말한다.

⑤ 외래키(foreign key)

ü 한 테이블의 키 중 다른 테이블의 튜플을 식별할 수 있는 키를 말한다.

4) 키와 데이터 무결성

① 정의

ü 권한이 부여된 사용자에 의하여 발생할 수 있는 데이터베이스의 오류를 방지하기 위함

ü 데이터의 정확성, 일관성, 신뢰성을 위해 무효 갱신으로부터 데이터를 보호하여 관계 데이터베이스를 의미 있게 하는 제약조건

② 기본 데이터 무결성

'정보처리기사 > 데이터베이스' 카테고리의 다른 글

07. SQL(Structure Query Language) (0)	2017.08.01
06. 관계데이터언어(관계대수) (0)	2017.08.01
04. 정렬, 탐색기법 (0)	2017.08.01
03. 자료구조(선형, 비선형) (0)	2017.08.01
02. DBMS의 기능 (0)	2017.08.01

04. 정렬, 탐색기법

2017. 8. 1. 15:31

제1항 정렬, 탐색기법

(１) 정렬

1) 정렬(sort)의 정의

① 레코드나 데이터에 담긴 키값에 따라 순서대로 나열하는 것

② 정렬은 정렬되지 않은 항목 또는 레코드의 리스트를 각 레코드의 값에 기초한 기준에 따라 순서 있게 나열하는 것이다.

③ 초기에 정렬되지 않은 레코드의 순서를 정렬될 때까지 재배치하는 과정

그림 37. 정렬의 종류

2) 정렬기법

① 내부정렬기법

ü 정의

• 데이터량이 적을 때 주기억장치 내에서 정렬하는 방법

ü 특징

• 속도는 빠르나, 정렬할 자료의 양이 많은 경우 부적합

ü 종류

• 히프 정렬(heap sort)

• 기수 정렬(radix sort)

• 선택 정렬(selection sort)

• 버블 정렬(bubble sort)

• 퀵 정렬(quick sort)

• 삽입 정렬(insertion sort)

• 쉘 정렬(shell sort)

② 외부정렬기법

ü 정의

• 대용량의 데이터를 몇 개의 서브 파일로 나누어 각각 내부 정렬을 한 후에 테이프나 디스크 내에서 각 서브 파일을 합병하는 방법

ü 특징

• 속도는 느리지만 정렬하고자 하는 자료의 양이 많을 경우 효과적 (주기억장치+보조기억장치)

ü 종류

• 진동 병합 정렬(oscillating merge sort)

• 밸런스 병합 정렬(balanced merge sort)

• 캐스캐이드 병합 정렬(cascade merge sort)

• 폴리파즈 병합 정렬(polyphase merge sort)

3) 정렬기법 종류

① 버블 정렬(bubble sort)

• 버블정렬은 인접한 두 키를 비교한 결과로 정렬하는데 만약 비교하였을 때 두 키의 순서가 다르다면 교환하고 그렇지 않다면 그대로 두는 방법이다.

• 정렬과정이 물속 깊은 곳에서 일어난 거품이 수면을 향해 올라오는 모습과 같다고 해서 붙여진 이름이다.

② 삽입 정렬(insertion sort)

• 데이터 집합을 순회하면서 정렬이 필요한 요소를 뽑아내어 이를 다시 적당한 곳에 삽입해 나가는 알고리즘

- 데이터 집합에서 정렬 대상이 되는 요소들을 선택합니다. 이 정렬 대상은 왼쪽부터 선택해 나가며, 그 범위가 처음에는 2개이지만 알고리즘 반복횟수가 늘어날 때마다 1개씩 커집니다. 정렬 대상의 최대 범위는 “데이터 집합의 크기 – 1” 이 됩니다.

- 정렬 대상의 가장 오른쪽에 있는 요소가 정렬 대상 중 가장 큰 값을 갖고 있는지 확인합니다. 만약 그렇지 않다면, 이 요소를 정렬 대상에서 뽑아내고, 이 요소가 위치할 적절한 곳을 정렬 대상 내에서 찾습니다. 여기서 적절한 곳이라 함은 데이터 집합의 가장 왼쪽을 기준으로 했을 때 자신보다 더 작은 요소가 없는 위치를 말합니다.

- 뽑아 든 요소를 삽입할 적절한 곳을 찾았다면, 정렬 대상 내에서 삽입할 값보다 큰값을 갖는 모든 요소를 한자리씩 오른쪽으로 이동시키고 새로 생긴 빈 자리에 삽입시킵니다.

- 전체 대이터 집합의 정렬이 완료될 때까지 1~3를 반복합니다.

• 이 정렬 알고리즘은 지급 완료 수표나 카드를 정렬된 채로 손에 쥐고서 그것들 사이에 적당한 위치에 정렬되지 않은 것을 한 개씩 삽입할 때 발생할 수 있다.

③ 선택 정렬(selection sort)

• 레코드의 최소값을 찾아 첫 번째 위치에 놓고 다음 최소값을 찾아 두 번째 위치에 놓는 방법을 반복하여 정렬함.

④ 히프 정렬(heap sort)

• 연산 시간이 최악과 평균의 경우, 모두 0(n logⁿ)으로 빠른 속도를 가짐

• 전이진 트리(complete tree)를 이용한 정렬 방식

• 이진 트리를 힙 정렬로 변환

- 주어진 레코드들을 순서대로 넣어 진이진 트리로 구성

- 전이진 트리의 노드의 역손으로 자식노드와 부모노드를 비교하여 큰값을 위로 올림

- 교환된 노드들을 다시 검토하여 위의 고정을 반복한다.

⑤ 퀵 정렬(quick sort)

• 레코드의 많은 자료 이동을 없애고 하나의 파일을 부분적으로 나누어가면서 정렬하는 방법으로 키를 기준으로 작은 값은 왼쪽에 큰 값은 오른쪽에 모이도록 서로 교환시키는 부분 교환 정렬법

⑥ 기수 정렬(radix sort)

• 레코드의 키 값을 분석하여 같은 수 또는 같은 문자끼리 그 순서에 맞는 버킷에 분배하였다가 버킷의 순서대로 레코드를 꺼내어 정렬하는 기법

⑦ 2-way 합병 정렬

• 주어진 입력 파일을 크기가 2인 서브 파일로 모두 나누어서 각 서브 파일들을 정렬하는 방법

4) 정렬 알고리즘의 선택 시 고려사항

① 키 값들의 분포상태

② 소요 공간 및 작업시간

③ 정렬에 필요한 기억공간의 크기

④ 데이터의 양

⑤ 초기 데이터의 배열상태

⑥ 사용 컴퓨터 시스템의 특성

(２) 탐색기법

1) 탐색기법의 종류

① 이진 검색(binary search)

ü 일정한 순서로 배열된 레코드를 2개 부분으로 되풀이하여 나누어서 한 부분은 버리고 남은 부분을 검색하는 방법

ü 자료가 반드시 정렬되어 있어야 함 (이진 검색의 선행 조건)

ü 정렬된 연접 리스트에서 특정 레코드가 있다고 알려진 리스트의 남겨진 반쪽 부분을 되풀이하여 보면서 특정 레코드를 찾는 빠른 방법

ü 다음과 같이 R={2,3,5,7,8,9,10} 일 때, 이진 검색 방법으로 8을 찾을 경우 비교 횟수는?

② 보간 검색(Interpolation search)

ü 찾고자 하는 레코드 키가 있음직한 위치를 추정하여 검색하는 방법

2) 해싱(hashing)

① 해싱의 정의

ü 키 값으로부터 레코드가 저장되어 있는 주소를 직접 계산하여, 산출된 주소로 바로 접근하는 방법, 키-주소 변환 방법이라고도 함

ü 검색 방법 중 속도는 가장 빠르지만 충돌현상 시 오버플로 해결의 부담이 과중되며 많은 기억공간을 요구하는 검색 방법

② 해시 테이블(hash table)

ü 자료가 저장되는 전체 저장소를 해시 테이블(hash table)이라고 한다.

ü 해시 테이블은 여러 개의 버킷(bucket)으로 나누어지는데 데이터를 삽입할 때 데이터의 값으로부터 적절한 버킷을 선택해서 삽입해야 한다.

ü 버킷은 여러 개의 슬롯(slot)으로 구성되는데 슬롯은 버킷에 데이터가 저장되는 단위이다. 예를 들면 주소록의 각 페이지별로 한 명만 적을 수 있는 것이 아니라 여러명을 적을 수 있어야 하는데 이때 한명의 주소를 적는 칸을 슬롯이라고 한다.

ü 버킷(bucket)

• 하나의 주소를 갖는 파일의 한 구역을 의미하며, 버킷의 크기는 같은 주소에 포함될 수 있는 레코드 수를 의미

ü 슬롯(slot)

• 한 개의 레코드를 저장할 수 있는 공간으로 n개의 슬롯이 모여 하나의 버킷을 형성

ü 충돌(collision)

• 레코드를 삽입할 때 2개의 상이한 레코드가 똑 같은 주소로 해싱 되는 것을 의미

ü 동의어(synonym)

• 해싱 함수의 값이 같은 키들의 집합

③ 해싱함수의 종류

ü 중간제곱(mid-square) 방법

• 레코드의 키를 제곱한 후 그 중간 부분의 값을 목적 주소로 사용하는 방법

ü 숫자분석(digit analysis) 방법

• 레코드 키를 구성하는 수들이 모든 키들 내에서 각 자리별로 어떤 분포인지를 조사하여 비교적 고른 분포를 나타내는 자릿수를 필요한 만큼 선택하여 목적 주소로 사용하는 방법

ü 제산(division) 방법

• 레코드의 키를 해시테이블의 크기보다 큰 소수로 나누는 방법

ü 중첩(접지) 방법(Folding method)

• 주어진 키를 여러 부분으로 나누고, 각 부분의 값을 더하거나 배타적 논리합(XOR, exclusive OR) 연산을 통하여 나온 결과로 주소를 취하는 방법

ü 기수(radix) 변환법

• 어떤 진법으로 표현된 주어진 레코드 키 값을 다른 진법으로 간주하고 키 값을 변환하여 홈 주소로 취하는 방식

④ 오버플로 처리방법

ü 충돌(collision)이 발생했을 때 버킷에 저장할 슬롯이 없다면 오버플로우가 발생한다.

ü 재해싱 방법(rehashing)

• 여러 개의 해싱함수를 준비하였다가 충돌 발생시 새로운 해싱함수를 적용하여 새로운 해시표를 생성하는 방법

ü 개방 주소법(open addressing)

• 충돌(collision)이 발생했을 때 순서대로 다음 버킷에 저장하는 방법

ü 체인방법

• 오버플로우 발생시 이를 별도의 기억 공간에 두고 링크로 연결하여 사용하는 방법

ü 폐쇄 주소법(close addression)

• 별도의 오버플로우 영역에 저장하고 체인(chain)으로 홈 버킷에 연결한다.

• Direct chaining: 해시 테이블 내의 빈 공간에 오버플로우 레코드를 보관한다.

• Indirect chaining: 해시 테이블과는 별도의 기억공간에 오버플로우 레코드를 보관한다.

제2항 인덱스구조

(１) 인덱스 (index)

1) 인덱스의 정의

① 검색을 빠르게 하기 위해 만든 보조적인 데이터 구조

② B트리, B+트리, 트라이 등의 자료구조를 사용하여 구현함

③ 인덱스 파일

ü 검색수를 줄이기 위해 다단계 인덱스를 사용

2) 인덱스의 특징

① 인덱스는 하나 이상의 필드로 만들어도 됨

② 인덱스를 통해서 테이블의 레코드에 대한 액세스를 빠르게 수행할 수 있음

3) 트라이 (trie)

① 검색을 위한 키값을 직접 표현하지 않고 키를 구성하는 문자나 숫자 자체의 순서로 키값을 구성하는 구조

② 트라이의 차수는 키 값을 표현하기 위해 사용하는 문자의 수(radix)에 의해 결정함

③ 키 값의 분포를 미리 예측할 수 있다면 기억장소를 절약할 수 있음

④ 트라이의 크기는 나타내려고 하는 키 값의 기수와 키 필드 길이에 의해 결정됨

⑤ 키 값이 문자열 또는 숫자일 경우 일련의 키 값들에 대해 일부분이 같은 문자나 숫자로 구성되었을 때, 즉 전체 키 값의 길이보다 키 값들 사이에 별개의 전위(prefix) 수가 작을 때 적합함

⑥ 가변 길이의 키 값을 효과적으로 나타낼 수 있으며, 삽입 및 삭제 시 노드의 분열과 병합이 없음

4) 인덱스 구분

① 정적인덱스

ü 데이터 파일의 레코드가 삽입되거나 삭제됨에 따라 인덱스의 내용은 변하지만 구조자체는 변하지 않음

② 동적인덱스

ü 인덱스나 데이터파일을 블록으로 구성하고 각 블록에는 추가로 삽입될 레코드를 감안하여 빈 공간을 미리 예비해두는 인덱스 방법

ü 레코드의 삽입으로 인해 블록에 레코드가 가득 차면 동적으로 분열 됨

ü 레코드의 삭제로 인해 일정 수의 레코드가 블록에 유지되지 않으면 블록의 합병이 일어남

'정보처리기사 > 데이터베이스' 카테고리의 다른 글

06. 관계데이터언어(관계대수) (0)	2017.08.01
05. 관계데이터모델 (0)	2017.08.01
03. 자료구조(선형, 비선형) (0)	2017.08.01
02. DBMS의 기능 (0)	2017.08.01
01. 정보처리시스템과 데이터베이스의 개념 (0)	2017.07.31

03. 자료구조(선형, 비선형)

2017. 8. 1. 15:30

제1절 자료구조의 기본

제1항 자료구조의 개요

(１) 자료구조란?

그림 13. 자료구조

1) 자료를 효율적으로 사용하기 위해서 자료의 특성에 따라서 분류하여 구성하고 저장 및 처리하는 모든 작업

2) 컴퓨터에서 처리할 자료를 효율적으로 관리하고 구조화시키기 위한 학문이다. 자료를 효율적으로 사용하기 위해서 자료의 특성에 따라서 분류하여 구성하고 저장 및 처리하는 모든 작업을 의미한다.

3) 자료구조에 따라 저장공간의 효율성과 프로그램의 실행시간이 달라짐

(２) 컴퓨터 분야에서 자료구조를 배우는 이유?

1) 컴퓨터가 효율적으로 문제를 처리하기 위해서는 문제를 정의하고 분석하여 그에 대한 최적의 프로그램을 작성해야 한다.

2) 자료의 특성을 이해하고 분석하여 최적의 알고리즘을 개발하는 능력이 필요

(３) 자료구조에서 다루는 내용

(４) 자료구조의 분류

1) 단순구조

① 정수, 실수, 문자, 문자열 등의 기본 자료형

2) 선형구조

① 자료들 간의 앞뒤 관계가 1:1의 선형관계

② 리스트, 연결리스트, 스택, 큐, 덱 등

3) 비선형구조

① 자료들 간의 앞뒤 관계가 1:n, 또는 n:n 의 관계

② 트리, 그래프 등

4) 파일구조

① 레코드의 집합인 파일에 대한 구조

② 순차파일, 색인파일, 직접파일 등

기출문제) 비선형 구조와 선형 구조가 옳게 짝지어진 것은?

1. 스택(Stack) 2. 큐(Queue)

3. 트리(Tree) 4. 연결리스트(Linked List)

5. 그래프(Graph)

가. 비선형 구조: 1, 2, 5 선형구조: 3, 4

나. 비선형 구조: 3, 5 선형구조: 1, 2, 4

다. 비선형 구조: 1, 2, 3 선형구조 4, 5

라. 비선형 구조: 3 선형구조: 1, 2, 4, 5

답) 나

제2항 기본자료형

(１) 정수형

1) 십진수, 8진수, 16진수로 표현가능

2) 접미사

① l or L : long 상수

② u or U: unsigned 상수

3) 종류

(２) 실수형

1) 123.4, 1.234e2, 1.234E2, 1.234f, 1.234d 의 형태로 표현

2) 접미사

① f or F : float

② d or D : double

3) 종류

(３) 문자형

1) ‘a’, ‘A’, ‘0’ 과 같이 표현

2) Single quote 사용

3) 제어문자(Escape sequence) 표현

4) 종류

(４) 문자열형

1) “SEOUL”와 같이 double quote로 둘러싸인 일련의 문자들

2) “”: 빈 문자열

3) 문자상수 ‘a’와 문자열 상수 “a”는 구분되어야 한다.

4) 문자열은 반드시 null(‘\0’) 로 끝난다.

제3항 선형 구조(Linear Structure)

(１) 리스트 (List)

1) 리스트의 종류

① 선형리스트(Linear List)

ü 배열과 같이 연속되는 기억장소에 저장되는 리스트를 말한다.

ü Array(배열)

② 연결 리스트

ü 자료들이 반드시 연속적으로 배열되어 있지 않아도 노드 포인터 부분을 이용하여 서로 연결되어진 구조를 말한다.

ü 포인터

(２) 선형 리스트 (Linear List)

1) 연속적인 기억장소에 저장된 리스트

2) 순차리스트 또는 연접리스트(Dense List) 라고도 함

3) 임의의 노드에 접근을 할 때는 인덱스(Index)를 사용하므로 포인터가 없음

4) 장점

① 간단한 자료구조

② 저장 효율이 뛰어남 (기록밀도: 1)

③ 접근 속도(Access Time)가 빠름

5) 단점

① 삽입과 삭제가 어려움

② 삽입 및 삭제시 삽입하거나 삭제할 위치 이후의 모든 자료의 이동이 필요

(３) 연결 리스트 (Linked List)

1) 자료들을 임의의 기억공간에 기억시키고, 자료 항목의 순서에 따라 노드의 포인터 부분을 이용하여 서로 연결시킨 자료 구조

2) 장점

① 자료의 삽입 및 삭제가 용이

② 비연속적 (한 리스트를 여러 개의 리스트로 분리하기 쉬움)

③ 희소행렬(행렬의 요소들 중에서 많은 부분이 0으로 되어 있는 행렬)을 연결 리스트로 표현시 기억장소 이용 효율이 좋음

3) 단점

① Access Time이 느림

② 기억장소 이용 효율이 나쁨(저장되지 않은 빈 공간 발생)

③ 포인터를 위한 추가 공간이 필요

④ 중간노드 연결이 끊어지면 그 다음 노드를 찾기 힘듬

4) 종류

① 단순 연결 리스트 (단순 링크드 리스트)

ü 한 방향으로만 가리키고 있다.

그림 SEQ 그림 \* ARABIC 20. single linked list

② 이중 연결 리스트

ü 양 방향으로 가리키고 있다.

그림 SEQ 그림 \* ARABIC 21. double linked list

③ 단순 환형 연결 리스트

(４) 스택 (Stack)

1) 정의

① top이라고 하는 리스트의 한쪽 끝에서만 삽입과 삭제가 일어나는 자료구조

② 자료의 후입선출(last-in-first-out) 방법

ü 자료의 삽입: TOP = TOP + 1

ü 자료의 삭제: TOP = TOP – 1;

ü Overflow 발생: 스택의 크기가 M일 때, TOP > M 이면 Overflow 발생

2) 용도

① 인터럽트의 처리

② 수식의 계산 (산술식 표현)

③ 서브루틴의 복귀번지 저장

④ 부 프로그램(sub program)의 호출 = 함수 호출의 순서 제어

3) 순환적 프로그램을 처리하기 위한 요소

① 스택

② 복귀주소

③ 순환에서 탈출하는 조건

4) 삽입 알고리즘

Top = Top + 1

if Top > M then

Overflow

else

X(Top) = item

5) 삭제 알고그림

if Top = 0 then

Underflow

else

item = X(Top)

Top = Top - 1

(５) 큐 (Queue)

1) 큐의 정의

① rear라고 하는 리스트의 한쪽 끝에서 삽입이 일어나고 front라 부르는 반대쪽 끝에서 삭제가 일어나는 자료구조

② FIFO(first-in-first-out) 구조

2) 형태

3) 용도

① 운영체제의 작업 스케쥴링 등에 응용되는 것으로 가장 적합한 자료구조

② 키보드 버퍼 이용시

③ 스풀(spool) 운용시

(６) 데크 (Deque, Double Ended Queue)

1) 데크의 정의

① 서로 다른 방향에서 입출력이 가능한 구조 (삽입과 삭제가 양쪽 끝에서 일어남)

② 입력이 한쪽에서만 발생하고, 출력은 양쪽에서 일어날 수 있는 입력제한과 입력은 양쪽에서 일어나고 출력은 한곳에서만 이루어지는 출력제한이 있음.

③ 스택과 큐를 복합한 형태

④ 양 끝에서 삽입과 삭제가 가능하게 하도록 큐를 일반화한 것

제4항 비선형 구조(Non-Linear Structure)

(１) 트리 (Tree)

1) 트리의 정의

① 트리는 1개 이상의 노드를 갖는 집합으로 노드들은 다음과 같은 조건을 만족한다.

ü 트리에는 루트(root)라고 부르는 특별한 노드가 있다.

ü 트리는 사이클이 없는 그래프 (acyclic graph) 이며, 계층 구조를 이룬다.

② 노드와 간선으로 구성되어져 있고, 사이클이 없다.

③ Linked List로 표현할 때 가장 효율적임

④ 계층형 구조(hierarchical structure)를 나타내기 편리함

ü 연속적

2) 트리의 용어

① Node

ü Tree의 기본 구성요소

ü A, B, C, D, E, F, G, H, I, J, K, L, M

② 근노드(Root Node)

ü 가장 상위에 위치한 노드

ü A

③ 레벨(Level)

ü 근노드를 기준으로 특정 노드까지의 경로길이

ü K, L, M의 레벨은 4

④ 조상노드(Ancestors Node)

ü 특정 노드에서 루트에 이르는 경로상의 모든 노드

ü K의 조상노드는 E, B, A

⑤ 자식노드(Son Node)

ü 특정 노드에 연결된 다음 레벨의 노드

ü E의 자식노드는 K, L

⑥ 부모노드(Parent Node)

ü 특정 노드에 연결된 이전 레벨의 노드

ü K의 부모노드는 E

⑦ 형제노드(Sibling)

ü 같은 부모를 가진 노드

ü H의 형제노드는 I, J

⑧ 깊이(Depth, Height)

ü 트리의 최대 레벨

ü 트리의 깊이는 4

⑨ 차수(Degree)

ü 특정 노드에 연결된 자식노드의 수

ü D의 차수는 3

ü B의 차수는 2

⑩ 트리의 차수(Degree)

ü 트리의 노드중 최대 차수

ü 이 트리중에서 D의 차수는 3으로 가장 많다

⑪ 단말노드(Terminal Node, Leaf Node)

ü 트리의 제일 마지막에 위치한 노드

ü K, L, F, G, M, I, G

3) 트리의 특징

① 연결 리스트 구조로 표현 (포인터 이용)

4) 트리의 운행법(Traversal)

① 운행법 정의

ü 컴퓨터 기억 공간에 표현된 트리의 각 노드를 중복되지 않게 정해진 순서대로 전부 검색하여 트리의 정보에 관한 사항을 알고자 함

ü 이진 트리의 운행법은 산술식의 표기법과 관련됨

② 운행법 종류

ü Preorder (전위)

• root > left > right

• a, b, d, e, c, f, h, g

ü Inorder (중위)

• left > root > right

• d, b, e, a, h, f, c, g

ü Postorder (후위)

• left > right > root

• d, e, b, h, f, g, c, a

③ 수식의 표기법

ü 산술식을 계산하기 위해 기억공간에 기억시키는

ü 표기법의 종류

• 전위 표기법(Prefix notation)

- 연산자 > left 피연산자 > right 피연산자

- +ab

• 중위 표기법(Infix notation)

- left 피연산자 > 연산자 > right 피연산자

- a+b

• 후위 표기법(Postfix notation, reverse Polish notation)

- left 피연산자 > right 피연산자 > 연산자

- ab+

④ 표기법 변환

ü 현재의 표기법에서 우선순위가 가장 높은 두개의 피연산자와 한 개의 연산자를 바꾸고자 하는 표기법으로 바꿈, 바뀐 연산은 하나의 피연산자로 생각하고 위의 과정 반복

ü 중위표기법->후위표기법

• 5 + 2 / 7 ▶ 5+27/ ▶ 527/+

ü 중위표기법->전위표기법

• 5 + 2 / 7 ▶ 5+/27 ▶ +5/27

ü 후위나 전위 표기법에서 중위 표기법으로 바꾸려면 산술식의 앞쪽에서부터 연속된 2개의 피연산자와 하나의 연산자를 찾아 중위 표기법으로 바꾸는 과정을 반복함

5) 트리의 종류

① 이진트리

ü 정의

• Degree가 2이하로 구성된 트리

ü 특성

• 깊이가 k인 이진 트리의 최대노드의 수 : 2^k - 1

• 이진 트리의 레벨 I 에서 최대노드의 수 : 2^(i-1)

• n0 = n2 + 1 (n0: 이진 트리의 터미널노드, n2: 차수가 2인 노드수)

ü 종류

• 정이진 트리(FBT, Full Binary Tree)

- Depth(k), 전체노드 수 : 2ⁱ – 1

- 레벨마다 2^(i-1) 개 노드 가득

• 전이진 트리(CBT, Complete Binary Tree) or 완전 이진트리

- 정이진 트리의 각 노드에 붙인 1~n의 일련번호와 1:로 대응되는 트리

- 중간에 비워 있으면 안 됨

- 힙(Heap)

¡ 완전 이진 트리에 있는 노드 중에서 키 값이 가장 큰 노드나 키 값이 가장 작은 노드를 찾기 위해서 만든 자료 구조

¡ 최대 힙(max heap)

부모 노드의 키 값이 자식 노드의 키 값보다 항상 크거나 같은 크기의 관계

¡ 최소 힙(min heap)

부모 노드의 값이 자식 노드의 키 값보다 항상 작거나 같은 크기의 관계

¡ 힙이 아닌 예

• 사향 이진 트리(SBT, Skewed Binary Tree)

- 이진트리가 한쪽 방향

- 한 방향으로만 자식노드를 가지며 기억장소의 낭비 심각

(２) 그래프(Graph)

1) 그래프의 정의

① 노드와 간선으로 구성되어져 있고, 사이클이 있다.

② 각각의 단위 정보를 링크로 연결하여 구조화시킨 자료 구조

③ 정점(vertex) : 노드들의 집합

④ 간선(edge) : 정점들 사이의 상호 연결의 집합, 임의의 점들의 쌍을 연결

2) 그래프의 유형

① 트리는 사이클이 없는 그래프

② 사이클(cycle)은 같은 정점에서 시작과 끝이 이어지는 경로

3) 인접행렬(Adjacency Matrix)

4) 인접 리스트

5) 최소비용 신장트리

① 가중치가 가장 작은 간선들을 사이클이 이루어지지 않도록 연결시켜 만든 그래프

'정보처리기사 > 데이터베이스' 카테고리의 다른 글

06. 관계데이터언어(관계대수) (0)	2017.08.01
05. 관계데이터모델 (0)	2017.08.01
04. 정렬, 탐색기법 (0)	2017.08.01
02. DBMS의 기능 (0)	2017.08.01
01. 정보처리시스템과 데이터베이스의 개념 (0)	2017.07.31

02. DBMS의 기능

2017. 8. 1. 15:14

데이터베이스 시스템의 구성

데이터베이스 시스템 = DB + DBMS + 데이터베이스 언어 + 사용자

데이터베이스 시스템의 구성

데이터베이스(DB, Database)

한 조직의 여러 응용 시스템이 공용(Shared)하기 위해 최소한의 중복으로 통합(Integrated) 되고, 저장(Stored) 된 운영(Operational) 데이터의 집합이다.

데이터베이스 언어(Database language)

데이터베이스를 구축, 조작, 검색하는데 사용되는 프로그래밍 언어

사용자

① 데이터베이스 관리자(DBA)

② 데이터베이스 응용 프로그래머

③ 데이터베이스 사용자

DBMS(Database Management System)

데이터베이스를 구축하고 이용하는 기능을 제공하는 시스템 소프트웨어

DBMS (Database Management System)

DBMS의 정의

① 응용 프로그램과 데이터베이스의 중재자로서 모든 응용 프로그램들이 데이터베이스를 공용할 수 있도록 관리해 주는 소프트웨어 시스템이다.

② 데이터베이스를 액세스하기 위해 필요한 제어, 접근방법, 관리 등의 기능을 수행하는 소프트웨어이다.

③ 데이터베이스를 설계하는 사람이 장래의 업무처리 확대나 변경을 충분히 예측하여 그것을 바탕으로 만들어 놓은 프로그램이다.

④ DB의 구성, 접근방법, 관리유지에 대한 모든 책임을 지고 있다.

⑤ 데이터베이스의 생성과 관리를 담당하는 소프트웨어 패키지

⑥ 보조기억장치에 저장되어 있는 데이터베이스에서 필요한 데이터를 검색하거나 데이터를 삽입, 수정, 삭제 등을 효율적으로 지원하기 위한 프로그램의 집합체

⑦ 종속성과 중복성의 문제를 해결하기 위해서 제안된 시스템

DBMS의 장점

① 표준화의 범기관적 시행

② 데이터의 보안 보장이 용이

③ 데이터 무결성 및 일관성 유지

④ 데이터 중복 최소화

DBMS의 필수기능

※ 내장 SQL (Embedded-SQL)

호스트 언어(C, C++, 비쥬얼베이직 등)에 삽입되는 SQL로써 주로 일괄처리나 동일 업무 반복시 사용되었다.

정의기능(Definition Facility)

① 데이터 정의어(DDL, Data Definition Language)을 이용하여 데이터베이스의 물리적 구조를 정의

② 데이터의 형, 구조, 데이터가 데이터베이스에 저장될 때의 제약조건 등을 명시하는 기능

③ 데이터의 논리적 구조와 물리적 구조 사이의 변환이 가능하도록 두 구조 사이의 사상(Mapping)을 명세하여 하나의 물리적 구조로 여러 응용 프로그램이 요구하는 데이터 구조를 지원하게 하는 것

④ 다양한 응용 프로그램과 데이터베이스가 서로 인터페이스를 할 수 있는 방법을 제공

제어기능(Control Facility)

① 데이터 제어어(DCL, Data Control Language)를 이용하여 데이터의 사용 권한 제어

② 데이터 무결성(Integrity)과 일관성을 유지

③ 보안(Security)과 권한(Authority) 검사

④ 병행수행 제어(Concurrency control)

조작기능(Manipulation Facility)

① 데이터 조작어(DML, Data Manipulation Language)를 이용하여 응용 프로그램을 수행 (데이터 검색, 입력, 수정, 삭제 등)

② 사용자의 응용 프로그램과 데이터 간의 인터페이스 수단 제공

③ 데이터 요청, 변경 등을 위한 질의를 수행

④ 데이터베이스를 접근하여 데이터의 검색, 삽입, 삭제, 갱신 등의 연산 작업을 위한 사용자와 데이터베이스 사이의 인터페이스 수단을 제공

데이터베이스 스키마(Schema)

스키마의 개요

① 1975년 미국의 국립 표준화 기관 ANSI/SPARC (American National Standards Institute / System Planning And Requirements Committee) 에서 제안

② 데이터베이스를 관점(view)에 따라 3개의 계층으로 분리하여 데이터베이스 사용자에게 내부적으로 복잡한 데이터베이스 구조를 단순화시킨 관점을 제공하는 것을 말함

데이터의 표현 방법

① 외부단계(External Level)

⊙ 각각의 데이터베이스 사용자 관점 또는 사용자 뷰(User View)를 표현

⊙ 뷰 단계(View Level) 라고도 함

② 개념단계(Conceptual Level)

⊙ 데이터와 그들 간의 관계(Relationship)를 표현

⊙ 논리 단계(Logical Level) 라고도 함 / 데이터 모델 사용함

③ 내부단계(Internal Level)

⊙ 물리적인 저장장치에서 데이터가 실제적으로 저장되는 방법을 표현

⊙ 물리 단계(Physical Level)라고도 함 / 물리적 데이터 모델 사용함

스키마의 정의

① 데이터베이스의 구조와 제약 조건에 대한 명세(specification)를 기술한 것

② 데이터베이스를 구성하는 데이터 객체, 이들의 성질, 이들 간에 존재하는 관계, 그리고 데이터의 조작 또는 이들 데이터 값들이 갖는 제약 조건에 관한 정의를 총칭하는 용어이다.

③ 스킴(Scheme)이라고도 한다.

스키마의 특징

① 데이터 사전(Data Dictionary)에 저장된다.

② 다른 이름으로 메타데이터(Meta-data)라고도 한다.

③ 데이터베이스의 구조(개체, 속성, 관계)에 대한 정의

※ 데이터 사전(Data Dictionary) 이란

① 데이터사전이란 대부분 읽기 전용으로 제공되는 테이블 및 뷰들의 집합으로 데이터베이스 전반에 대한 정보를 제공한다.

② 데이터베이스는 명령이 실행될 때 마다 데이터 사전을 액세스한다.

③ DB 작업동안 데이터 사전을 읽어 객체의 존재 여부와 사용자에게 적합한 Access 권한이 있는지를 확인한다.

④ 데이터 사전에 저장되는 내용

⊙ 사용자 정보

⊙ 권한과 규칙 정보

⊙ 데이터베이스 스키마 객체(TABLE, VIEW, INDEX, …) 정보

⊙ 무결성 제약 조건에 관한 정보

⊙ 데이터베이스의 구조 정보

스키마의 3계층

① 외부 스키마(external schema)

⊙ 사용자의 요구사항을 도출하는 과정이다.

⊙ 사용자의 관점에서 보고자 하는 정보의 집합

⊙ 뷰(View) 또는 서브-스키마(Sub-Schema) 라고도 한다.

⊙ 전체 데이터베이스의 한 논리적인 부분으로 볼수 있으므로 서브 스키마(sub schema)라고도 한다.

⊙ 공용의 의미보다는 어느 개인이나 특정 응용에 한정된 논리적 데이터 구조

⊙ 데이터베이스의 개별 사용자나 응용 프로그래머가 접근하는 데이터베이스를 정의

② 개념 스키마(conceptual schema)

⊙ 데이터베이스의 전체적인 논리적 설계를 의미하는 것으로 데이터 객체, 성질, 관계, 제약조건에 관한 것 (개체간의 관계와 유지해야 할 제약 조건을 나타냄)

⊙ 데이터베이스 파일(file)에 저장되어 있는 레코드(Record)와 데이터 항목(item)의 이름을 부여하고 그들 사이에 관계의 구조를 나타내는 스키마(schema)

⊙ 논리 스키마 (Logical Schema) 라고도 한다.

⊙ 데이터베이스 접근권한, 보안정책, 무결성 규칙을 명세화 함.

③ 내부 스키마(internal schema)

⊙ 데이터 저장 구조의 세부사항과 접근 경로를 기술

⊙ 논리 스키마를 컴퓨터 내부에 저장할 수 있는 물리적인 구조로 변환한 것

⊙ 실제로 저장될 데이터베이스 내부 형식을 물리적으로 정의

⊙ 물리 스키마(Physical Schema) 라고도 함

사용자

DBA(Database Administrator, 데이터베이스 관리자)

① 데이터베이스 구조 등과 관련된 업무를 처리하며, 데이터베이스 전반에 책임을 갖는 사람 또는 조직

② 기업 또는 조직의 데이터베이스에 발생하는 데이터와 데이터를 접근하는 응용 프로그램을 통제하는 사람 또는 조직

응용 프로그래머(Application Programmer)

① 일반 사용자(최종 사용자)가 이용할 응용 프로그램을 개발하는 사용자 또는 사용 집단

② 데이터베이스와 관련된 구조 정보 및 사용자 요구사항을 파악하여 실제로 데이터베이스를 활용하기 위한 응용 프로그램을 개발하는 프로그래머

일반 사용자(최종 사용자, End User)

① 데이터베이스 관련 작업을 수행하기 위하여 응용 프로그램 또는 쿼리 프로그램 등으로 디스크를 저장장치에 있는 데이터에 접근하고 처리하는 작업을 수행하는 사람 또는 조직

DBA(Database Administrator)의 기능

DBA의 정의

① 데이터베이스 시스템의 원활한 기능을 수행하기 위하여 데이터베이스 구성 및 관리 운영 전반에 대한 책임을 가지고 직무를 수행하는 사람 또는 조직

② 기업 또는 조직의 데이터베이스에 발생하는 데이터와 데이터를 접근하는 응용 프로그램을 통제하는 사람 또는 조직

③ 데이터와 그 데이터에 접근하는 프로그램 모두를 중앙 통제하는 사람 또는 조직

④ 응용 프로그래머가 새로운 타입의 레코드를 만들기를 원하거나 기존 레코드에 새로운 데이터 항목을 포함 또는 크기를 확장함으로써 수정하기 원하면 DBA의 허락을 받아야 함

DBA의 주요 역할

① 데이터베이스 설계와 운영

⊙ 데이터베이스의 스키마 정의

⊙ 저장구조와 액세스 방법 정의

⊙ 보안 및 권한부여

⊙ 백업, 회복 절차를 정하고 수행

⊙ 데이터 사전의 유지 및 관리

⊙ 데이터베이스 구축

② 시스템 감독 및 분석 기능

⊙ 시스템 감시 및 성능 분석

⊙ 데이터베이스의 이상 현상 감시

⊙ 미들웨어 소프트웨어 등 종합적 자원관리

③ 행정 및 불편 해결

⊙ 사용자의 요구와 불평을 청취하고 해결

⊙ 데이터의 표현이나 문서화 표준 설정, 시행

데이터 독립성

개념

① 하위 단계의 구현 내용을 추상화하여 상위 단계에서는 인지하지 못하도록 해야 한다.

독립성의 종류

① 물리적 데이터 독립성(Physical Data Independency)

⊙ 3단계 데이터베이스 구조 중 최하위 단계인 내부 단계의 스키마가 변경되어도 외부 단계와 개념 단계의 스키마에는 영향을 미치지 않도록 지원하는 것

⊙ 데이터베이스 저장장치의 구조가 변경되어도 응용 프로그램이나 개념 스키마에는 영향을 미치지 않는 것

② 논리적 데이터 독립성(Logical Data Indepencency)

⊙ 3단계 데이터베이스 구조 중 중간 단계인 개념 단계의 스키마가 변경되어도 최상위 단계인 외부 단계의 스키마에 영향을 미치지 않도록 하는 것

⊙ 데이터베이스 논리적 구조가 변경되어도 응용 프로그램에는 영향을 미치지 않는 것

'정보처리기사 > 데이터베이스' 카테고리의 다른 글

06. 관계데이터언어(관계대수) (0)	2017.08.01
05. 관계데이터모델 (0)	2017.08.01
04. 정렬, 탐색기법 (0)	2017.08.01
03. 자료구조(선형, 비선형) (0)	2017.08.01
01. 정보처리시스템과 데이터베이스의 개념 (0)	2017.07.31

01. 정보처리시스템과 데이터베이스의 개념

2017. 7. 31. 16:50

정보 시스템의 정의

한 조직체에서 필요한 DATA를 수집, 저장해 두었다가 필요시에 처리해서 의사 결정에 유용한 정보를 생성하고 분해하는 수단을 말한다.

자료와 정보

정보는 전 세계에 산재해 있는 자료들 중에 필요한 것만을 골라내어 얻을 수도 있지만, 경우에 따라서는 전문가들의 손에 의해 자료들을 가공하고 처리해야만 ‘정보’로서의 가치를 얻을 수 있는 것들이 많다. 예를 들어 우리나라에서 한해 동안 소비되는 담배의 양이 얼마나 되는지를 알기 위해서는 각 시∙도에서 소비되는 담배의 양에 관한 자료를 수집하여 집계를 해야 한다. 이렇게 집계된 결과는 바로 우리가 얻고자 하는 ‘정보’가 되고, 각 시∙도의 담배 소비량은 정보를 얻기 위해 입력한 ‘자료’가 된다.

자료

① 현실 세계로부터 단순한 관찰이나 측정을 통해 수집된 사실이나 값을 말한다.

② 객관적 실제의 반영이며, 그것을 전달할 수 있도록 기호화한 것

※ 고객의 주소, 성별, 이름, 나이, 휴대폰 기종, 휴대폰 활용 횟수 등

정보

① 자료를 특정한 목적과 문제해결에 도움이 되도록 가공한 것

② 자료를 처리해서 얻을 수 있는 결과

③ 사용자가 목적하는 값

④ 의사결정을 위한 값

※ 중년층의 휴대폰 기종, 중년층의 휴대폰 활용 횟수

자료처리 시스템의 종류

일괄처리 시스템

① 일정시간이나 일정양의 데이터를 모아 한꺼번에 처리하는 시스템

② 시스템 중심의 자료 처리 방법

③ 테이프와 같은 순차 접근 방법을 사용하는 업무에 적합

④ 단위 시간당 처리하는 작업수가 많으므로 시스템 성능이 높음

※ 급여 계산, 회계 마감업무, 세무 처리

온라인처리 시스템

① 데이터 발생, 데이터 처리 요구 시 즉시 처리하는 시스템
② 사용자 중심의 자료 처리 방법
③ 실시간 처리
④ 통신 제어기 필요

분산처리 시스템

① 분산되어 있는 여러 컴퓨터를 연결하여 논리적으로 하나의 시스템으로 들어 데이터를 처리하는 시스템
② 분산 처리기, 분산 데이터베이스 필요
③ 시스템 구축이 어려운 반면 효용성과 융통성이 높고 시스템 확장이 용이

데이터베이스의 개념

데이터베이스의 등장 배경

① 여러 사용자가 데이터를 공유해야 할 필요가 생김

② 데이터의 수시적인 구조 변경에 대해 응용 프로그램을 매번 수정하는 번거로움을 줄이고 싶음

③ 물리적인 주소가 아닌 데이터 값에 의한 검색을 수행하고 싶음

데이터베이스의 정의

① “논리적으로 연관된 레코드나 파일의 모임”
② “공통 목적을 지원하기 위한 서로 관련된 자료들의 집합체”
③ 데이터베이스는 단순한 자료의 모임이라기 보다는 어떠한 조직 내에서 여러 사람에 의해 공유되어 사용 목적으로 통합적으로 조직되고 관리되는 운영 자료의 집합이다.

데이터베이스의 사전적 정의

한 조직의 여러 응용 시스템이 공유(shared)하기 위해 최소의 중복으로 통합(Integrated), 저장(Stored)된 운영(Operational) 데이터의 집합

① 통합된 데이터(Integrated Data)

원칙적으로 데이터베이스는 똑 같은 데이터가 중복되지 않았음을 의미한다. 데이터의 중복은 일반적으로 여러 부작용을 초래할 수 있다. 그러나 실제로 효율성 때문에 일부 데이터의 중복을 허용하기도 한다.

② 공용 데이터(Shared Data)

한 조직에서 여러 응용 프로그램이 공동으로 소유, 유지 가능한 데이터이다.

③ 운영데이터(Operational Data)

어떤 조직도 그 고유의 기능을 수행하기 위해 반드시 유지해야 할 데이터가 있기 마련인데 이것을 운영 데이터라 한다. 단순한 입출력 데이터나 작업 처리상 일시적으로 필요한 임시 데이터는 운영 데이터로 취급하지 않는다.

④ 저장된 데이터(Stored Data)

책상서랍이나 파일 캐비닛에 들어 있는 데이터가 아니라 컴퓨터가 접근할 수 있는 저장 매체(자기테이프, 디스크)에 저장된 데이터 집합이다.

데이터베이스의 특징

① 실시간 접근성(real-time accessibility)

질의에 대한 실시간 처리 및 응답

② 내용에 의한 참조(content reference)

특정 데이터를 조회, 수정하기 위해서는 실제 저장된 위치나 주소가 아닌 값에 따라 참조함

③ 동시 공유(concurrent sharing)

여러 사용자들은 같은 데이터를 동시에 사용할 수 있어야 함

④ 계속적인 변화(Continuous evolution)

정확한 정보를 제공하기 위해서 최신의 내용으로 계속 갱신, 삽입, 삭제 연산을 통해 이루어짐

데이터베이스의 장˚단점

장점

단점

- 데이터 중복 최소화

- 여러 사용자에 의한 데이터 공유

- 데이터의 일관성

- 데이터의 무결성

- 정확한 최신의 정보이용 가능

- 데이터 처리속도 증가

- 많은 양의 종이 파일 간소화

- 초기 구축 비용이 많이 소요됨 (추가적인 하드웨어 및 DBMS 구입 비용(

- 데이터베이스 전문가 부족

- 시스템이 복잡

- 복잡한 연산으로 고급 인력 필요

- 어려운 백업 및 회복

- 고비용

데이터베이스의 ACID

ACID(원자성, 일관성, 고립성, 지속성)는 데이터베이스 트랜잭션이 안전하게 수행된다는 것을 보장하기 위한 성질을 가리키는 약어이다.

일관성(Consistency)

트랜잭션이 실행을 성공적으로 완료하면 언제나 일관성 있는 데이터베이스 상태로 유지하는 것을 의미한다. 전통적인 데이터베이스 시스템의 일관성은 휘발성 저장장치와 비 휘발성 저장장치 사이의 데이터 유지에 필요하다. 시스템 장애에 따른 휘발성 저장장치에 저장된 데이터와 비 휘발성 저장장치에 저장된 데이터와의 일관성 유지는 안전한 데이터 처리에 중요한 이슈이다.

원자성(Atomicity)

트랜잭션과 관련된 작업들이 부분적으로 실행되다가 중단되지 않는것을 보장하는 능력이다. 예를 들어, 자금 이체는 성공할 수도 실패할 수도 있지만 보내는 쪽에서 돈을 빼 오는 작업만 성공하고 받는 쪽에 돈을 넣는 작업을 실패해서는 안된다. 원자성은 이와 같이 중간 단계까지 실행되고 실패하는 일이 없도록 하는 것이다.

고립성(Isolation)

트랜잭션을 수행시 다른 트랜잭션의 연산 작업이 끼어들지 못하도록 보장하는 것을 의미한다. 이것은 트랜잭션 밖에 있는 어떤 연산도 중간 단계의 데이터를 볼 수 없음을 의미한다.

지속성(Durability)

성공적으로 수행된 트랜잭션은 영원히 반영되어야 함을 의미한다. 시스템 문제, DB 일관성 체크등을 하더라도 유지되어야 함을 의미한다.

'정보처리기사 > 데이터베이스' 카테고리의 다른 글

06. 관계데이터언어(관계대수) (0)	2017.08.01
05. 관계데이터모델 (0)	2017.08.01
04. 정렬, 탐색기법 (0)	2017.08.01
03. 자료구조(선형, 비선형) (0)	2017.08.01
02. DBMS의 기능 (0)	2017.08.01

PREV 1 ···3 4 5 6 NEXT

류프리