RSS(Really Simple Syndication)를 통한 데이터 수집

RSS(Really Simple Syndication)는 다양한 웹 사이트의 콘텐츠를 요약하고 상호 공유 할 수 있도록 만든 XML기반의 간단한 콘텐츠 배급 프로토콜입니다. RSS는 뉴스나 공지 사항과 같이 콘텐츠가 자주 갱신되는 웹 사이트의 정보를 이용자들에게 실시간으로 쉽고 빠르게 제공하기 위해 만들어진 포맷입니다.

 

RSS 제공자는 RSS 피드 (feed)의 형태를 통하여콘텐츠를 배포하고이용자는 RSS 리더 프로그램을 이용하여 RSS 채널을 등록하고 원하는 RSS 피드를 읽을 수 있습니다.

 

[ RSS 네트워크 ]

 

RSS의 네트워크는 3개의 주용한 컴포넌트로 구성이 되어져 있습니다1)컨텐츠 제공자 (Content Provider)는 각 제공 뉴스 정보와 자신의 정보에 관한 RSS 파일을 제공합니다2)수집자 (Content Aggregator)는 다양한 경로를 통해 RSS 정보를 읽거나 수집하는 콘텐츠 수집자 (Content Aggregator)로서 인덱스를 수집하고 그 인덱스를 통해 화제가 되는 특정 뉴스의 헤드라인을 수집하고 제공합니다.  3)헤드라인 뷰어 (Headline Viewer)는 이용자가 RSS 리더 프로그램을 통하여 콘텐츠를 제공 받고 읽을 수 있습니다.

 

 

 

주도적 정보생산을 통한 직접적인 데이터의 수집

마지막 수집 방법으로는 정보생산 주체로부터 직접 데이터를 수집 받는 방법입니다웹사이트 홈페이지를 통하여 설문조사와 같이 사용자로부터 직접 데이터를 수집하는 방법등이 여기에 해당합니다.

 

데이터를 직접 수집의 장점으로는 수집되는 데이터가 명확히 정의되어 있어 활용이 쉽다는 것입니다왜냐하면 기존에 운영중인 데이터베이스에 저장된 데이터를 활용한다는 것은 이미 데이터와 관련된 정보구조를 가지고 데이터를 이미 확보하였기 때문입니다또 다른 장점으로는 데이터 수집 시 수집정보의 동의에 있어서 명확히 사용자의 동의를 받을 수 있다는 점입니다.

+ Recent posts