당신은 주제를 찾고 있습니까 “데이터 압축 – 컴맹도 이해하는 파일 압축의 원리 – [고지식] 거니“? 다음 카테고리의 웹사이트 ppa.maxfit.vn 에서 귀하의 모든 질문에 답변해 드립니다: https://ppa.maxfit.vn/blog/. 바로 아래에서 답을 찾을 수 있습니다. 작성자 코딩하는거니 이(가) 작성한 기사에는 조회수 98,250회 및 좋아요 2,284개 개의 좋아요가 있습니다.
데이터 압축 주제에 대한 동영상 보기
여기에서 이 주제에 대한 비디오를 시청하십시오. 주의 깊게 살펴보고 읽고 있는 내용에 대한 피드백을 제공하세요!
d여기에서 컴맹도 이해하는 파일 압축의 원리 – [고지식] 거니 – 데이터 압축 주제에 대한 세부정보를 참조하세요
고지식 서른세 번 째 영상에서는 파일 압축에 대하여 얘기합니다.
*gunny_oppa : 혓바늘이 났습니다.. 발음이 샐 수도 있습니다.. 하지만 열심히 만들어서 전합니다.. 고맙습니다.. *
영상에서는 압축의 중요성에 관해서 설명을 하고, 파일 압축의 시초라고도 볼 수 있는 모스부호부터 시작하여서, 현재 우리 컴퓨터 안에서 사용하고 있는 다양한 압축 알고리즘으로 발전한 배경에 대해서 이야기 합니다.
또한 영상에서는 널리 알려진 압축 방법들의 원리에 관해서 설명 하는데요,
1. RLE
2. 허프만 부호화(Huffman Coding)
3. LZ 77,78 +
위 세가지 방법 들에 대해서 간단히 설명하고 실제 압축이 이루어지는 방식을 시뮬레이션 하여 보여줍니다.
또한 영상 후반부에는 LZ 알고리즘의 파생 된 압축 형식들에 대해서도 간단히 소개합니다.
이 영상으로 파일 압축의 신비로운 세계를 느껴보세요!
———————————————————
다른 고지식 시리즈도 시청해보세요! https://tinyurl.com/yxbnlb9e
거니 인스타그램 (근황/미리보기) https://tinyurl.com/yyrfqq5l
페이스북 페이지 https://tinyurl.com/y8t5a5au
——————————————————
#압축 #파일압축 #허프만
데이터 압축 주제에 대한 자세한 내용은 여기를 참조하세요.
데이터 압축 – 위키백과, 우리 모두의 백과사전
데이터 압축은 데이터를 더 적은 저장 공간에 효율적으로 기록하기 위한 기술, 또는 그 기술의 실제 적용을 가리킨다. 크게 데이터를 더 작은 크기로 변환시키는 …
Source: ko.wikipedia.org
Date Published: 10/17/2021
View: 971
1단원 – 3. 데이터를 압축해요
반복되는 문자들을 포함하고 있는 데이터의 압축에는 런렝스 부호화 방식이 사용된다. 이 방식에서는 반복되는 단위를 1회만 저장하고, 반복 횟수를 표시한다. 데이터 압축 …
Source: www.nise.go.kr
Date Published: 9/8/2021
View: 6468
빅데이터용 데이터 압축 기술, 저장 방법은? – naver 포스트
압축 알고리즘에는 무손실과 손실의 두 가지 종류가 있다. 무손실 압축은 원래 데이터가 압축 해제될 때 완전히 복구되는 방식으로 빅데이터를 압축한다.
Source: m.post.naver.com
Date Published: 12/21/2022
View: 7222
데이터 압축기법 – 지금 이 순간
압축기법의 요구사항. 3. 데이터 압축. 3.1 Packed Decimal 기법. 3.2 Relative Encoding 기법. 3.3 Character Suppression 기법. 3.4 Huffman 기법.
Source: ensxoddl.tistory.com
Date Published: 10/10/2021
View: 4930
멀티미디어 데이터 압축
저장공간과 전송 대역폭의 효율적 이용을 위해 데이터를 크기. (전체 비트 수)를 줄이는 것. • 데이터 압축 시스템 구조. – 인코더에서 압축을 하고, 디코더에서 복원.
Source: elearning.kocw.net
Date Published: 11/2/2022
View: 3017
데이터 압축 (Compression)
데이터 압축 시 시스템 리소스를 더 사용하고 성능 영향을 미치므로 HDD 기반 스토리지에서는 사용하지 못하고 올플래시 스토리지에 적용하고 있다. 압축 …
Source: performance.tistory.com
Date Published: 9/26/2021
View: 4790
압축기술 (데이터 전송효율을 높이기 위한) – 운바의 IT이야기
압축기술 (데이터 전송효율을 높이기 위한) 1. 압축 기술의 개요 1-1. 개념 – Text, 멀티 미디어(오디오, 영상) 서비스를 위한 효과적 데이터 저장 …
Source: o-m-i.tistory.com
Date Published: 9/18/2021
View: 130
데이터 압축 이해 – Cisco
데이터 압축은 네트워크 링크를 통해 전송할 데이터 프레임의 크기를 줄입니다.프레임 크기를 줄이면 네트워크를 통해 프레임을 전송하는 데 필요한 …
Source: www.cisco.com
Date Published: 3/21/2022
View: 3492
데이터 압축 – IBM
테이블, 인덱스 및 백업 이미지 크기를 줄이기 위해 Db2에 빌드된 압축 기능을 사용하여 데이터에 필요한 스토리지를 줄일 수 있습니다.
Source: www.ibm.com
Date Published: 6/5/2022
View: 5095
압축 – [정보통신기술용어해설]
Compression, Data Compression 압축, 압축력, 데이터 압축, 압축률. (2022-03-01) ; Compressibility, 압축성, Lossy Compression, 손실 압축, Lossless Compression, …
Source: www.ktword.co.kr
Date Published: 12/2/2022
View: 1468
주제와 관련된 이미지 데이터 압축
주제와 관련된 더 많은 사진을 참조하십시오 컴맹도 이해하는 파일 압축의 원리 – [고지식] 거니. 댓글에서 더 많은 관련 이미지를 보거나 필요한 경우 더 많은 관련 기사를 볼 수 있습니다.
주제에 대한 기사 평가 데이터 압축
- Author: 코딩하는거니
- Views: 조회수 98,250회
- Likes: 좋아요 2,284개
- Date Published: 2019. 6. 10.
- Video Url link: https://www.youtube.com/watch?v=v63h5e5wWwc
위키백과, 우리 모두의 백과사전
데이터 압축은 데이터를 더 적은 저장 공간에 효율적으로 기록하기 위한 기술, 또는 그 기술의 실제 적용을 가리킨다.
크게 데이터를 더 작은 크기로 변환시키는 인코딩 과정과 저장된 데이터를 다시 불러와 원래 데이터 형태로 복원시키는 디코딩 과정으로 이루어진다. 이때 인코딩하기 전의 데이터 크기와 인코딩하고 나서의 데이터 크기의 비율을 압축률이라고 한다.
압축 기술의 종류에 따라 데이터의 내용을 바꾸지 않고 원래 내용 그대로 디코딩할 수 있는 무손실 압축과 더 높은 압축률을 얻을 수 있지만 디코딩한 데이터의 세부적인 디테일을 일부 희생시키는 손실 압축이 존재한다. 대표적인 무손실 압축 알고리즘에는 반복 길이 부호화와 허프만 부호화, 산술 부호화 등이 있다. 손실 압축 알고리즘은 인간의 감각 기관의 특성을 역이용하여 압축률을 높이므로, 음성, 정지화상, 동영상 등 데이터의 종류에 따라 각각 다른 알고리즘이 사용된다. MPEG 표준 압축기술이 많이 쓰인다.
압축률 비교 [ 편집 ]
다른 방식의 데이터 압축에 대한 테스트 결과이다. 괄호 안의 숫자는 압축 방식의 순위이다. [1] [2]
.htm, .txt와 같은 텍스트 파일은 압축하기 쉬우며 압축률이 높은 경우가 많다.
이미 압축되어 있는 파일들(.rar, .zip과 같은 알려진 압축파일, .mpg, .mp3, .jpg와 같은 멀티미디어 파일)은 더 이상 압축할 여지가 적기 때문에, 한 번 더 압축할 때에는 용량이 크게 줄어들지 않는다. 그러므로 압축률이 낮다고 할 수 있다. 헤더 데이터가 추가되기 때문에, 파일이 오히려 더 커질 가능성도 있다.
다른 방식의 데이터 압축 비교 파일 *.avi *.dll *.doc *.exe *.gif *.htm *.jpg *.mp3 *.mpg *.pdf *.txt *.wav *.zip 표기 총합 파일 수 16 26 138 24 246 79 44 29 8 36 8 1 19 674 처음 크기 5,261,152 5,254,220 5,254,656 5,254,056 5,246,209 5,261,187 5,246,116 5,250,432 5,257,720 5,257,876 5,253,436 5,256,024 5,262,680 68,315,764 7z 4,524,067 (2) 1,543,179 (3) 147,690 (3) 3,910,541 (3) 4 620 354 (1) 341,996 (4) 4,770,061 (4) 5,053,813 (2) 4,879,067 (5) 4,258,863 (3) 1,270,884 (3) 3,670,225 (5) 5,226,742 (14) 16/20 44,217,482 arj 4,696,659 (9) 2,160,530 (15) 1,018,050 (17) 4,130,505 (11) 4,702,449 (12) 898,370 (17) 4,803,740 (11) 5,108,093 (17) 4,910,699 (16) 4,606,736 (15) 1,875,329 (16) 4,450,535 (12) 5,223,905 (13) 6.1/20 48,585,600 bh 4,703,291 (12) 2,156,986 (12) 1,010,284 (15) 4,128,594 (9) 4,693,021 (9) 889,650 (15) 4,806,914 (13) 5,105,811 (13) 4,904,209 (11) 4,601,545 (13) 1,848,972 (13) 4,451,648 (15) 5,201,639 (4) 7.5/20 48,502,564 bz2 4,720,926 (18) 2,095,832 (7) 573,721 (5) 4,273,885 (18) 4,896,084 (18) 645,243 (5) 4,743,918 (2) 5,069,593 (4) 4,888,293 (7) 4,444,829 (5) 1,531,448 (6) 3,771,508 (7) 5,238,677 (16) 11.7/20 46,893,957 bza 4,639,340 (6) 2,166,940 (17) 987,806 (11) 4,231,254 (17) 4,878,327 (17) 783,188 (8) 4,787,973 (7) 5,076,189 (5) 4,873,810 (2) 4,618,970 (17) 1,516,326 (5) 3,770,938 (6) 5,227,572 (15) 9.8/20 47,558,633 cab 4,701,113 (11) 2,148,386 (10) 893,796 (7) 4,127,044 (8) 4,678,810 (5) 842,129 (10) 4,798,500 (8) 5,099,787 (8) 4,900,314 (10) 4,584,969 (8) 1,846,233 (12) 4,451,857 (18) 5,201,717 (5) 10.8/20 48,274,655 gza 4,703,371 (13) 2,157,116 (13) 1,001,990 (13) 4,126,436 (7) 4,693,136 (10) 874,444 (12) 4,803,739 (10) 5,105,765 (12) 4,904,249 (12) 4,597,720 (11) 1,840,188 (11) 4,451,638 (14) 5,201,436 (3) 9.2/20 48,461,228 j 4,678,506 (8) 1,914,777 (5) 703,722 (6) 4,057,445 (5) 4,681,437 (6) 691,916 (6) 4,805,059 (12) 5,092,070 (7) 4,898,847 (8) 4,326,394 (4) 1,629,228 (8) 3,594,954 (4) 5,215,150 (12) 13/20 46,289,505 jar 4,704,088 (14) 2,158,273 (14) 1,017,205 (16) 4,129,816 (10) 4,705,456 (13) 893,622 (16) 4,809,136 (16) 5,107,254 (15) 4,904,615 (13) 4,603,367 (14) 1,849,394 (14) 4,451,718 (16) 5,202,611 (8) 6.2/20 48,536,555 lha 4,711,090 (16) 2,215,476 (18) 1,020,194 (18) 4,204,071 (15) 4,830,501 (15) 913,845 (18) 4,918,792 (19) 5,206,933 (19) 5,066,716 (19) 4,802,049 (19) 1,895,771 (17) 4,447,253 (10) 5,263,136 (18) 6.7/20 49,495,827 lzh 4,711,090 (16) 2,215,476 (18) 1,066,340 (19) 4,143,461 (14) 4,819,157 (14) 971,166 (19) 4,816,349 (18) 5,107,584 (16) 4,924,974 (18) 4,635,416 (18) 1,945,961 (19) 4,449,756 (11) 5,212,837 (11) 5.3/20 49,019,567 pkz 4,899,083 (20) 2,354,373 (20) 1,173,097 (20) 4,401,289 (20) 5,120,590 (19) 1,018,250 (20) 5,162,114 (20) 5,253,006 (20) 5,203,747 (20) 5,076,577 (20) 2,084,290 (20) 5,027,854 (20) 5,264,213 (19) 0.2/20 52,038,483 rar 4,634,009 (5) 1,693,150 (4) 173,313 (4) 3,948,241 (4) 4,639,881 (4) 318,269 (3) 4,780,095 (6) 5,081 085 (6) 4,887,973 (6) 4,258,775 (2) 1,318,381 (4) 2,657,731 (3) 5,202,579 (7) 15.5/20 43,593,482 rk 4,589,894 (3) 1,474,339 (2) 132,629 (1) 3,866,814 (1) 4,628,017 (3) 257,588 (1) 4,434,701 (1) 5,017,545 (1) 4,787,286 (1) 4,498,992 (6) 1,168,720 (1) 1,659,771 (1) 5,183,337 (1) 18.2/20 41,699,633 rs 4,625,725 (4) 2,137,145 (9) 937,954 (10) 4,221,864 (16) 4,850,493 (16) 768,711 (7) 4,776,635 (5) 5,066,886 (3) 4,878,852 (3) 4,612,537 (16) 1,560,879 (7) 3,804,335 (8) 5,240,116 (17) 10.7/20 47,482,132 sqx 4,662,560 (7) 2,078,866 (6) 991,992 (12) 4,105,933 (6) 4,699,518 (11) 878,469 (14) 4,808,697 (15) 5,102,452 (10) 4,908,341 (14) 4,590,245 (10) 1,836,245 (9) 4,415,575 (9) 5,208,275 (10) 9.8/20 48,287,168 gz 4,707,481 (15) 2,165,409 (16) 907,006 (8) 4,133,949 (12) 4,684,949 (7) 861,638 (11) 4,807,701 (14) 5,105,913 (14) 4,909,789 (15) 4,588,822 (9) 1,853,650 (15) 4,451,792 (17) 5,202,392 (6) 7.8/20 48,380,491 uha 4,498,275 (1) 1,474,005 (1) 136,880 (2) 3,879,360 (2) 4,625,014 (2) 284,363 (2) 4,760,572 (3) 5,104,837 (11) 4,879,047 (4) 4,237,400 (1) 1,233,812 (2) 2,435,124 (2) 5,187,408 (2) 17.3/20 44,736,097 yz1 4,814,935 (19) 2,128,899 (8) 924,706 (9) 4,279,162 (19) 4,686,669 (8) 804,198 (9) 4,810,966 (17) 5,124,596 (18) 4,922,886 (17) 4,568,274 (7) 1,901,300 (18) 4,561,179 (19) 5,207,874 (9) 6.4/20 48,735,644 zip 4,701,064 (10) 2,155,923 (11) 1,009,814 (14) 4,135,619 (13) 5,270,565 (20) 877,679 (13) 4,799,508 (9) 5,101,205 (9) 4,898,961 (9) 4,599,883 (12) 1,839,080 (10) 4,450,719 (13) 5,264,564 (20) 7.5/20 49,104,584 압축 크기
중간값 4,701,089 2,152,155 962,880 4,130,160 4,696,327 851,884 4,803,740 5,103,645 4,902,262 4,593,983 1,839,634 4,448,505 5,210,556 48,519,559 압축률
중간값 10.6 % 59.0 % 81.7 % 21.4 % 10.5 % 83.8 % 8.4 % 2.8 % 6.8 % 12.6 % 65.0 % 15.4 % 1.0 % 29.0 %
위에 나온 것들 가운데 가장 좋은 방식을 세 가지 들면, rk, rar 그리고 7z과 같다. WinRK과 WinRar은 상용 소프트웨어이지만, 7-Zip는 자유 오픈 소스이며 (LGPL 라이선스), 리눅스에서도 동작한다.
같이 보기 [ 편집 ]
3. 데이터를 압축해요
여러분이 공책을 다 쓰게 되면, 공책을 새로 사고 다 쓴 공책은 집에 잘 보관할 수 있다. 그러나 컴퓨터는 데이터 저장 공간을 다 써버리게 되면 여러분처럼 학교 앞 문구점에서 데이터 저장 공간을 사서 사용할 수 있는 것이 아니다. 컴퓨터에서 0과 1을 1비트(bit)라고 하고, 글자 또는 숫자 등은 1비트 8개로 이루어진 1바이트(byte)로 표현한다. 일반적으로 4MB의 메모리를 가지고 있다. 1MB는 백만 바이트이기 때문에 4MB는 4백만 바이트의 저장 공간이 있는 것이다. 많은 저장 공간이 있기는 하지만 컴퓨터는 데이터 저장 공간을 늘 효율적으로 쓰기 위해 노력한다. 모든 정보는 0과 1로 표시되기 때문에 컴퓨터는 데이터를 압축했다가 다시 풀어쓰기를 반복하며 데이터 저장 공간을 효율적으로 사용하고 이 과정에서 데이터의 정보는 달라지지 않는다.
기본적인 데이터 압축 체계는 핵심 단어 부호화 방법을 사용하는데, 영어의 ‘the’와 같이 자주 사용되는 단어를 2바이트의 기호로 변화시키는 것이다. 더 발달된 기술에서는 자주 사용되는 문장 형태들을 분석하고 확인하여 간단한 문자나 기호로 바꾸어준다. 예를 들면, ‘going to’에서 ‘ing to’를 ‘$’로 바꾸어줌으로써 문장 블록의 크기를 상당히 줄일 수 있다. 이러한 압축 기술로, 문자나 기호를 부호화하는데 8비트 미만의 문자열을 사용하고, 가장 자주 쓰이는 문자들은 가장 적은 비트로 나타낼 수 있다. 다양한 길이의 문자열을 사용하는 방법에서 성공적으로 압축을 해독하기 위해서는 문자의 끝을 나타내는 부분을 분명하게 인식할 수 있어야 한다. 허프만(Huffman) 부호화 방식은 가장 널리 사용되는 방법 중 하나이다. 반복되는 문자들을 포함하고 있는 데이터의 압축에는 런렝스 부호화 방식이 사용된다. 이 방식에서는 반복되는 단위를 1회만 저장하고, 반복 횟수를 표시한다.
데이터 압축의 장점으로는 데이터 저장용량을 확대할 수 있고, 팩스나 모뎀을 통한 정보의 전송을 간편하게 해주며, 정보에 담긴 의미를 암호화하거나 숨길 수 있다는 것 등이 있다.
(출처 다음백과)
데이터 압축 (Compression)
데이터 압축 기술 역시 중복 제거 기술과 마찬가지로 AFA (All-flash Array)가 출시되면서 등장하였다.
실제 데이터 사이즈보다 작게 만들어 저장함으로써 디스크 공간을 효율적으로 사용하게 되므로 비용 측면에서 이점을 누릴 수 있다. 데이터 압축 시 시스템 리소스를 더 사용하고 성능 영향을 미치므로 HDD 기반 스토리지에서는 사용하지 못하고 올플래시 스토리지에 적용하고 있다.
압축 종류
무손실 압축 : 압축 후 복원 시 원래대로 파일 복구 (EXE, COM)
손실 압축 : 복원 시 100% 복구되지 않음 (JPEG, GIF, MPEG)
압축 원리 (Run-Length, Lempel-Ziv …)
원래 문자열 : AB AAAAA BCB DDDDDDD ABC
BCB ABC 압축 문자열 : AB A5 BCB D7 ABC
or
BCB ABC or 원래 문자열 : A BCDEF GHIJK BCDEF JKLDM
GHIJK JKLDM 압축 문자열 : ABCDEFGHIJK <10,5> JKLDM
압축률 결정 요소
데이터 타입 (파일 형식)
압축 알고리즘
스토리지 로직
압축 방식
In-line
– 디스크에 쓰기 전 압축하는 방식
– 메모리에서 연산 후 한번만 내려쓰므로 디스크 내구성 증대
– 디스크에 쓰기 전 압축에 따른 응답시간 소모
– 디스크에 쓰기 전 압축하는 방식 – 메모리에서 연산 후 한번만 내려쓰므로 디스크 내구성 증대 – 디스크에 쓰기 전 압축에 따른 응답시간 소모 Post-process
– 우선 디스크에 쓴 후 메모리로 로딩하여 압축하는 방식
– 데이터 쓰기 전 압축 불필요
– 저장된 데이터를 다시 읽어야 하므로 불필요한 IO 발생
압축의 장단점
장점 : 데이터 축소 (용량 효율 증대)
단점 : 처리시간 소요, 리소스 점유
일반적인 데이터 압축률
Use Case Compression Ratio VDI (full clones) 1.3:1 – 1.5:1 VDI (linked clones) 1.3:1 – 1.5:1 Virtual Servers 1.3:1 – 2:1 SQL Server 1.5:1 – 1.8:1 Oracle DB 2.2:1 – 2.5:1
압축률 테스트
아래 표는 여러 파일에 대해 PC에서 Alzip으로 압축 테스트한 결과이다. 이 결과를 통해 세가지 시사하는 바가 있다.
파일별 압축률
첫째, 압축은 시간이 많이 소요된다. (Latency 상승 요인)
둘째, 압축이 잘 되는 파일은 그리 많지 않다.
셋째, 압축은 CPU 자원을 제법 많이 소모한다.
정리
위 결과에서 보듯, 압축은 많은 시간과 CPU 자원을 소모하는 Heavy한 작업이다. 압축률은 파일 형식에 의해 가장 크게 결정되고 Text와 DB 데이터 파일의 압축 효과가 큰 것으로 나타났다.
압축률 역시 중복제거율과 마찬가지로 스토리지별 편차가 크지 않으나, 중복 제거보다는 스토리지 영향이 크다고 할 수 있다. 대부분 어떤 압축 알고리즘을 채택하느냐에 따라 결정될 것이지만, 저마다 공개된 알고리즘 대신 일부 변형하거나 자체 개발한 압축 알고리즘을 사용하기 때문이다. 그리고 압축은 압축률이 높다고 좋은 것만은 아님을 알아야 한다. 압축률을 높이기 위해서는 그만큼 압축 처리시간 소요와 자원 소모가 뒤따르기 때문이다. 제품에 따라 의도적으로 최대의 압축률을 포기하는 (압축률이 다소 낮은 알고리즘을 사용하거나, 압축 효율을 더 낼 수 있음에도 일부 데이터를 압축에서 제외) 경우가 있는데, 이는 압축에 따른 성능 임팩트를 최소화하기 위한 일환이다.
압축은 제품별 성능 임팩트가 다양하므로 그 비율보다는 성능 영향도를 확인하는 것이 더 중요하다고 할 수 있다. 그래서 많은 스토리지의 경우 성능 영향을 최소화하기 위해 압축을 위한 전용 카드를 장착하고 있다. 압축 기능 활성화 시 성능이 얼마나 감소하는지 여부는 꼭 확인해야 할 사항이다.
압축은 중복제거와 함께 비싼 Flash 미디어의 단위 용량당 단가를 낮추기 위한 노력으로 등장하였지만, 압축률은 현실적으로 2:1을 상회하는 경우가 드물다. 왜냐하면, 우선, 스토리지에 압축이 잘 되는 Text 파일의 저장 비중이 높은 경우는 흔치 않으며, 그나마 오라클 데이터 파일이 50% 가량의 압축률을 나타낸다. 결국, Oracle이나 SQL Server와 같은 Database 환경 외에는 실질적인 압축 효과를 누리기는 어렵다고 할 수 있다.
반면, 압축에 따른 Cost 부담은 매우 크다. 응답시간 증가로 인한 IOPS 감소, CPU 자원 사용 증가, 이를 만회하기 위한 전용 하드웨어 추가 (이는 원가 상승으로 이어진다). 즉, 저장 공간 효율성을 얻기 위해 잃는 것도 큰 것이다. 더군다나, 올플래시 초창기 MLC (Multi Level Cell)를 사용하다 3D NAND Flash로 옮겨갔고, 곧 QLC (Quadruple Level Cell)가 대중화되어 가격 부담이 크게 해소되면 굳이 Cost가 많이 드는 압축을 쓸까라는 생각도 든다. 현재로서는 사용 목적이나 비용 편익 등을 고려하여 사용자가 잘 판단해야 할 것이다.
운바의 IT이야기 :: 압축기술 (데이터 전송효율을 높이기 위한)
압축기술 (데이터 전송효율을 높이기 위한)
1. 압축 기술의 개요
1-1. 개념
– Text, 멀티 미디어(오디오, 영상) 서비스를 위한 효과적 데이터 저장공간, 전송을 위해 부피를 줄이고(부호화), 원데이터로 복원(복호화)하는 기술
– 데이터를 더 작은 크기로 변환하는 인코딩, 원래 데이터로 복원하는 디코딩으로 이루어짐
1-2. 데이터 압축의 원리
– 중복제거: 공간적 중복성 (연속되는 공간에서 상관되는 정보들), 시간적 중복성(현재 프레임과 이전 프레임 중 상관되는 정보)
– 크기 축소: 압축률 = 압축 전 비트수 / 압축 후 비트수 >= 1
– 압축 대상 특성 반영 : 텍스트(Run-Length, Huffman), 정지화상(JPEG, GIF, TIFF), 디지털 컨텐츠( MPEG1, MPEG2~4 )
2. 데이터 압축의 분류 및 압축 기법
2-1. 데이터 압축의 분류
1) 무손실 압축 : 복원 후 압축전의 데이터와 완전 일치하는 방법 (Run-Length Coding, Huffman Coding 등)
– 데이터의 통계적 특징 이용 효율적으로 압축 (텍스트, 프로그램, 의료영상)
2) 손실 압축 : 복원 후 압축전의 데이터와 일치 하지 않는 방법 (예측 기법, 변환기법(FFT, DCT, 계층적 기법)
– 연속 매체를 압축하는데 적상 ( 이미지, 사운드, 멀티미디어)
3) 혼합 압축 : 손실압축과 무손실 압축 방법을 모두 사용 (JPEG, MEPG, H.264)
– 영상 압축에서 많이 사용하는 방식, 매우 큰 압축률 (영상)
2-2. 데이터 압축 기법 1) 반복순차 부호화 – 연속길이 부호화 : 반복되는 코드와 개수를 코드로 작성 (영화 동일장면 연속, 음악 한음의 연속적인 구간) – 제로 및 공백 변호나 부호화 : 연속길이 부호화의 특별한 경우로 데이터 스트림에서 제로나 공백 문자는 제거
2) 통계적 부호화 – 허프만 부호화: 빈도수가 높은 코드에 가중치를 부여하여 새롭게 부호의 코드를 설정하는 방법 – 산술 부화화 : 심볼의 표본값과 예측된 표본 값의 차를 부호화 하여 정보량을 감소 시킴
3) 차분/예측 부호화, 변환부호화 등 존재
2-3. 데이터 압축시 장/단점 1) 장점 : 공간 효율화, 시간 효율화, 프로세싱 효율화, 전송 효율화, ILM 실현(정보생명주기관리) 2) 단점 : 자원 사용증가, SW 비용증가, SW 개발 복잡도 증가, 품질 저하 가능성, 효율성 저하 가능
3. 데이터 압축시 고려사항 – 압축수준 : 문자수준, 단어 수준 – 데이터 모델의 유형 선택 고려 : 정적, 적응, 반정적 모델 – 정확한 용도를 파악하여 용도에 알맞는 압축기법 사용
데이터 압축
테이블, 인덱스 및 백업 이미지 크기를 줄이기 위해 Db2®에 빌드된 압축 기능을 사용하여 데이터에 필요한 스토리지를 줄일 수 있습니다.
테이블과 인덱스에는 보통 반복되는 정보가 들어있습니다. 이 반복은 개별 또는 조합된 컬럼 값부터 컬럼 값의 공통 접두부 또는 XML 데이터에서의 반복하는 패턴까지 다양할 수 있습니다. 압축이 제공할 수 있는 절약을 판별하는 데 채택할 수 있는 기능과 함께 테이블 및 인덱스를 저장하는 데 필요한 스페이스를 줄이기 위해 사용할 수 있는 많은 압축 기능이 있습니다.
또한 백업 압축을 사용하여 백업의 크기를 줄일 수도 있습니다.
Db2 에디션에 포함된 압축 기능은 다음과 같습니다. 값 압축
백업 압축 대부분의에디션에 포함된 압축 기능은 다음과 같습니다.
키워드에 대한 정보 데이터 압축
다음은 Bing에서 데이터 압축 주제에 대한 검색 결과입니다. 필요한 경우 더 읽을 수 있습니다.
이 기사는 인터넷의 다양한 출처에서 편집되었습니다. 이 기사가 유용했기를 바랍니다. 이 기사가 유용하다고 생각되면 공유하십시오. 매우 감사합니다!
사람들이 주제에 대해 자주 검색하는 키워드 컴맹도 이해하는 파일 압축의 원리 – [고지식] 거니
- 파일
- 압축
- 원리
- 압축원리
- 알집
- 윈집
- 7zip
- 컴퓨터 압축
- 사진 압축
- 사진
- 비디오
- 비디오 압축
- 거니
- 알고리즘
- 투게더
- 고지식
- 알고투게더
- 허프만
- LZ77
- RLE
- LZ78
- Deflate
- 디플레이트
컴맹도 #이해하는 #파일 #압축의 #원리 #- #[고지식] #거니
YouTube에서 데이터 압축 주제의 다른 동영상 보기
주제에 대한 기사를 시청해 주셔서 감사합니다 컴맹도 이해하는 파일 압축의 원리 – [고지식] 거니 | 데이터 압축, 이 기사가 유용하다고 생각되면 공유하십시오, 매우 감사합니다.