Kompresi informasi. Kompresi Informasi Prinsip Kompresi Informasi

Zat apa pun di bawah pengaruh tekanan eksternal dapat dikompresi, yaitu, ia akan mengubah volumenya ke satu derajat atau lainnya. Jadi, gas dengan peningkatan tekanan dapat sangat mengurangi volumenya. Fluida tunduk pada perubahan volume dengan perubahan tekanan eksternal pada tingkat yang lebih rendah. Kompresibilitas padatan bahkan lebih kecil. Kompresibilitas mencerminkan ketergantungan sifat fisik suatu zat pada jarak antara molekulnya (atom). Kompresibilitas ditandai dengan rasio kompresi (Sama seperti: rasio kompresibilitas, rasio kompresi, rasio ekspansi elastis volumetrik).

DEFINISI

Rasio kompresi Adalah besaran fisika yang sama dengan perubahan relatif volume dibagi dengan perubahan tekanan yang menyebabkan perubahan volume suatu zat.

Ada berbagai sebutan untuk rasio kompresi, paling sering huruf atau. Dalam bentuk formula, rasio kompresi ditulis sebagai:

di mana tanda minus mencerminkan fakta bahwa peningkatan tekanan menyebabkan penurunan volume dan sebaliknya. Dalam bentuk diferensial, koefisien didefinisikan sebagai:

Volume terkait dengan kerapatan zat, oleh karena itu, untuk proses perubahan tekanan pada massa konstan, Anda dapat menulis:

Nilai rasio kompresi tergantung pada sifat zat, suhu dan tekanannya. Selain semua hal di atas, rasio kompresi tergantung pada jenis proses di mana tekanan berubah. Jadi, dalam proses isotermal, rasio kompresi berbeda dari rasio kompresi dalam proses adiabatik. Rasio kompresi isotermal didefinisikan sebagai:

di mana adalah turunan parsial di T = const.

Rasio kompresi adiabatik dapat ditemukan sebagai:

di mana adalah turunan parsial pada entropi konstan (S). Untuk padatan, faktor kompresibilitas isotermal dan adiabatik sangat sedikit berbeda dan perbedaan ini sering diabaikan.

Terdapat hubungan antara koefisien kompresibilitas adiabatik dan isotermal, yang dicerminkan oleh persamaan:

di mana dan adalah kapasitas panas pada volume dan tekanan konstan.

Unit Rasio Kompresi

Satuan ukuran dasar SI untuk faktor kompresibilitas adalah:

Contoh pemecahan masalah

CONTOH 1

Rasio kompresi adalah karakteristik utama dari algoritma kompresi. Ini didefinisikan sebagai rasio volume data asli yang tidak terkompresi dengan volume data terkompresi, yaitu:, di mana k- rasio kompresi, S o adalah jumlah data awal, dan S c - volume terkompresi. Dengan demikian, semakin tinggi rasio kompresi, semakin efisien algoritmanya. Perlu dicatat:

    jika k= 1, maka algoritme tidak memampatkan, yaitu, pesan keluaran sama volumenya dengan masukan;

    jika k< 1, то алгоритм порождает сообщение большего размера, нежели несжатое, то есть, совершает «вредную» работу.

Situasi dengan k< 1 вполне возможна при сжатии. Принципиально невозможно получить алгоритм сжатия без потерь, который при любых данных образовывал бы на выходе данные меньшей или равной длины. Обоснование этого факта заключается в том, что поскольку число различных сообщений длинойn bit tepat 2 n, jumlah pesan yang berbeda dengan panjang kurang dari atau sama dengan n(jika ada setidaknya satu pesan yang lebih pendek) akan kurang dari 2 n... Ini berarti bahwa tidak mungkin untuk secara jelas mencocokkan semua pesan asli dengan pesan terkompresi: beberapa pesan asli tidak akan memiliki representasi terkompresi, atau beberapa pesan asli akan sesuai dengan pesan terkompresi yang sama, yang berarti mereka tidak dapat dibedakan. Namun, bahkan ketika algoritme kompresi meningkatkan ukuran data asli, mudah untuk memastikan bahwa ukurannya tidak dapat dijamin meningkat lebih dari 1 bit. Kemudian, bahkan dalam kasus terburuk, ketidaksetaraan akan terjadi: Ini dilakukan sebagai berikut: jika jumlah data terkompresi kurang dari aslinya, kembalikan data terkompresi dengan menambahkan "1" ke dalamnya, jika tidak, kami mengembalikan data asli dengan menambahkan "0" ke mereka). Contoh bagaimana ini diimplementasikan dalam pseudo-C ++ ditunjukkan di bawah ini:

bin_data_t __compess (input bin_data_t) // bin_data_t adalah tipe data yang berarti urutan bit yang berubah-ubah dengan panjang variabel

bin_data_t output = lengkungan (input); // function bin_data_t arch (input bin_data_t) mengimplementasikan beberapa algoritma kompresi data

jika (keluaran.ukuran ()

output.add_begin (1); // function bin_data_t :: add_begin (bool __bit__) menambahkan sedikit sama dengan __bit__ ke awal urutan

kembali keluaran; // kembalikan urutan terkompresi dengan "1" ditambahkan

else // sebaliknya (jika jumlah data terkompresi lebih besar atau sama dengan jumlah data asli)

input.add_begin (0); // tambahkan "0" ke urutan aslinya

kembali masukan; // kembalikan file asli dengan menambahkan "0"

Rasio kompresi dapat berupa konstan (beberapa algoritma untuk mengompresi audio, gambar, dll., misalnya, A-law, -law, ADPCM, truncated block coding), atau variabel. Dalam kasus kedua, dapat ditentukan baik untuk setiap pesan tertentu, atau dinilai menurut beberapa kriteria:

    rata-rata (biasanya pada beberapa kumpulan data pengujian);

    maksimum (kasus kompresi terbaik);

    minimal (kompresi kasus terburuk);

atau terserah. Rasio kompresi lossy dalam hal ini sangat tergantung pada kesalahan kompresi yang diizinkan atau kualitas, yang biasanya bertindak sebagai parameter algoritma. Secara umum, hanya teknik kompresi data lossy yang dapat memberikan rasio kompresi yang konstan.

Kriteria utama untuk membedakan antara algoritma kompresi adalah ada atau tidak adanya kerugian yang dijelaskan di atas. Secara umum, algoritma kompresi lossless bersifat universal dalam arti bahwa penggunaannya pasti memungkinkan untuk semua jenis data, sedangkan kemungkinan menggunakan kompresi lossy harus dibenarkan. Untuk beberapa jenis data, distorsi umumnya tidak dapat diterima. Diantara mereka

    data simbolik, perubahan yang tak terhindarkan mengarah pada perubahan semantiknya: program dan kode sumbernya, array biner, dll.;

    data vital, perubahan yang dapat menyebabkan kesalahan kritis: misalnya, diperoleh dari peralatan pengukur medis atau perangkat kontrol pesawat, pesawat ruang angkasa, dll.;

    Data antara berulang kali mengalami kompresi dan pemulihan selama pemrosesan multi-tahap data grafik, audio, dan video.

Prinsip kompresi informasi

Setiap metode kompresi informasi didasarkan pada model sumber informasi, atau, lebih khusus lagi, model redundansi. Dengan kata lain, untuk mengompresi informasi, beberapa informasi digunakan tentang jenis informasi apa yang sedang dikompresi - tanpa memiliki informasi apa pun tentang informasi tersebut, sama sekali tidak ada asumsi yang dapat dibuat tentang transformasi mana yang akan mengurangi volume pesan. Informasi ini digunakan dalam proses kompresi dan dekompresi. Model redundansi juga dapat dibangun atau diparameterisasi selama tahap kompresi. Metode yang memungkinkan perubahan model redundansi informasi berdasarkan data input disebut adaptif. Non-adaptif biasanya merupakan algoritma spesifik yang digunakan untuk bekerja dengan karakteristik yang terdefinisi dengan baik dan tidak berubah. Sebagian besar dari algoritma yang cukup universal adaptif untuk satu derajat atau yang lain.

Setiap metode kompresi informasi mencakup dua konversi terbalik satu sama lain:

  • konversi kompresi;
  • konversi ekspansi.

Transformasi kompresi memberikan pesan terkompresi dari aslinya. Dekompresi memastikan bahwa pesan asli (atau perkiraannya) diperoleh dari pesan terkompresi.

Semua metode kompresi dibagi menjadi dua kelas utama

  • tidak ada kerugian,
  • dengan kerugian.

Perbedaan mendasar antara keduanya adalah bahwa kompresi lossless memberikan kemampuan untuk secara akurat merekonstruksi pesan asli. Kompresi lossy memungkinkan Anda untuk mendapatkan hanya beberapa perkiraan dari pesan asli, yaitu berbeda dari aslinya, tetapi dalam beberapa kesalahan yang telah ditentukan. Kesalahan ini harus ditentukan oleh model lain - model penerima, yang menentukan data mana dan dengan akurasi apa yang disajikan kepada penerima, dan mana yang dapat dibuang.

Karakteristik dan Penerapan Algoritma Kompresi

Rasio kompresi

Rasio kompresi adalah karakteristik utama dari algoritma kompresi, yang mengekspresikan kualitas utama yang diterapkan. Ini didefinisikan sebagai rasio ukuran data yang tidak dikompresi dengan yang dikompresi, yaitu:

k = S o / S C,

di mana k- rasio kompresi, S o adalah ukuran data yang tidak terkompresi, dan S c - ukuran terkompresi. Jadi, semakin tinggi rasio kompresi, semakin baik algoritmanya. Perlu dicatat:

  • jika k= 1, maka algoritma tidak memampatkan, yaitu menerima pesan output dengan ukuran yang sama dengan input;
  • jika k < 1, то алгоритм порождает при сжатии сообщение большего размера, нежели несжатое, то есть, совершает «вредную» работу.

Situasi dengan k < 1 вполне возможна при сжатии. Невозможно получить алгоритм сжатия без потерь, который при любых данных образовывал бы на выходе данные меньшей или равной длины. Обоснование этого факта заключается в том, что количество различных сообщений длиной n Pola: E: bit persis 2 n... Maka jumlah pesan yang berbeda dengan panjang kurang dari atau sama dengan n(jika ada setidaknya satu pesan yang lebih pendek) akan kurang dari 2 n... Ini berarti bahwa tidak mungkin untuk secara jelas mencocokkan semua pesan asli dengan pesan terkompresi: beberapa pesan asli tidak akan memiliki representasi terkompresi, atau beberapa pesan asli akan sesuai dengan pesan terkompresi yang sama, yang berarti mereka tidak dapat dibedakan.

Rasio kompresi dapat berupa rasio konstan (beberapa algoritma kompresi untuk suara, gambar, dll., misalnya, A-law, -law, ADPCM), atau variabel. Dalam kasus kedua, dapat ditentukan baik untuk pesan tertentu, atau dinilai menurut beberapa kriteria:

  • rata-rata (biasanya pada beberapa kumpulan data pengujian);
  • maksimum (kasus kompresi terbaik);
  • minimal (kompresi kasus terburuk);

atau lainnya. Rasio kompresi lossy dalam hal ini sangat tergantung pada kesalahan kompresi yang diizinkan atau kesalahannya kualitas, yang biasanya bertindak sebagai parameter algoritma.

Toleransi kerugian

Kriteria utama untuk membedakan antara algoritma kompresi adalah ada atau tidak adanya kerugian yang dijelaskan di atas. Secara umum, algoritma kompresi lossless serbaguna dalam arti bahwa mereka dapat diterapkan pada semua jenis data, sedangkan penggunaan kompresi loss harus dibenarkan. Beberapa jenis data tidak mentolerir segala jenis kehilangan:

  • data simbolik, perubahan yang tak terhindarkan mengarah pada perubahan semantiknya: program dan kode sumbernya, array biner, dll.;
  • data vital, perubahan yang dapat menyebabkan kesalahan kritis: misalnya, diperoleh dari peralatan pengukur medis atau perangkat kontrol pesawat, pesawat ruang angkasa, dll.
  • data berulang kali mengalami kompresi dan dekompresi: grafik, suara, file video yang berfungsi.

Namun, kompresi lossy memungkinkan Anda mencapai rasio kompresi yang jauh lebih tinggi dengan membuang informasi tidak penting yang tidak terkompresi dengan baik. Jadi, misalnya, algoritme kompresi audio lossless FLAC memungkinkan dalam banyak kasus untuk mengompresi audio 1,5-2,5 kali, sedangkan algoritme Vorbis lossy, tergantung pada parameter kualitas yang disetel, dapat mengompresi hingga 15 kali dengan tetap mempertahankan kualitas yang dapat diterima.

Persyaratan sistem algoritma

Algoritme yang berbeda mungkin memerlukan jumlah sumber daya sistem komputasi yang berbeda di mana mereka dieksekusi:

  • memori akses acak (untuk data perantara);
  • memori permanen (untuk kode program dan konstanta);
  • waktu prosesor.

Secara umum, persyaratan ini tergantung pada kompleksitas dan "kecerdasan" dari algoritma. Sebagai tren umum, semakin baik dan semakin serbaguna algoritme, semakin banyak tuntutan yang dibuatnya pada mesin. Namun, dalam kasus tertentu, algoritme sederhana dan ringkas mungkin berkinerja lebih baik. Persyaratan sistem menentukan kualitas konsumennya: semakin sedikit tuntutan suatu algoritme, semakin sederhana dan, oleh karena itu, sistem yang ringkas, andal, dan murah yang dapat digunakannya.

Karena algoritma kompresi dan dekompresi bekerja berpasangan, rasio persyaratan sistem terhadapnya juga penting. Anda sering dapat memperumit satu algoritma, Anda dapat sangat menyederhanakan yang lain. Dengan demikian, kita dapat memiliki tiga opsi:

Algoritma kompresi jauh lebih menuntut sumber daya daripada algoritma dekompresi. Ini adalah hubungan yang paling umum, dan ini terutama berlaku dalam kasus di mana data yang dikompresi akan digunakan beberapa kali. Contohnya termasuk pemutar audio dan video digital. Algoritma kompresi dan dekompresi memiliki persyaratan yang kurang lebih sama. Pilihan yang paling dapat diterima untuk jalur komunikasi, ketika kompresi dan dekompresi terjadi sekali di kedua ujungnya. Misalnya, itu bisa berupa telepon. Algoritma kompresi secara signifikan kurang menuntut daripada algoritma dekompresi. Kasus yang cukup eksotis. Ini dapat digunakan dalam kasus di mana pemancar adalah perangkat ultra-portabel, di mana jumlah sumber daya yang tersedia sangat penting, misalnya, pesawat ruang angkasa atau jaringan sensor terdistribusi besar, atau dapat membongkar data yang diperlukan dalam persentase kasus yang sangat kecil, misalnya, merekam kamera CCTV.

Lihat juga


Yayasan Wikimedia. 2010.

Lihat apa itu "Kompresi Informasi" di kamus lain:

    kompresi informasi- konsolidasi informasi - [L.G. Sumenko. Kamus Bahasa Inggris Rusia Teknologi Informasi. M .: GP TsNIIS, 2003.] Topik teknologi informasi secara umum Sinonim pemadatan informasi EN pengurangan informasi ...

    KOMPRESI INFORMASI- (kompresi data) penyajian informasi (data) dalam bit yang lebih sedikit dari aslinya. Berdasarkan menghilangkan redundansi. Bedakan S. dan. tanpa kehilangan informasi dan dengan hilangnya beberapa informasi yang tidak signifikan untuk tugas yang sedang diselesaikan. KE… … Kamus Ensiklopedis Psikologi dan Pedagogi

    kompresi lossless adaptif- - [L.G. Sumenko. Kamus Bahasa Inggris Rusia Teknologi Informasi. Moskow: GP TsNIIS, 2003.] Topik teknologi informasi secara umum EN kompresi data lossless adaptifALDC ... Panduan penerjemah teknis

    kompresi / kompresi informasi- - [L.G. Sumenko. Kamus Bahasa Inggris Rusia Teknologi Informasi. M .: GP TsNIIS, 2003.] Topik teknologi informasi secara umum EN pemadatan ... Panduan penerjemah teknis

    kompresi informasi digital- - [L.G. Sumenko. Kamus Bahasa Inggris Rusia Teknologi Informasi. M .: GP TsNIIS, 2003.] Topik teknologi informasi secara umum kompresi EN ... Panduan penerjemah teknis

    Suara adalah gelombang sederhana, dan sinyal digital adalah representasi dari gelombang itu. Ini dicapai dengan menyimpan amplitudo sinyal analog beberapa kali dalam satu detik. Misalnya, dalam CD biasa, sebuah sinyal diingat 44.100 kali di ... ... Wikipedia

    Sebuah proses yang mengurangi jumlah data dengan mengurangi redundansi. Kompresi data melibatkan pemadatan potongan data berukuran standar. Perbedaan dibuat antara kompresi lossy dan lossless. Dalam bahasa Inggris: Data ... ... Kosakata keuangan

    kompresi peta digital- Pemrosesan informasi kartografi digital untuk mengurangi volumenya, termasuk penghapusan redundansi dalam akurasi penyajian yang diperlukan. [GOST 28441 99] Topik Kartografi digital Menggeneralisasi istilah metode dan teknologi ... ... Panduan penerjemah teknis

Tampilan

Olahraga Biarkan sebuah kubus padat dengan sisi yang sama dengan itu mengalami tekanan serba. Dalam hal ini, sisi kubus dikurangi. Nyatakan rasio kompresi sebuah kubus jika tekanan yang diberikan padanya berubah terhadap tekanan awal sebesar
Larutan Mari kita membuat gambar.


Sesuai dengan definisi rasio kompresi, kami menulis:

Karena perubahan sisi kubus yang disebabkan oleh tekanan adalah sama, volume kubus setelah kompresi () dapat direpresentasikan sebagai:

Oleh karena itu, kami menulis perubahan relatif volume sebagai:

Jumlahnya kecil, jadi kami berasumsi bahwa sama dengan nol, maka kita dapat mengasumsikan bahwa:

Mengganti perubahan relatif volume dari (1.4) ke dalam rumus (1.1), kita mendapatkan:

Menjawab