Monday, May 31, 2010

Apa itu Cluster pada Harddisk?

Hard disk atau bisa disebut juga hard drive, fixed disk, HDD, atau cukup hard disk saja, adalah media yang digunakan untuk menyimpan file sistem dan data dalam komputer. Hard disk terdiri atas tiga bagian utama, yaitu:

  1. Piringan magnetik,
  2. Bagian mekanis,
  3. Head untuk membaca data
Piringan tersebut digunakan untuk menyimpan data, sedangkan bagian mekanis bertugas memutar piringan tersebut.
Piringan magnetik disk terdiri dari track dan sector. Track adalah bagian dari disk yang membentuk lingkaran konsentris. Sedangkan sector adalah bagian dari track. Track dan sector ini dibentuk oleh komputer pada saat kita melakukan proses format. 1 (satu) sector = 512 byte. 1 (satu) byte = 8 (delapan) bit. Delapan bit (1 byte) = 1 (satu) karakter/huruf. Jadi 1 sector bisa menampung 512 karakter. Sector-sector tersebut kemudian dikelompokkan ke dalam cluster. Cluster adalah lokasi atau satuan terkecil yang dibutuhkan oleh suatu file. 1 (satu) cluster terdiri dari 2 sector. Jadi 1 cluster = 512 byte (1 sector) x 2 = 1024 byte (1 kilobyte atau biasa disingkat 1 KB). Pada saat kita melihat ukuran suatu file, misalkan sebesar 2 KB, kita tahu persis berapa sector file itu menempati ruang disk. 2 KB = 2 cluster. 2 cluster = 4 sector. Jadi file sebesar 2 KB menempati 4 sector dalam disk.
Pernahkah kalian merasa heran dengan harddisk Anda karena setelah Anda mencoba menghitung sisa kapasitasnya dengan mengurangi kapasitas harddisk dengan jumlah semua ukuran file yang ada di harddisk Anda, ternyata sisa kapasitas harddisk yang ditampilkan di komputer lebih kecil dari hasil penghitungan tadi? Untuk lebih mempermudahnya, kalian bisa coba buka Windows Explorer dan lihat property dari salah satu folder yang ada. Pada baris Size,  Anda akan melihat ada dua macam kapasitas. 

Recover hard drive sectors and clusters



Yang pertama adalah besarnya ukuran dari semua file yang ada pada folder tersebut dalam satuan megabytes dan byte (x,xx MB dan x,xxx,xxx bytes). Kemudian untuk angka yang terakhir menunjukkan besarnya kapasitas harddisk yang digunakan oleh file-file yang ada dalam folder tersebut (x,xxx,xxx bytes used). Coba Anda Bandingkan kedua angka tersebut. Mengapa berbeda? Anda tidak perlu panik. Karena hal ini terjadi pada semua harddisk komputer. Penyebab utamanya adalah sistem penempatan file dalam harddisk yang dikenal dengan FAT (File Allocation Table). Dan FAT menggunakan ukuran cluster yang besar. Sebagai contoh, dalam 1 Gigabyte akan menggunakan cluster berukuran 32KB. Berikut ini tabel ukuran cluster pada FAT dan FAT32 dalam beberapa ukuran harddisk/ partisi: 

Kapasitas Disk/ Ukuran Cluster
partisi (FAT)
128-255MB 4KB
256-511MB 8KB
512-1023MB 16KB
1-2GB 32KB



Kapasitas Disk/ Ukuran Cluster
partisi (FAT32)
Up to 260MB 512 byte
260MB - 8GB 4KB
8-16GB 8KB
16-32GB 16KB
32+ GB 32KB


















Ukuran cluster adalah kelipatan terkecil dari kapasitas harddisk yang harus digunakan oleh sebuah file. Sebagai contoh, jika ukuran cluster adalah 32KB dan Anda menyimpan file berukuran 24KB dalam harddisk, maka file tersebut tetap akan menggunakan kapasitas harddisk sebesar 32KB. Begitu juga jika Anda menyimpan file berukuran 34KB dalam harddisk, file tersebut akan tetap menggunakan kapasitas hardisk sebesar 64KB. Hal ini tentu akan membuang kapasitas harddisk yang besar sekali. Sebagai gambaran misalnya Anda mempunyai harddisk yang telah berisi 10.000 file dan setiap file anggap saja membuang 10KB kapasitas hardisk. Jadi total kapasitas harddisk Anda yang terbuang adalah: 10.000 (file) x 10KB = 100.000KB. Anda bisa lihat sendiri bahwa ini berarti Anda telah kehilangan kapasitas harddisk Anda sebesar 100MB! Jadi, ukuran cluster sangatlah penting jika menginginkan penggunaan kapasitas hardisk yang efisien. Tapi juga perlu diingat bahwa semakin kecil ukuran cluster, maka komputer juga akan
semakin lama dalam proses membaca harddisk. karena semakin banyak bagian yang harus dibacanya. 




Struktur dari sebuah cakram penyimpanan data:
(A) track
(B) sektor geometris
(C) track sector
(D) cluster

 




 Cluster, atau allocation unit (unit alokasi) dalam beberapa sistem berkas (file system) dan pengorganisasian disk, seperti File Allocation Table dalam sistem operasi MS-DOS dan NTFS dalam Windows NT merujuk kepada kumpulan sektor media penyimpanan yang digunakan oleh sistem operasi sebagai sebuah kesatuan, yang dapat digunakan untuk menyimpan informasi di dalam berkas atau direktori. Cluster dimaksudkan untuk mengurangi keborosan dalam melakukan manajemen terhadap struktur data di dalam hard disk, sehingga sistem berkas tidak akan mengalokasikan sektor disk fisik, tetapi sekumpulan sektor yang saling bedekatan.

Ukuran cluster bervariasi, tergantung format sistem berkas yang digunakan dan juga kapasitas media penyimpanan (atau kapasitas partisi). Umumnya, sebuah cluster terdiri dari 1 sektor hingga 128 sektor. Untuk sebuah cakram yang menggunakan sektor dengan ukuran 512 bytes, sebuah cluster berukuran 512 byte akan memakan satu buah sektor, sementara cluster 4 kilobyte akan memakan 8 sektor.

Semakin besar ukuran cluster, maka semakin cepat proses transfer data yang dapat dilakukan, dan berlaku sebaliknya, karena memang sistem operasi menganggap sektor sebanyak itu sebagai satu kesatuan (daripada menggunakan sektor-sektor yang kecil). Meskipun demikian, semakin besar ukuran cluster dapat menyebabkan fragmentasi internal dan banyaknya ruangan yang terbuang (khususnya jika digunakan untuk menyimpan berkas-berkas yang kecil dalam jumlah yang besar), jika dibandingkan dengan ukuran cluster yang kecil; ruangan yang terbuang tersebut dinamakan juga dengan slack space. Semakin kecil ukuran cluster, maka semakin efisien penggunaan ruangan media penyimpanan, persentase fragmentasi yang lebih rendah, meski mengakibatkan dengan kinerja yang kurang begitu bagus.

Beberapa desain sistem berkas dengan ukuran cluster yang kecil (seperti halnya NTFS dari keluarga sistem operasi Windows NT) menggunakan memori cache tambahan yang dapat meningkatkan kinerja sistem berkas tersebut, dengan tetap mempertahankan ukuran cluster yang relatif kecil. Sistem berkas NTFS, dengan hanya menggunakan ukuran cluster 4 KB (8 sektor), dapat mengalamati hingga 16 Terabyte; bandingkan dengan FAT32, yang menggunakan ukuran cluster 32 KB (64 sektor), hanya dapat mengalamati hingga 2 Terabyte saja.

Penentuan ukuran cluster dapat dilakukan saat pemformatan dilakukan, meski hal ini kurang disarankan (sistem operasi akan menentukan ukuran cluster secara otomatis berdasarkan kapasitas media penyimpanan). Dalam keluarga sistem operasi Windows NT, utilitas command-line format atau snap-in MMC Disk Management (pada Windows 2000 ke atas) dapat melakukannya.

Beberapa satuan standar transfer data yang sering dipergunakan dalam jaringan komputer adalah :
Bit:
Bit adalah ukuran terkecil data dalam sebuah komputer. Bit biasanya hanyalah merupakan pilihan antara 0 dan 1. Dimana 0 biasanya berarti ‘Off’ dan 1 berarti ‘On’. Pada akhirnya komputer akan mengkombinasikan kedua pilihan tersebut menjadi format digital yang lebih kompleks untuk merepresentasikan data. istilah Bit mulai diperkenalkan oleh seorang statistik terkenal John Tukey pada tahun 1946.

bps:
bit per second. Jumlah bit yang ditransfer dalam satu detik.

kbps:
kilo bits per second. Jumlah kilobits yang ditransfer dalam satu detik.
1 kbps = 1 x 10^3 bit/second = 1000 bit/second.

Byte:
Byte adalah merupakan kumpulan beberapa bit (1 Byte = 8 bit ). Byte biasanya merepresentasikan sebuah karakter (Misalkan seperti A, ?, -, dll). Karakter ini bisa berupa huruf, angka ataupun simbol tertentu.

Bps:
Byte per second. Jumlah byte yang ditransfer dalam satu detik.

KBps:
Kilo Byte per second. Jumlah KiloByte yang ditransfer dalam satu detik.
1 KBps = 1 x 2^10 byte/second = 1,024 byte/second

bit mempergunakan satuan desimal oleh sebab itu :

1 kilobit = 1 x 10^3 bit = 1000 bit

sedangkan byte mempergunakan satuan biner, oleh sebab itu :

1 KiloByte = 1 x 2^10 = 1024 Byte.

Berikut ini satuan Byte lainnya:

1 byte = 8 bits
1 kilobyte (K / KB) = 2^10 bytes = 1,024 bytes
1 megabyte (M / MB) = 2^20 bytes = 1,048,576 bytes
1 gigabyte (G / GB) = 2^30 bytes = 1,073,741,824 bytes
1 terabyte (T / TB) = 2^40 bytes = 1,099,511,627,776 bytes
1 petabyte (P / PB) = 2^50 bytes = 1,125,899,906,842,624 bytes
1 exabyte (E / EB) = 2^60 bytes = 1,152,921,504,606,846,976 bytes

Huruf "K" (huruf k besar) dipergunakan untuk satuan KiloByte, sedangkan
huruf "k" (huruf k kecil) untuk satuan kilobit.

Contoh perhitungan Byte dan Bit.
Misalkan anda memiliki sebuah file yang terdiri dari 100.000 kata dan anda ingin tahu berapa lama kita bisa mendownload file tersebut melalui internet yang memiliki koneksi 33.600 bps.
  • Asumsikan dalam setiap kata terdiri dari 5 huruf/karakter. Berarti jika ada 100.000 kata, maka anda memiliki 500.000 huruf/karakter
  • Setiap karakter terdiri dari 1 Byte, berarti anda memiliki 500.000 Byte
  • Setiap Byte terdiri dari 8 bit, berarti 500.000 Byte yang anda miliki bernilai 500.000 x 8 = 4.000.000 bit
  • Selanjutnya 4.000.000 bit yang anda miliki dibagi dengan 33.600 = 119 detik
  • Artinya waktu anda untuk mendownload file yang memiliki 100.000 kata kurang lebih 119 detik (2 menit) dengan kecepatan akses 33.600 bps
Dalam jaringan komputer, biasanya Byte dan bit dipakai utk menggambarkan kecepatan transfer/download data.

Satuan KBps (KiloByte/second) dipakai jika data di sini secara umum memakai Byte untuk satuannya (contohnya seperti protokol-protokol yang ada pada level aplikasi seperti http,ftp,smtp,dsb).

Sedangkan kbps (kilobit/second) dipakai jika data yang ditransfer memakai bit untuk satuannya (contohnya adalah protokol-protokol layer 2 ke bawah seperti ethernet yang mentransfer data dalam frame-frame).

Itu sebabnya kecepatan sebuah modem tertulis = 33.6 kb/s (karena modem termasuk dalam protokol layer 2 kebawah seperti halnya ethernet), sedangkan saat kita mendownload sebuah file, maka browser akan memperlihatkan (misal) 3 KB/s (karena browser terkoneksi dengan protokol http/ftp).
System EBCDIC
EBCDIC (Extended Binary Coded Decimal Interchange Code) menggunakan 8-bit guna menyajikan data yang ada. Dengan adanya 8-bit ini, tentu saja jumlah data yang disajikan menjadi lebih besar, yaitu sebanyak 28 atau 256 kombinasi. 4 karakter yang berada disebelah kiri disebut sebagai zone-bits, dan 4 karakter sisanya disebut sebagai numerik bits. Kode-kode ini banyak digunakan oleh komputer IBM ataupun peralatan yang menggunakan standart IBM. 

System ASCII
ASCII (American Standart Code for Information Interchange), menggunakan 7-bit guna menyajikan beberapa data. Sistem ini digunakan oleh beberapa pabrik komputer secara bersama-sama sehingga menghasilkan suatu standart yang baku untuk semua jenis komputer. Walaupun ASCII menggunakan kode 7-bit , tetapi dalam pelaksanaannya tetaplah 8-bit yang digunakan. Sebab masih menggunakan extra bit yang digunakan untuk mendeteksi pelbagai kesalahan yang timbul. 

NB : Kenapa 1 Byte = 8 bit?
Pertama, saat masih jaman punch card (kartu berlubang). Kedua, saat jaman pertama munculnya teknologi prosesor yang berbasis 8 bit.

Cerita pertama. Punch card teknologi terakhir mampu menangani karakter sejumlah 64 karakter dimana tiap karakter dikodekan dalam susunan 8 kombinasi lubang. IBM, selaku produsen mesin punch card, menyebut kombinasi 8 lubang tsb dengan ‘byte’ yang katanya semakna dengan ‘octet’. Meskipun begitu, kombinasinya masih belum dalam format ASCII karena waktu itu memang belum ada standarisasi ASCII.

Cerita kedua, lanjutan dari cerita pertama. Teknologi punch card ini kemudian berkembang menjadi teknologi prosesor yang saat itu baru mampu bekerja dalam kombinasi biner 8 digit. Maka diadopsilah kombinasi 8 lubang punch card ke dalam biner 8 digit yang semakin ‘menguatkan’ istilah ‘byte’.

Demikianlah, akhirnya ‘byte’ kemudian dipake sebagai satuan 8 digit biner. Sehingga walaupun teknologi prosesor berkembang hingga mampu bekerja dalam 16 digit, tetap disebut sebagai 2 byte.

Kemudian, sekedar menambah informasi. Karakter ada dua jenis, yaitu singlecode character dan unicode character. Keterbatasan standar ASCII yang hanya mengenali sejumlah 256 karakter tidak lagi mencukupi kebutuhan perkembangan IT yang semakin mendunia. Pada awalnya, hal ini diatasi dengan mengembangkan character encoding yang memetakan ulang 256 karakter untuk wilayah2 tertentu. Misalnya, di Asia karakter ke-60 adalah ‘A’, tapi di Eropa karakter ke-60 adalah ‘À’. Tapi ini jadi masalah saat tulisan Eropa (dengan encoding Eropa) mau dibaca di Asia (dengan encoding Asia) karena tulisannya jadi kacau balau. Karena itu dikembangkanlah standar baru yang disebut unicode character dimana satu karakter tidak lagi diwakili 1 byte, melainkan 2 byte.


No comments: