DATA,
KEGUNAAN DAN FUNGSINYA.
Anda sebagai individu, seorang manajer, atau mungkin seorang pengusaha, menginginkan untuk:
v Mengetahui siapa saja yang akan pensiun tahun depan, dari bagian mana, apa jabatannya, berapa pesangon yang akan didapat, dan sebagainya. Tujuannya adalah antara lain:
• Mempersiapkan dana, berapa besarnya untuk pembayaran pesangon mereka.
• Mempersiapkan penerimaan karyawan baru untuk mengganti karyawan yang bakal pensiun tersebut (walaupun tidak semua).
Untuk maksud tersebut, Anda memerlukan data berupa data pegawai, yang mungkin cukup didapat dari dalam perusahaan sendiri.
v Mengetahui tingkat kepuasan konsumen produk yang anda pasarkan, bagaimana respon mereka terhadap mutu produk Anda, harga, pelayanan dan sebagainya. Untuk inipun, Anda perlu data, malah mungkin data tersebut perlu dikumpulkan di lapangan melalui survei (terlepas dari apakah dilakukan sendiri atau dengan membayar lembaga riset yang Anda percayai).
v Mengetahui apakah proses produksi saat ini masih terkendali atau tidak. Berapa persen dari produksi yang tertolak karena dianggap cacat, lengkap dengan perinciannya per mesin, per lokasi, kapan, mengapa dan lain-lain. Untuk inipun, Anda memerlukan data (yang didapat dari bagian produksi).
v Mengetahui perkembangan perekonomian (trend) untuk jangka waktu tertentu, pertumbuhan penduduk penduduk, pendapatan nasional dan sebagainya . Termasuk juga mengetahui faktor-faktor atau variabel yang mempengaruhi pertumbuhan ekonomi.
Dari contoh-contoh tersebut diatas, kita mengetahui betapa pentingnya data. Dengan data, kita mengetahui gambaran perusahaan sekarang, masalah apa yang sedang dihadapi, mengapa terjadi masalah-masalah tersebut, bagaimana cara pemecahannya. Dengan data, kita dapat meramal atau memperkirakan, apa yang kira-kira bakal terjadi di masa mendatang. Dengan data, kita pun bisa membuat perencanaan, peramalan, mengontrol pelaksanaan, mengevaluasi target apakah tercapai atau tidak, dan sebagainya. Dengan adanya data, kita dapat banyak mengetahui tentang berbagai hal. Dengan data, kita bisa mengambil keputusan-keputusan, kebijakan-kebijakan perusahaan, dan sebagainya. Pendeknya, fungsi dan manfaat data sangat penting dan banyak sekali. Sering kali, akan berbahaya jika kita mengambil kesimpulan dan keputusan tanpa didukung oleh data. Orang bilang ”Speak with data”, berbicaralah dengan data agar objektif dan lebih akurat. Sebenarnya apa itu data?
PENGERTIAN DATA DAN PENGGOLONGANNYA
Dari uraian di atas, sebenarnya data adalah kumpulan keterangan atau informasi yang diperoleh dari suatu pengamatan, dapat berupa angka, lambang atau sifat. Jika kita mendapatkan data yang tidak baik, sebaik apa pun cara pengolahan data yang kita lakukan, hasilnya atau kesimpulan yang didapat dari data tersebut tetap tidak baik. Semisal, ungkapan ”garbage in, garbage out”, yang artinya jika yang masuk sampah, yang keluar pun juga sampah. Jadi, syarat utama agar analisa data secara statistik menghasilkan informasi atau kesimpulan yang baik adalah data yang diolah haruslah juga baik.
Apa itu data yang baik? Data yang baik adalah data yang sifatnya representatif (mewakili), objektif (sesuai dengan apa yang ada atau yang terjadi), relevan (ada hubungannya dengan persoalan yang sedang dihadapi dan akan dipecahkan), mempunyai tingkat ketelitian yang tinggi atau standard error (kesalahan baku) yang kecil.
Dari mana data diperoleh? Data dapat diperoleh dari sumber internal (internal data) dan sumber eksternal (external data). Data internal adalah data yang didapat oleh organisasi itu sendiri untuk keperluan operasi sehari-hari. Organisasi dimaksud dapat berupa instansi pemerintah maupun swasta, misalnya departemen-departemen, Biro Pusat Statistik, BAPPENAS, BUMN, perusahaan-perusahaan swasta dan sebagainya. Sedangkan, data eksternal adalah data yang didapat dari luar organisasi yang bersangkutan, biasanya menggambarkan keadaan di luar organisasi tersebut. Contoh data jenis ini misalnya data pendapatan nasional, penduduk, harga-harga bahan pokok yang dukumpulkan oleh Biro Pusat Statistik, data keuangan negara yang dikumpulkan oleh departemen keuangan, data perbankan dari Bank Indonesia dan sebagainya, termasuk data yang dikumpulkan oleh badan-badan internasional, seperti UNESCO, IMF, FAO dan lain-lain.
1. DATA KUANTITATIF DAN DATA KUALITATIF
v DATA KUANTITATIF
Banyak data yang berbentuk angka atau bilangan, misalnya luas tanah, jumlah penduduk dan sebagainya. Untuk jenis data ini dapat dilakukan perhitungan-perhitungan atau operasi matematika, seperti penambahan, pengurangan, perkalian, pembagian dan sebagainya. Data kuantitatif nilainya bisa berubah-ubah sehingga disebut variabel.
Data kuantitatif dapat dibagi atas:
• Data Interval
Ukuran data mempunyai interval atau jarak, misalnya berat badan antara 50-60 kg.
• Data Rasio
Data berupa angka dalam arti yang sebenarnya, sehingga mempunyai nilai nol.
Data jenis ini diperoleh melalui pengukuran dan memiliki tingkat pengukuran paling tinggi diantara jenis data lainnya.
v DATA KUALITATIF
Data kualitatif adalah data yang bukan berbentuk angka atau bilangan, misalnya kepuasan pelanggan (sangat puas, puas, kurang puas dan sebagainya), sehingga kita tidak dapat melakukan operasi matematika terhadapnya. Jenis data ini disebut atribut.
Data kualitatif dapat dibagi atas:
• Data nominal
Ukuran data nominal adalah kategori, misalnya jenis kelamin, laki-laki atau wanita, tempat tinggal dan sebagainya. Dilihat dari tingkat pengukuran data, data nominal mempunyai tingkatan yang paling rendah dari jenis data lainnya. Hal tersebut karena walaupun dalam prakteknya data ini bisa diangkakan, tetapi terhadapnya tidak bisa dilakukan operasi matematika. Contoh pemberian angka tersebut di atas misalnya, angka ’1’ untuk yang tinggal di Jakarta, ’2’ untuk yang tinggal di Bandung, ’3’ untuk Surabaya dan sebagainya.
• Data Ordinal
Data ordinal hampir sama dengan data nominal, hanya saja data orrdinal mempunyai tingkatan data atau urutan kelas, ada yang lebih tinggi ada yang lebih rendah. Contoh data ini adalah data tentang kepuasan pelanggan, yang dibagi menjadi sangat puas, tidak puas, antara puas dan tidak puas, tidak puas dan sangat tidak puas. Data ordinal mempunyai tingkatan yang lebih tinggi dari data nominal. Walaupun mempunyai tingkatan, terhadap jenis data ini kita tetap tidak dapat melakukan operasi matematika.
Dilihat dari tingkat data, urutan dari yang paling tinggi adalah data rasio, data interval, data ordinal dan paling rendah data nominal.Untuk mengolah data kualitatif (data nominal dan ordinal), biasanya digunakan statistik non parametrik, sedangkan untuk data kuantitatif digunakan statistik parametrik.
2. DATA INTERNAL DAN DATA EKSTERNAL
• DATA INTERNAL
Data yang berasal dari dalam organisasi atau perusahaan sendiri. Data jenis ini biasanya berkaitan langsung dengan organisasi sendiri, misalnya data keuangan (neraca, laporan laba-rugi dan sebagainya), data kepegawaian, data produksi dan lain-lain.
• DATA EKSTERNAL
Data yang berasal bukan dari dalam organisasi perusahaan sendiri. Data ini sering tidak berkaitan langsung dengan organisasi sendiri, misalnya data tentang jumlah kendaraan di Jakarta, jumlah penduduk di suatu desa dan lain-lain.
3. DATA PRIMER DAN DATA SEKUNDER
• DATA PRIMER
Data yang dukumpulkan, diolah serta diterbitkan sendiri oleh organisasi yang menggunakannya. Contoh jenis data ini adalah data kependudukan yang dibuat oleh Biro Pusat Statistik, data tentang pertanian yang dibuat oleh Departemen Pertanian dan sebagainya.
• DATA SEKUNDER
Data yang tidak dibuat atau diterbitkan oleh penggunanya, misalnya data tentang jumlah kendaraan dari Departemen Perhubungan merupakan data primer bagi Departemen tersebut karena dibuat dan diterbitkannya, tapi merupakan data sekunder bagi PT X sebagai pengguna, yang mendapatkannya dari sumber lain (misalnya media massa) yang mengutipnya. Jadi, orang bisa mendapatkan data sekunder dari harian, majalah, buletin dan media massa lainnya yang mengutip data dari sumber-sumber lain yang menerbitkannya (misalnya data dikutip dari departemen, Biro Pusat Statistik, Bank Indonesia dan lain-lain). Dengan demikian, data eksternal bisa berupa data primer, bisa juga berupa data sekunder.
4. DATA DISKRIT DAN DATA KONTINYU
Seperti telah dikatakan di muka, data kuantitatif disebut variabel, karena nilainya atau besarnya bisa berubah-ubah, data ini dapat mempunyai variabel diskrit sehingga disebut data diskrit, dapat juga mempunyai variabel kontinyu atau indiskrit dan disebut dengan data kontinyu.
Data diskrit adalah data yang sifatnya terputus-putus, nilainya bukan merupakan pecahan (angka utuh). Sedangkan data kontinyu adalah data yang sifatnya sinambung atau kontinyu, nilainya bisa berupa pecahan. Contoh data diskrit adalah data tentang jumlah penduduk, kendaraan dan sebagainya, sedangkan contoh data kontinyu adalah data tentang hasil panen padi, panjang jalan, berat sapi dan sebagainya.
Gambar I. Jenis Data
sumber: Kuncoro, 2001:24
Statistik atau statistika adalah ilmu yang berhubungan dengan cara pengumpulan, pengolahan atau analisis, penyajian data dan cara pengambilan kesimpulannya. Fungsi utamanya adalah membantu dalam pengambilan keputusan dan keputusan tentang parameter populasi dengan menggunakan data sampel yang diambil dari populasi tersebut.
PENGGOLONGAN STATISTIK
Statistik dapat digolongkan dengan berbagai cara.
STATISTIK DESKRIPTIF DAN INDUKTIF (INFERENSI)
• STATISTIK DESKRIPTIF
Statistik Deskriptif berusaha menjelaskan atau menggambarkan berbagai karakteristik data, seperti berapa rata-ratanya, seberapa jauh data bervariasi dan sebagainya, tanpa membuat interpretasi apa-apa terhadap data tersebut.
• STATISTIK INDUKTIF (INFERENSI)
Statistik Induktif berusaha membuat berbagai inferensi terhadap sekumpulan data yang berasal dari suatu sampel. Tindakan inferensi tersebut misalnya melakukan perkiraan, peramalan, pengambilan keputusan dan sebagainya.
STATISTIK PARAMETRIK DAN NON PARAMETRIK
• STATISTIK PARAMETRIK
Statistik Parametrik adalah statistik induktif untuk populasi yang parameternya telah memenuhi persyaratan-persyaratan tertentu (misalnya, sebaran data mengikuti distribusi normal)
• SATISTIK NON PARAMETRIK
Statistik non parametrik adalah statistik induktif yang berusaha mengambil kesimpulan tentang keseluruhan populasi yang parameternya tidak memenuhi persyaratan, yaitu tidak mengikuti suatu distribusi tertentu. Jadi, statistik non parametrik digunakan untuk populasi yang tidak menetapkan persyaratan-persyaratan parameter populasinya.
PENGERTIAN DALAM STATISTIK PENTING YANG PERLU DIPAHAMI: POPULASI, ELEMEN, SAMPLING DAN SAMPEL
Populasi adalah kumpulan semua elemen yang ada yang akan diobservasi atau diteliti, sedangkan sampling adalah pengambilan sebagian kecil dari seluruh elemen populasi tersebut yang dijadikan sebagai contoh atau sampel yang dianggap dapat mewakili seluruh elemen dalam populasi. Sedangkan sampling adalah cara pengumpulan data dengan mengambil sampel atau contoh dari seluruh anggota populasi.
Misalkan, ada 100 orang murid kelas 3 di SMU Garuda. Pimpinan Sekolah ingin melihat prestasi ujian matematika mereka pada tahun 2001 yang lalu dan untuk itu diadakan pencatatan nilai ujian dari setiap murid yang berjumlah 100 murid tersebut satu per satu tanpa kecuali. Setiap murid tersebut disebut elemen. Kumpulan dari 100 orang murid tersebut (seluruh elemen) disebut populasi dan pekerjaan untuk meneliti seluruh elemen yang terdapat dalam populasi disebut sensus. Jika untuk maksud tersebut, hanya diambil 20 murid saja sebagai contoh, hal tersebut disebut sampling, dan contoh yang diambil dinamakan sampel.
Jika data yang didapat dari sensus dinamakan data sebenarnya (true value), data yang terdapat dari sampling merupakan data dugaan sehingga nilainya dinamakan nilai perkiraan (estimate value). Nilai perkiraan tentunya tidak akan sama betul dengan nilai sebenarnya, tentu ada selisih. Selisih ini disebut kesalahan perkiraan (error estimate) atau kesalahan sampling (sampling error) dan jika nilainya kecil, cara pengumpulan data dengan sampling masih dapat dipertanggung-jawabkan.
Agar data yang diperoleh dari sampling mempunyai nilai kepercayaan yang tinggi (valid) atau nilai kesalahan perkiraannya sekecil mungkin, dalam pengambilan sampel kita harus mengikuti metode pengambilan sampel yang baik (termasuk jumlah sampel yang harus diambil), sesuai dengan keadaan populasinya. Ada berbagai macam teknik sampling namun tidak akan dibahas di sini.(Silakan lihat Modul Metode Penelitian)
Alasan-alasan mengapa kita menggunakan sampling:
• Menghemat waktu, tenaga dan biaya.
• Secara teknis, tidak mungkin mengamati seluruh anggota populasi. Misalnya, meneliti seluruh jumlah ikan yang terdapat di suatu sungai, meneliti seluruh jumlah kelelawar di suatu hutan, jumlah seluruh kendaraan di suatu negara dan sebagainya.
• Pengamatan terhadap seluruh anggota populasi dapat bersifat merusak. Misalnya, pengaruh pemakaian narkoba terhadap kerusakan otak.
• Contoh lain-lain yang bergantung pada pertimbangan peneliti atau pengguna data.
Secara teoritis atau logika, hasil analisa atau pengolahan data yang dihasilkan oleh sensus (harusnya) memberikan data yang sebenarnya (true value). Sebaliknya, karena sampling hanya mengambil sebagian elemen saja yang ada dalam populasi, hasil analisa datanya hanya merupakan perkiraan (estimate value). Mengingat alasan-alasan dan pertimbangan-pertimbangan tersebut, khususnya oleh karena sensus biasanya memerlukan biaya, tenaga dan waktu yang lebih banyak dibandingkan dengan sampling, maka pada umumnya penelitian dilakukan hanya dengan cara sampling saja, dengan catatan pelaksanaan sampling tersebut dilakukan dengan baik. Baik dalam hal ini artinya, baik metode sampling maupun pelaksanaan pengumpulan datanya dilakukan dengan benar dan cermat, sehingga perkiraan yang diperoleh tidak banyak berbeda dari keadaan populasi yang sebenarnya.
Sampling yang baik pun tidak akan sempurna betul, selalu ada ketidaksempurnaan atau kesalahan (sampling error). Untuk dapat mewakili seluruh elemen dalam populasi harus diusahakan agar sampling dilaksanakan dengan sebaik-baiknya sehingga kesalahan yang terjadi dapat sekecil mungkin. Jadi, seperti halnya dalam sensus, dalam melakukan sampling pun, kesalahan selalu dapat terjadi. Jika nilai sampling ternyata sama betul dengan nilai yang sebenarnya seperti yang dilakukan pada sensus, hal tersebut hanya bersifat kebetulan.
Berapa besarnya sampel agar didapat data yang baik sehingga dapat mewakili suatu populasi? Untuk mengetahui berapa jumlah sampel, biasanya digunakan rumus-rumus sebagai berikut :
E = Kesalahan atau error yang diizinkan menyangkut ketelitian pendugaan.
Z = Nilai Z yang sesuai dengan interval keyakinan yang digunakan, yaitu 1,96 untuk I.K = 95% dan 2,58 untuk I.K = 99%.
S = Deviasi standar dari pra-survey yang dilakukan dengan sampel yang kecil untuk menduga deviasi standar populasi.
Untuk proporsi
P = Estimasi atau perkiraan proporsi populasi
Z = Nilai Z yang sesuai dengan interval keyakinan yang ditentukan
E = Kesalahan (error) maksimum yang diizinkan
Kesalahan (error) yang diizinkan misalnya sebesar 5%, berarti ketelitian yang diinginkan dalam pendugaan parameter populasi (interval keyakinan) adalah sebesar 95% (100%-5%), dan jika error yang diizinkan sebesar 1%, berarti tingkat ketelitian (interval keyakinan) yang ingin dicapai sebesar 99% (100%-1%). Dengan demikian, besarnya sampel bergantung pada interval keyakinan yang digunakan (error maksimum yang diizinkan) dan deviasi standar atau estimasi proporsi populasi (ukuran sampel untuk proporsi). Jika deviasi standar atau proporsi populasi belum diketahui, kita perlu mengadakan survey pendahuluan dengan ukuran sampel yang kecil untuk menduga deviasi standar populasi. Deviasi standar populasi dapat juga dilakukan berdasarkan pengetahuan tentang populasi.
Perhitungan deviasi standar distribusi sampling harus dikoreksi dengan faktor koreksi sebesar
Jika ukuran sampel (n) dibagi ukuran populasi (N) relatif cukup besar, akan tetapi jika ukuran populasi besar sekali apalagi tak terhingga atau ukuran populasi terbatas tapi relatif kecil, faktor koreksi tidak diperlukan.
Dari rumus tersebut di atas, semakin tinggi interval keyakinan maka semakin besar ukuran sampel yang dibutuhkan. Untuk lebih jelasnya, jika kita ingin yakin 100% interval duga akan sama dengan parameter populasi jumlah sampel yang harus diambil adalah seluruh populasi, ini berarti sama dengan sensus.
PARAMETER DAN SAMPLING ERROR
Seperti telah diterangkan dimuka, baik dalam melaksanakan sensus maupun cara pengambilan sampel (sampling), kesalahan dapat saja terjadi (error sampling) baik disengaja maupun yang tidak disengaja. Jenis kesalahan yang mungkin terjadi dimaksud adalah:
• Kesalahan secara umum (baik sensus maupun sampling):
• Kesalahan mencatat (recording’s error),
• Kesalahan mengukur (measurement’s error),
• Kesalahan menjawab (response’s error),
• Kesalahan mengingat (recal’s error),
• Kesalahan mengamati (observation’s error) dan sebagainya.
• Kesalahan lainnya khusus dalam sampling :
• Kesalahan penentuan responden (misspecification of sample subject).
• Kesalahan variasi acak (random variation error).
• Kesalahan penarikan sampel (sampling error).
• Kesalahan spesifikasi (specification error).
• Kesalahan karena tidak lengkapnya respon (non response error).
• Kesalahan karena tidak lengkapnya cakupan elemen populasi (coverage error) dan sebagainya.
Anda sebagai individu, seorang manajer, atau mungkin seorang pengusaha, menginginkan untuk:
v Mengetahui siapa saja yang akan pensiun tahun depan, dari bagian mana, apa jabatannya, berapa pesangon yang akan didapat, dan sebagainya. Tujuannya adalah antara lain:
• Mempersiapkan dana, berapa besarnya untuk pembayaran pesangon mereka.
• Mempersiapkan penerimaan karyawan baru untuk mengganti karyawan yang bakal pensiun tersebut (walaupun tidak semua).
Untuk maksud tersebut, Anda memerlukan data berupa data pegawai, yang mungkin cukup didapat dari dalam perusahaan sendiri.
v Mengetahui tingkat kepuasan konsumen produk yang anda pasarkan, bagaimana respon mereka terhadap mutu produk Anda, harga, pelayanan dan sebagainya. Untuk inipun, Anda perlu data, malah mungkin data tersebut perlu dikumpulkan di lapangan melalui survei (terlepas dari apakah dilakukan sendiri atau dengan membayar lembaga riset yang Anda percayai).
v Mengetahui apakah proses produksi saat ini masih terkendali atau tidak. Berapa persen dari produksi yang tertolak karena dianggap cacat, lengkap dengan perinciannya per mesin, per lokasi, kapan, mengapa dan lain-lain. Untuk inipun, Anda memerlukan data (yang didapat dari bagian produksi).
v Mengetahui perkembangan perekonomian (trend) untuk jangka waktu tertentu, pertumbuhan penduduk penduduk, pendapatan nasional dan sebagainya . Termasuk juga mengetahui faktor-faktor atau variabel yang mempengaruhi pertumbuhan ekonomi.
Dari contoh-contoh tersebut diatas, kita mengetahui betapa pentingnya data. Dengan data, kita mengetahui gambaran perusahaan sekarang, masalah apa yang sedang dihadapi, mengapa terjadi masalah-masalah tersebut, bagaimana cara pemecahannya. Dengan data, kita dapat meramal atau memperkirakan, apa yang kira-kira bakal terjadi di masa mendatang. Dengan data, kita pun bisa membuat perencanaan, peramalan, mengontrol pelaksanaan, mengevaluasi target apakah tercapai atau tidak, dan sebagainya. Dengan adanya data, kita dapat banyak mengetahui tentang berbagai hal. Dengan data, kita bisa mengambil keputusan-keputusan, kebijakan-kebijakan perusahaan, dan sebagainya. Pendeknya, fungsi dan manfaat data sangat penting dan banyak sekali. Sering kali, akan berbahaya jika kita mengambil kesimpulan dan keputusan tanpa didukung oleh data. Orang bilang ”Speak with data”, berbicaralah dengan data agar objektif dan lebih akurat. Sebenarnya apa itu data?
PENGERTIAN DATA DAN PENGGOLONGANNYA
Dari uraian di atas, sebenarnya data adalah kumpulan keterangan atau informasi yang diperoleh dari suatu pengamatan, dapat berupa angka, lambang atau sifat. Jika kita mendapatkan data yang tidak baik, sebaik apa pun cara pengolahan data yang kita lakukan, hasilnya atau kesimpulan yang didapat dari data tersebut tetap tidak baik. Semisal, ungkapan ”garbage in, garbage out”, yang artinya jika yang masuk sampah, yang keluar pun juga sampah. Jadi, syarat utama agar analisa data secara statistik menghasilkan informasi atau kesimpulan yang baik adalah data yang diolah haruslah juga baik.
Apa itu data yang baik? Data yang baik adalah data yang sifatnya representatif (mewakili), objektif (sesuai dengan apa yang ada atau yang terjadi), relevan (ada hubungannya dengan persoalan yang sedang dihadapi dan akan dipecahkan), mempunyai tingkat ketelitian yang tinggi atau standard error (kesalahan baku) yang kecil.
Dari mana data diperoleh? Data dapat diperoleh dari sumber internal (internal data) dan sumber eksternal (external data). Data internal adalah data yang didapat oleh organisasi itu sendiri untuk keperluan operasi sehari-hari. Organisasi dimaksud dapat berupa instansi pemerintah maupun swasta, misalnya departemen-departemen, Biro Pusat Statistik, BAPPENAS, BUMN, perusahaan-perusahaan swasta dan sebagainya. Sedangkan, data eksternal adalah data yang didapat dari luar organisasi yang bersangkutan, biasanya menggambarkan keadaan di luar organisasi tersebut. Contoh data jenis ini misalnya data pendapatan nasional, penduduk, harga-harga bahan pokok yang dukumpulkan oleh Biro Pusat Statistik, data keuangan negara yang dikumpulkan oleh departemen keuangan, data perbankan dari Bank Indonesia dan sebagainya, termasuk data yang dikumpulkan oleh badan-badan internasional, seperti UNESCO, IMF, FAO dan lain-lain.
1. DATA KUANTITATIF DAN DATA KUALITATIF
v DATA KUANTITATIF
Banyak data yang berbentuk angka atau bilangan, misalnya luas tanah, jumlah penduduk dan sebagainya. Untuk jenis data ini dapat dilakukan perhitungan-perhitungan atau operasi matematika, seperti penambahan, pengurangan, perkalian, pembagian dan sebagainya. Data kuantitatif nilainya bisa berubah-ubah sehingga disebut variabel.
Data kuantitatif dapat dibagi atas:
• Data Interval
Ukuran data mempunyai interval atau jarak, misalnya berat badan antara 50-60 kg.
• Data Rasio
Data berupa angka dalam arti yang sebenarnya, sehingga mempunyai nilai nol.
Data jenis ini diperoleh melalui pengukuran dan memiliki tingkat pengukuran paling tinggi diantara jenis data lainnya.
v DATA KUALITATIF
Data kualitatif adalah data yang bukan berbentuk angka atau bilangan, misalnya kepuasan pelanggan (sangat puas, puas, kurang puas dan sebagainya), sehingga kita tidak dapat melakukan operasi matematika terhadapnya. Jenis data ini disebut atribut.
Data kualitatif dapat dibagi atas:
• Data nominal
Ukuran data nominal adalah kategori, misalnya jenis kelamin, laki-laki atau wanita, tempat tinggal dan sebagainya. Dilihat dari tingkat pengukuran data, data nominal mempunyai tingkatan yang paling rendah dari jenis data lainnya. Hal tersebut karena walaupun dalam prakteknya data ini bisa diangkakan, tetapi terhadapnya tidak bisa dilakukan operasi matematika. Contoh pemberian angka tersebut di atas misalnya, angka ’1’ untuk yang tinggal di Jakarta, ’2’ untuk yang tinggal di Bandung, ’3’ untuk Surabaya dan sebagainya.
• Data Ordinal
Data ordinal hampir sama dengan data nominal, hanya saja data orrdinal mempunyai tingkatan data atau urutan kelas, ada yang lebih tinggi ada yang lebih rendah. Contoh data ini adalah data tentang kepuasan pelanggan, yang dibagi menjadi sangat puas, tidak puas, antara puas dan tidak puas, tidak puas dan sangat tidak puas. Data ordinal mempunyai tingkatan yang lebih tinggi dari data nominal. Walaupun mempunyai tingkatan, terhadap jenis data ini kita tetap tidak dapat melakukan operasi matematika.
Dilihat dari tingkat data, urutan dari yang paling tinggi adalah data rasio, data interval, data ordinal dan paling rendah data nominal.Untuk mengolah data kualitatif (data nominal dan ordinal), biasanya digunakan statistik non parametrik, sedangkan untuk data kuantitatif digunakan statistik parametrik.
2. DATA INTERNAL DAN DATA EKSTERNAL
• DATA INTERNAL
Data yang berasal dari dalam organisasi atau perusahaan sendiri. Data jenis ini biasanya berkaitan langsung dengan organisasi sendiri, misalnya data keuangan (neraca, laporan laba-rugi dan sebagainya), data kepegawaian, data produksi dan lain-lain.
• DATA EKSTERNAL
Data yang berasal bukan dari dalam organisasi perusahaan sendiri. Data ini sering tidak berkaitan langsung dengan organisasi sendiri, misalnya data tentang jumlah kendaraan di Jakarta, jumlah penduduk di suatu desa dan lain-lain.
3. DATA PRIMER DAN DATA SEKUNDER
• DATA PRIMER
Data yang dukumpulkan, diolah serta diterbitkan sendiri oleh organisasi yang menggunakannya. Contoh jenis data ini adalah data kependudukan yang dibuat oleh Biro Pusat Statistik, data tentang pertanian yang dibuat oleh Departemen Pertanian dan sebagainya.
• DATA SEKUNDER
Data yang tidak dibuat atau diterbitkan oleh penggunanya, misalnya data tentang jumlah kendaraan dari Departemen Perhubungan merupakan data primer bagi Departemen tersebut karena dibuat dan diterbitkannya, tapi merupakan data sekunder bagi PT X sebagai pengguna, yang mendapatkannya dari sumber lain (misalnya media massa) yang mengutipnya. Jadi, orang bisa mendapatkan data sekunder dari harian, majalah, buletin dan media massa lainnya yang mengutip data dari sumber-sumber lain yang menerbitkannya (misalnya data dikutip dari departemen, Biro Pusat Statistik, Bank Indonesia dan lain-lain). Dengan demikian, data eksternal bisa berupa data primer, bisa juga berupa data sekunder.
4. DATA DISKRIT DAN DATA KONTINYU
Seperti telah dikatakan di muka, data kuantitatif disebut variabel, karena nilainya atau besarnya bisa berubah-ubah, data ini dapat mempunyai variabel diskrit sehingga disebut data diskrit, dapat juga mempunyai variabel kontinyu atau indiskrit dan disebut dengan data kontinyu.
Data diskrit adalah data yang sifatnya terputus-putus, nilainya bukan merupakan pecahan (angka utuh). Sedangkan data kontinyu adalah data yang sifatnya sinambung atau kontinyu, nilainya bisa berupa pecahan. Contoh data diskrit adalah data tentang jumlah penduduk, kendaraan dan sebagainya, sedangkan contoh data kontinyu adalah data tentang hasil panen padi, panjang jalan, berat sapi dan sebagainya.
Gambar I. Jenis Data
sumber: Kuncoro, 2001:24
Statistik atau statistika adalah ilmu yang berhubungan dengan cara pengumpulan, pengolahan atau analisis, penyajian data dan cara pengambilan kesimpulannya. Fungsi utamanya adalah membantu dalam pengambilan keputusan dan keputusan tentang parameter populasi dengan menggunakan data sampel yang diambil dari populasi tersebut.
PENGGOLONGAN STATISTIK
Statistik dapat digolongkan dengan berbagai cara.
STATISTIK DESKRIPTIF DAN INDUKTIF (INFERENSI)
• STATISTIK DESKRIPTIF
Statistik Deskriptif berusaha menjelaskan atau menggambarkan berbagai karakteristik data, seperti berapa rata-ratanya, seberapa jauh data bervariasi dan sebagainya, tanpa membuat interpretasi apa-apa terhadap data tersebut.
• STATISTIK INDUKTIF (INFERENSI)
Statistik Induktif berusaha membuat berbagai inferensi terhadap sekumpulan data yang berasal dari suatu sampel. Tindakan inferensi tersebut misalnya melakukan perkiraan, peramalan, pengambilan keputusan dan sebagainya.
STATISTIK PARAMETRIK DAN NON PARAMETRIK
• STATISTIK PARAMETRIK
Statistik Parametrik adalah statistik induktif untuk populasi yang parameternya telah memenuhi persyaratan-persyaratan tertentu (misalnya, sebaran data mengikuti distribusi normal)
• SATISTIK NON PARAMETRIK
Statistik non parametrik adalah statistik induktif yang berusaha mengambil kesimpulan tentang keseluruhan populasi yang parameternya tidak memenuhi persyaratan, yaitu tidak mengikuti suatu distribusi tertentu. Jadi, statistik non parametrik digunakan untuk populasi yang tidak menetapkan persyaratan-persyaratan parameter populasinya.
PENGERTIAN DALAM STATISTIK PENTING YANG PERLU DIPAHAMI: POPULASI, ELEMEN, SAMPLING DAN SAMPEL
Populasi adalah kumpulan semua elemen yang ada yang akan diobservasi atau diteliti, sedangkan sampling adalah pengambilan sebagian kecil dari seluruh elemen populasi tersebut yang dijadikan sebagai contoh atau sampel yang dianggap dapat mewakili seluruh elemen dalam populasi. Sedangkan sampling adalah cara pengumpulan data dengan mengambil sampel atau contoh dari seluruh anggota populasi.
Misalkan, ada 100 orang murid kelas 3 di SMU Garuda. Pimpinan Sekolah ingin melihat prestasi ujian matematika mereka pada tahun 2001 yang lalu dan untuk itu diadakan pencatatan nilai ujian dari setiap murid yang berjumlah 100 murid tersebut satu per satu tanpa kecuali. Setiap murid tersebut disebut elemen. Kumpulan dari 100 orang murid tersebut (seluruh elemen) disebut populasi dan pekerjaan untuk meneliti seluruh elemen yang terdapat dalam populasi disebut sensus. Jika untuk maksud tersebut, hanya diambil 20 murid saja sebagai contoh, hal tersebut disebut sampling, dan contoh yang diambil dinamakan sampel.
Jika data yang didapat dari sensus dinamakan data sebenarnya (true value), data yang terdapat dari sampling merupakan data dugaan sehingga nilainya dinamakan nilai perkiraan (estimate value). Nilai perkiraan tentunya tidak akan sama betul dengan nilai sebenarnya, tentu ada selisih. Selisih ini disebut kesalahan perkiraan (error estimate) atau kesalahan sampling (sampling error) dan jika nilainya kecil, cara pengumpulan data dengan sampling masih dapat dipertanggung-jawabkan.
Agar data yang diperoleh dari sampling mempunyai nilai kepercayaan yang tinggi (valid) atau nilai kesalahan perkiraannya sekecil mungkin, dalam pengambilan sampel kita harus mengikuti metode pengambilan sampel yang baik (termasuk jumlah sampel yang harus diambil), sesuai dengan keadaan populasinya. Ada berbagai macam teknik sampling namun tidak akan dibahas di sini.(Silakan lihat Modul Metode Penelitian)
Alasan-alasan mengapa kita menggunakan sampling:
• Menghemat waktu, tenaga dan biaya.
• Secara teknis, tidak mungkin mengamati seluruh anggota populasi. Misalnya, meneliti seluruh jumlah ikan yang terdapat di suatu sungai, meneliti seluruh jumlah kelelawar di suatu hutan, jumlah seluruh kendaraan di suatu negara dan sebagainya.
• Pengamatan terhadap seluruh anggota populasi dapat bersifat merusak. Misalnya, pengaruh pemakaian narkoba terhadap kerusakan otak.
• Contoh lain-lain yang bergantung pada pertimbangan peneliti atau pengguna data.
Secara teoritis atau logika, hasil analisa atau pengolahan data yang dihasilkan oleh sensus (harusnya) memberikan data yang sebenarnya (true value). Sebaliknya, karena sampling hanya mengambil sebagian elemen saja yang ada dalam populasi, hasil analisa datanya hanya merupakan perkiraan (estimate value). Mengingat alasan-alasan dan pertimbangan-pertimbangan tersebut, khususnya oleh karena sensus biasanya memerlukan biaya, tenaga dan waktu yang lebih banyak dibandingkan dengan sampling, maka pada umumnya penelitian dilakukan hanya dengan cara sampling saja, dengan catatan pelaksanaan sampling tersebut dilakukan dengan baik. Baik dalam hal ini artinya, baik metode sampling maupun pelaksanaan pengumpulan datanya dilakukan dengan benar dan cermat, sehingga perkiraan yang diperoleh tidak banyak berbeda dari keadaan populasi yang sebenarnya.
Sampling yang baik pun tidak akan sempurna betul, selalu ada ketidaksempurnaan atau kesalahan (sampling error). Untuk dapat mewakili seluruh elemen dalam populasi harus diusahakan agar sampling dilaksanakan dengan sebaik-baiknya sehingga kesalahan yang terjadi dapat sekecil mungkin. Jadi, seperti halnya dalam sensus, dalam melakukan sampling pun, kesalahan selalu dapat terjadi. Jika nilai sampling ternyata sama betul dengan nilai yang sebenarnya seperti yang dilakukan pada sensus, hal tersebut hanya bersifat kebetulan.
Berapa besarnya sampel agar didapat data yang baik sehingga dapat mewakili suatu populasi? Untuk mengetahui berapa jumlah sampel, biasanya digunakan rumus-rumus sebagai berikut :
E = Kesalahan atau error yang diizinkan menyangkut ketelitian pendugaan.
Z = Nilai Z yang sesuai dengan interval keyakinan yang digunakan, yaitu 1,96 untuk I.K = 95% dan 2,58 untuk I.K = 99%.
S = Deviasi standar dari pra-survey yang dilakukan dengan sampel yang kecil untuk menduga deviasi standar populasi.
Untuk proporsi
P = Estimasi atau perkiraan proporsi populasi
Z = Nilai Z yang sesuai dengan interval keyakinan yang ditentukan
E = Kesalahan (error) maksimum yang diizinkan
Kesalahan (error) yang diizinkan misalnya sebesar 5%, berarti ketelitian yang diinginkan dalam pendugaan parameter populasi (interval keyakinan) adalah sebesar 95% (100%-5%), dan jika error yang diizinkan sebesar 1%, berarti tingkat ketelitian (interval keyakinan) yang ingin dicapai sebesar 99% (100%-1%). Dengan demikian, besarnya sampel bergantung pada interval keyakinan yang digunakan (error maksimum yang diizinkan) dan deviasi standar atau estimasi proporsi populasi (ukuran sampel untuk proporsi). Jika deviasi standar atau proporsi populasi belum diketahui, kita perlu mengadakan survey pendahuluan dengan ukuran sampel yang kecil untuk menduga deviasi standar populasi. Deviasi standar populasi dapat juga dilakukan berdasarkan pengetahuan tentang populasi.
Perhitungan deviasi standar distribusi sampling harus dikoreksi dengan faktor koreksi sebesar
Jika ukuran sampel (n) dibagi ukuran populasi (N) relatif cukup besar, akan tetapi jika ukuran populasi besar sekali apalagi tak terhingga atau ukuran populasi terbatas tapi relatif kecil, faktor koreksi tidak diperlukan.
Dari rumus tersebut di atas, semakin tinggi interval keyakinan maka semakin besar ukuran sampel yang dibutuhkan. Untuk lebih jelasnya, jika kita ingin yakin 100% interval duga akan sama dengan parameter populasi jumlah sampel yang harus diambil adalah seluruh populasi, ini berarti sama dengan sensus.
PARAMETER DAN SAMPLING ERROR
Seperti telah diterangkan dimuka, baik dalam melaksanakan sensus maupun cara pengambilan sampel (sampling), kesalahan dapat saja terjadi (error sampling) baik disengaja maupun yang tidak disengaja. Jenis kesalahan yang mungkin terjadi dimaksud adalah:
• Kesalahan secara umum (baik sensus maupun sampling):
• Kesalahan mencatat (recording’s error),
• Kesalahan mengukur (measurement’s error),
• Kesalahan menjawab (response’s error),
• Kesalahan mengingat (recal’s error),
• Kesalahan mengamati (observation’s error) dan sebagainya.
• Kesalahan lainnya khusus dalam sampling :
• Kesalahan penentuan responden (misspecification of sample subject).
• Kesalahan variasi acak (random variation error).
• Kesalahan penarikan sampel (sampling error).
• Kesalahan spesifikasi (specification error).
• Kesalahan karena tidak lengkapnya respon (non response error).
• Kesalahan karena tidak lengkapnya cakupan elemen populasi (coverage error) dan sebagainya.
1.
Penyajian Data dalam Bentuk Tabel
Misalkan, hasil ulangan Bahasa
Indonesia 37 siswa kelas XI SMA 3 disajikan dalam tabel di bawah. Penyajian
data pada Tabel 1.1 dinamakan penyajian data sederhana. Dari tabel 1.1, Anda
dapat menentukan banyak siswa yang mendapat nilai 9, yaitu sebanyak 7 orang.
Berapa orang siswa yang mendapat nilai 5? Nilai berapakah yang paling banyak
diperoleh siswa?
Jika data hasil ulangan bahasa Indonesia
itu disajikan dengan cara mengelompokkan data nilai siswa, diperoleh tabel
frekuensi berkelompok seperti pada Tabel 2.. Tabel 2. dinamakan Tabel
Distribusi Frekuensi.
Tabel
1. Penyajian data sederhana
|
Nilai
|
Frekuensi
|
|
2
|
7
|
|
4
|
3
|
|
5
|
5
|
|
6
|
4
|
|
7
|
10
|
|
9
|
7
|
|
10
|
1
|
Tabel
2. Tabel Distribusi Frekuensi
|
Interval Kelas
|
Turus
|
Frekuensi
|
|
1–2
|
EB
|
7
|
|
3–4
|
C
|
3
|
|
5–6
|
EC
|
8
|
|
7–8
|
EE
|
10
|
|
9–10
|
EC
|
8
|
|
Jumlah
|
37
|
2.
Penyajian Data dalam Bentuk Diagram
Kerapkali data yang disajikan dalam
bentuk tabel sulit untuk dipahami. Lain halnya jika data tersebut disajikan
dalam bentuk diagram maka Anda akan dapat lebih cepat memahami data itu.
Diagram adalah gambar yang menyajikan data secara visual yang biasanya berasal
dari tabel yang telah dibuat. Meskipun demikian, diagram masih memiliki
kelemahan, yaitu pada umumnya diagram tidak dapat memberikan gambaran yang
lebih detail.
2.1.
Diagram Batang
Diagram batang biasanya digunakan
untuk menggambarkan data diskrit (data cacahan). Diagram batang adalah bentuk
penyajian data statistik dalam bentuk batang yang dicatat dalam interval
tertentu pada bidang cartesius.
Ada dua jenis diagram batang, yaitu
:
- diagram
batang vertikal, dan
- diagram
batang horizontal.
Contoh
Soal 1
Selama 1 tahun, toko
"Anggo" mencatat keuntungan setiap bulan sebagai berikut.
Tabel
3. Keuntungan Toko "Anggo" per Bulan (dalam jutaan rupiah)
|
Bulan ke
|
2,5
|
1,8
|
2,6
|
4,2
|
3,5
|
3,3
|
4,0
|
5,0
|
2,0
|
4,2
|
6,2
|
6,2
|
|
Keuntungan
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
11
|
12
|
a. Buatlah diagram batang vertikal
dari data tersebut.
b. Berapakah keuntungan terbesar
yang diperoleh Toko "Anggo" selama 1 tahun?
c. Kapan Toko "Anggo"
memperoleh keuntungan yang sama selama dua bulan berturut-turut?
Penyelesaian
1
a. Diagram batang vertikal dari data
tersebut, tampak pada gambar berikut.
b. Dari diagram tersebut tampak
bahwa keuntungan terbesar yang diperoleh Toko "Anggo" selama 1 tahun
adalah sebesar Rp 6.200.000,00.
c. Toko "Anggo" memperoleh
keuntungan yang sama selama dua bulan beturut-turut pada bulan ke-11 dan ke-12.
2.2.
Diagram Garis
Pernahkah Anda melihat grafik nilai
tukar dolar terhadap rupiah atau pergerakan saham di TV? Grafik yang seperti
itu disebut diagram garis. Diagram garis biasanya digunakan untuk menggambarkan
data tentang m keadaan yang berkesinambungan (sekumpulan data kontinu).
Misalnya, jumlah penduduk setiap tahun, perkembangan berat badan bayi setiap
bulan, dan suhu badan pasien setiap jam.
Seperti halnya diagram batang,
diagram garis pun memerlukan sistem sumbu datar (horizontal) dan sumbu tegak
(vertikal) yang saling berpotongan tegak lurus. Sumbu mendatar biasanya
menyatakan jenis data, misalnya waktu dan berat. Adapun sumbu tegaknya
menyatakan frekuensi data. Langkah-langkah yang dilakukan untuk membuat diagram
garis adalah sebagai berikut.
- Buatlah suatu koordinat (berbentuk bilangan) dengan
sumbu mendatar menunjukkan waktu dan sumbu tegak menunjukkan data
pengamatan.
- Gambarlah titik koordinat yang menunjukkan data
pengamatan pada waktu t.
- Secara berurutan sesuai dengan waktu, hubungkan
titiktitik koordinat tersebut dengan garis lurus.
Contoh
Soal 2
Berikut ini adalah tabel berat badan
seorang bayi yang dipantau sejak lahir sampai berusia 9 bulan.
|
Usia (bulan)
|
3,5
|
4
|
5,2
|
6,4
|
6,8
|
7,5
|
7,5
|
8
|
8,8
|
8,6
|
|
Berat Badan
(kg)
|
0
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
a. Buatlah diagram garisnya.
b. Pada usia berapa bulan berat
badannya menurun?
c. Pada usia berapa bulan berat
badannya tetap?
Pembahasan
2
a. Langkah ke-1
Buatlah sumbu mendatar yang
menunjukkan usia anak (dalam bulan) dan sumbu tegak yang menunjukkan berat
badan anak (dalam kg).
Langkah ke-2
Gambarlah titik koordinat yang
menunjukkan data pengamatan pada waktu t bulan.
Langkah ke-3
Secara berurutan sesuai dengan
waktu, hubungkan titik-titik koordinat tersebut dengan garis lurus.
Dari ketiga langkah tersebut,
diperoleh diagram garis dari data tersebut tampak pada Gambar 2.
b. Dari diagram tersebut dapat
dilihat bahwa berat badan bayi menurun pada usai 8 sampai 9 bulan.
c. Berat badan bayi tetap pada usia
5 sampai 6 bulan. Darimana Anda memperoleh hasil ini? Jelaskan.
Observasi:
Interpolasi dan Ekstrapolasi Data
Anda dapat melakukan observasi
terhadap kecenderungan data yang disajikan pada suatu diagram garis. Dari observasi
ini, Anda dapat membuat perkiraan-perkiraan dengan cara interpolasi dan
ekstrapolasi. Hal ini ditempuh dengan mengganti garis patah pada diagram garis
menjadi garis lurus. Interpolasi data adalah menaksir data atau memperkirakan
data di antara dua keadaan (misalnya waktu) yang berurutan. Misalkan, dari
gambar grafik Contoh soal 2. dapat diperkirakan berat badan bayi pada usia 5,5
bulan. Coba Anda amati grafik tersebut, kemudian tentukan berat badan bayi pada
usia 5,5 bulan.
Ekstrapolasi data adalah menaksir
atau memperkirakan data untuk keadaan (waktu) mendatang. Cara yang dapat
dilakukan untuk ekstrapolasi adalah dengan memperpanjang ruas garis terujung ke
arah kanan. Misalkan, dari gambar grafik soal 2. dapat diperkirakan berat badan
bayi pada usia 10 bulan. Jika garis lurus sudah ditentukan, Anda dapat
menentukan interpolasi data. Untuk ekstrapolasi data, Anda harus berhati-hati.
Menurut diagram garis, berapa kira-kira berat badan bayi pada usia 10 bulan?
Berikan alasan Anda.
2.3.
Diagram Lingkaran
Untuk mengetahui perbandingan suatu
data terhadap keseluruhan, suatu data lebih tepat disajikan dalam bentuk
diagram lingkaran. Diagram lingkaran adalah bentuk penyajian data statistika
dalam bentuk lingkaran yang dibagi menjadi beberapa juring lingkaran.
Langkah-langkah untuk membuat
diagram lingkaran adalah sebagai berikut.
- Buatlah sebuah lingkaran pada kertas.
- Bagilah lingkaran tersebut menjadi beberapa juring
lingkaran untuk menggambarkan kategori yang datanya
- telah diubah ke dalam derajat.
Agar lebih jelasnya, pelajarilah
contoh berikut.
Contoh
Soal 3
Tabel berikut menunjukkan banyaknya
siswa di suatu kabupaten menurut tingkat sekolah pada tahun 2007.
|
Tingkat Pendidikan
|
Banyaknya Siswa
|
|
SD
SMP
SMA
|
175
600
225
|
a. Buatlah diagram lingkaran untuk
data tersebut.
b. Berapa persen siswa yang
menyelesaikan sekolah sampai pada tingkat SMP?
c. Berapa persen siswa yang
menyelesaikan sekolah sampai pada tingkat SMA?
Pembahasan
3
a. Jumlah seluruh siswa adalah 1.000
orang. Seluruh siswa diklasifikasikan menjadi 5 katagori: SD = 175 orang, SMP =
600 orang, dan SMA = 225 orang.
• Siswa SD = (175/1.000) x 100% =
17,5%
Besar sudut sektor lingkaran = 17,5%
× 360° = 63°
• Siswa SMP = (600/1.000) x 100% =
60%
Besar sudut sektor lingkaran = 60% ×
360° = 216°
• Siswa SMA= (225/1.000) 100% =
22,5%
Besar sudut sektor lingkaran = 22,5%
× 360° = 81°
Diagram lingkaran ditunjukkan pada
Gambar 3.
|
Gambar 3. Diagram lingkaran
banyaknya siswa di suatu kabupaten menurut tingkat sekolah pada tahun 2007
|
b. Persentase siswa yang
menyelesaikan sekolah sampai pada tingkat SMP adalah 60%.
c. Persentase siswa yang
menyelesaikan sekolah sampai pada tingkat SMAadalah 22,5%.
3.
Tabel Distribusi Frekuensi, Frekuensi Relatif dan
Kumulatif, Histogram, Poligon Frekuensi, dan Ogive
3.1. Tabel Distribusi Frekuensi
Data yang berukuran besar (n >
30) lebih tepat disajikan dalam tabel distribusi frekuensi, yaitu cara
penyajian data yang datanya disusun dalam kelas-kelas tertentu.
Langkah-langkah penyusunan tabel distribusi
frekuensi adalah sebagai berikut.
• Langkah ke-2 menentukan banyak
interval (K) dengan rumus "Sturgess" yaitu: K= 1 + 3,3 log n dengan n
adalah banyak data. Banyak kelas harus merupakan bilangan bulat positif hasil
pembulatan.
• Langkah ke-3 menentukan panjang
interval kelas (I) dengan menggunakan rumus:
I = J/K
• Langkah ke-4 menentukan
batas-batas kelas. Data terkecil harus merupakan batas bawah interval kelas
pertama atau data terbesar adalah batas atas interval kelas terakhir.
• Langkah ke-5 memasukkan data ke
dalam kelas-kelas yang sesuai dan menentukan nilai frekuensi setiap kelas
dengan sistem turus.
• Menuliskan turus-turus
dalambilangan yang bersesuaian dengan banyak turus.
Ingatlah :
Menentukan banyak kelas interval
dengan aturan Sturges dimaksudkan agar interval tidak terlalu besar sebab
hasilnya akan menyimpang dari keadaan sesungguhnya. Sebaiknya, jika interval
terlalu kecil, hasilnya tidak menggambarkan keadaan yang diharapkan.
Contoh
Soal 4
Seorang peneliti mengadakan
penelitian tentang berat badan dari 35 orang.
Data hasil penelitian itu (dalam kg)
diberikan berikut ini:
48 32 46 27 43 46 25 41 40 58 16 36
21 42 47 55 60 58 46 44 63 66 28 56
50 21 56 55 25 74 43 37 51 53 39
Sajikan data tersebut ke dalam tabel
distribusi frekuensi.
Jawaban
4
1. Jangkauan (J) = Xm- Xn = 74 – 16
= 58.
2. Banyak kelas (K) = 1 + 3,3 log n
= 1 + 3,3 log 35 = 6,095. Banyak kelas dibulatkan menjadi "6".
3. Panjang interval kelas (I) adalah
I = J/K = 58/6 = 9,67. Panjang interval kelas dibulatkan menjadi
"10".
Dengan panjang interval kelas = 10
dan banyak kelas = 6, diperoleh tabel distribusi frekuensi seperti pada Tabel
4. atau Tabel 5
Cara I: Batas bawah kelas pertama
diambil datum terkecil. Amati Tabel 4. Dari tabel tersebut tampak bahwa
frekuensi paling banyak dalam interval 46–55. Artinya, berat badan kebanyakan
berkisar antara 46 kg dan 55 kg.
Tabel
4. Tabel distribusi frekuensi
|
Interval Kelas
|
Turus
|
Frekuensi
|
|
16–25
|
E
|
5
|
|
26–35
|
C
|
3
|
|
36–45
|
ED
|
9
|
|
46–55
|
EE
|
10
|
|
56–65
|
EA
|
6
|
|
66–75
|
B
|
2
|
|
Jumlah
|
35
|
Cara II: Batas atas kelas terakhir
diambil datum terbesar. Amati Tabel 5.
Tabel
5. Tabel distribusi frekuensi
|
Interval Kelas
|
Turus
|
Frekuensi
|
|
15–24
|
C
|
3
|
|
25–34
|
E
|
5
|
|
35–44
|
ED
|
9
|
|
45–54
|
EC
|
8
|
|
55–64
|
EC
|
8
|
|
65–74
|
B
|
2
|
|
Jumlah
|
35
|
Dari tabel tampak frekuensi paling
sedikit dalam interval 65–74. Artinya, berat badan antara 65 kg dan 74 kg ada 2
orang. Perhatikan interval kelas yang pertama, yaitu 15–24. 15 disebut batas
bawah dan 24 disebut batas atas. Ukuran 15–24 adalah hasil pembulatan, ukuran
yang sebenarnya terletak pada 14,5–24,5. 14,5 disebut tepi bawah kelas (batas
bawah nyata) dan 24,5 disebut tepi atas kelas (batas atas nyata) pada interval
kelas 15–24.
Dalam menentukan tepi bawah kelas
dan tepi atas kelas pada setiap interval kelas, harus diketahui satuan yang
dipakai. Dengan demikian, untuk tepi bawah kelas adalah batas bawah kelas
dikurangi 1/2 satuan ukuran. Jadi, tepi kelas dari interval kelas 15–24 menjadi
14,5–24,5.
3.2.
Frekuensi Relatif dan Kumulatif
Frekuensi yang dimiliki setiap kelas
pada tabel distribusi frekuensi bersifat mutlak. Adapun frekuensi relatif dari
suatu data adalah dengan membandingkan frekuensi pada interval kelas itu dengan
banyak data dinyatakan dalam persen. Contoh: interval frekuensi kelas adalah
20. Total data seluruh interval kelas = 80 maka frekuensi relatif kelas ini
adalah 20/8 = ¼, sedangkan frekuensi relatifnya adalah ¼ × 100%
= 25%.
Dari uraian tersebut, dapatkah Anda
menyatakan rumus frekuensi relatif? Cobalah nyatakan rumus frekuensi relatif
dengan kata-kata Anda sendiri.
Frekuensi relatif dirumuskan sebagai
berikut.
Frekuensi relatif kelas
ke-k = frekuensi kelas ke-k / banyak data
Frekuensi kumulatif kelas ke-k
adalah jumlah frekuensi pada kelas yang dimaksud dengan frekuensi kelas-kelas
sebelumnya.
Ada dua macam frekuensi kumulatif,
yaitu
- frekuensi kumulatif "kurang dari"
("kurang dari" diambil terhadap tepi atas kelas);
- frekuensi kumulatif "lebih dari" ("lebih
dari" diambil terhadap tepi bawah kelas).
Tepi atas = batas atas
+ ½ satuan
pengukuran
Tepi bawah = batas bawah
- ½ satuan
pengukuran
Contoh
Soal 5
Dari Tabel 4. untuk interval kelas
46 – 55 (kelas 4), hitunglah
a. frekuensi relatif;
b. frekuensi kumulatif "kurang
dari";
c. frekuensi kumulatif "lebih
dari".
Penyelesaian
5
a. Frekuensi relatif kelas ke-4 =
(frekuensi kelas ke-4 / banyak datum) x 100 % = 10/35 x 100% = 28,57%
b. Frekuensi kumulatif "kurang
dari" untuk interval kelas 46 – 55
= 5 + 3 + 9 + 10 = 27 (kurang dari
tepi atas kelas 55,5)
c. Frekuensi kumulatif "lebih
dari" untuk interval kelas 46 – 55
= 10 + 6 + 2 = 18 (lebih dari tepi
bawah kelas 45,5).
3.3. Histogram dan Poligon Frekuensi
Histogram merupakan diagram
frekuensi bertangga yang bentuknya seperti diagram batang. Batang yang
berdekatan harus berimpit. Untuk pembuatan histogram, pada setiap interval
kelas diperlukan tepi-tepi kelas. Tepi-tepi kelas ini digunakan unntuk
menentukan titik tengah kelas yang dapat ditulis sebagai berikut.
Titik tengah kelas
= ½ (tepi atas kelas + tepi bawah kelas)
Poligon frekuensi dapat dibuat
dengan menghubungkan titik-titik tengah setiap puncak persegipanjang dari
histogram secara berurutan. Agar poligon "tertutup" maka sebelum
kelas paling bawah dan setelah kelas paling atas, masing-masing ditambah satu
kelas.
Contoh
Soal 6
Tabel distribusi frekuensi hasil
ujian matematika Kelas XI SMA Cendekia di Kalimantan Barat diberikan pada Tabel
6. Buatlah histogram dan poligon frekuensinya.
Tabel
6. Tabel distribusi frekuensi hasil ujian matematika Kelas XI SMA Cendekia di
Kalimantan Barat
|
Kelas Interval
|
Frekuensi
|
|
21–30
|
2
|
|
31–40
|
3
|
|
41–50
|
11
|
|
51–60
|
20
|
|
61–70
|
33
|
|
71–80
|
24
|
|
81–90
|
7
|
|
100
|
Jawaban
6
Dari histogram tersebut tampak bahwa
kebanyakan siswa memperoleh nilai antara 60,5 dan 70,5. Coba Anda ceritakan hal
lain dari histogram tersebut.
3.4.
Ogive (Ogif)
Grafik yang menunjukkan frekuensi
kumulatif kurang dari atau frekuensi kumulatif lebih dari dinamakan poligon
kumulatif.
Untuk populasi yang besar, poligon
mempunyai banyak ruas garis patah yang menyerupai kurva sehingga poligon
frekuensi kumulatif dibuat mulus, yang hasilnya disebut ogif.
Ada dua macam ogif, yaitu sebagai
berikut.
a. Ogif dari frekuensi kumulatif
kurang dari disebut ogif positif.
b. Ogif dari frekuensi kumulatif
lebih dari disebut ogif negatif.
Contoh
Soal 7
Tabel 7. dan 8. berturut-turut
adalah tabel distribusi frekuensi kumulatif "kurang dari" dan
"lebih dari" tentang nilai ulangan Biologi Kelas XI SMA 3.
Tabel
7. Tabel distribusi frekuensi kumulatif "kurang dari" tentang nilai
ulangan Biologi Kelas XI SMA 3.
|
Nilai
|
Frekuensi
|
|
< 20,5
|
0
|
|
< 30,5
|
2
|
|
< 40,5
|
5
|
|
< 50,5
|
16
|
|
< 60,5
|
36
|
|
< 70,5
|
69
|
|
< 80,5
|
93
|
|
< 90,5
|
100
|
Tabel
8. Tabel distribusi frekuensi kumulatif "lebih
dari" tentang nilai ulangan Biologi Kelas XI SMA 3.
|
Nilai
|
Frekuensi
|
|
> 20,5
|
100
|
|
> 30,5
|
98
|
|
> 40,5
|
95
|
|
> 50,5
|
84
|
|
> 60,5
|
64
|
|
> 70,5
|
31
|
|
> 80,5
|
7
|
|
> 90,5
|
0
|
a. Buatlah ogif positif dan ogif
negatif dari tabel tersebut.
b. Berapakah jumlah siswa yang
mempunyai nilai Biologi kurang dari 85?
c. Berapakah jumlah siswa yang
mempunyai berat badan lebih dari 40?
Pembahasan
8
a. Ogif positif dan ogif negatif
dari tabel tersebut tampak pada gambar 5.
b. Dari kurva ogif positif, tampak
siswa yang mempunyai nilai kurang dari 85 adalah sebanyak 93 orang.
c. Dari kurva ogif negatif, tampak
siswa yang mempunyai nilai lebih dari 40 adalah sebanyak 96 orang.




