Human realities in the light of sociology , anthropology, and psychology

DATA, KEGUNAAN DAN FUNGSINYA.

Anda sebagai individu, seorang manajer, atau mungkin seorang pengusaha, menginginkan untuk:
v Mengetahui siapa saja yang akan pensiun tahun depan, dari bagian mana, apa jabatannya, berapa pesangon yang akan didapat, dan sebagainya. Tujuannya adalah antara lain:
• Mempersiapkan dana, berapa besarnya untuk pembayaran pesangon mereka.
• Mempersiapkan penerimaan karyawan baru untuk mengganti karyawan yang bakal pensiun tersebut (walaupun tidak semua).
Untuk maksud tersebut, Anda memerlukan data berupa data pegawai, yang mungkin cukup didapat dari dalam perusahaan sendiri.
v Mengetahui tingkat kepuasan konsumen produk yang anda pasarkan, bagaimana respon mereka terhadap mutu produk Anda, harga, pelayanan dan sebagainya. Untuk inipun, Anda perlu data, malah mungkin data tersebut perlu dikumpulkan di lapangan melalui survei (terlepas dari apakah dilakukan sendiri atau dengan membayar lembaga riset yang Anda percayai).
v Mengetahui apakah proses produksi saat ini masih terkendali atau tidak. Berapa persen dari produksi yang tertolak karena dianggap cacat, lengkap dengan perinciannya per mesin, per lokasi, kapan, mengapa dan lain-lain. Untuk inipun, Anda memerlukan data (yang didapat dari bagian produksi).
v Mengetahui perkembangan perekonomian (trend) untuk jangka waktu tertentu, pertumbuhan penduduk penduduk, pendapatan nasional dan sebagainya . Termasuk juga mengetahui faktor-faktor atau variabel yang mempengaruhi pertumbuhan ekonomi.

Dari contoh-contoh tersebut diatas, kita mengetahui betapa pentingnya data. Dengan data, kita mengetahui gambaran perusahaan sekarang, masalah apa yang sedang dihadapi, mengapa terjadi masalah-masalah tersebut, bagaimana cara pemecahannya. Dengan data, kita dapat meramal atau memperkirakan, apa yang kira-kira bakal terjadi di masa mendatang. Dengan data, kita pun bisa membuat perencanaan, peramalan, mengontrol pelaksanaan, mengevaluasi target apakah tercapai atau tidak, dan sebagainya. Dengan adanya data, kita dapat banyak mengetahui tentang berbagai hal. Dengan data, kita bisa mengambil keputusan-keputusan, kebijakan-kebijakan perusahaan, dan sebagainya. Pendeknya, fungsi dan manfaat data sangat penting dan banyak sekali. Sering kali, akan berbahaya jika kita mengambil kesimpulan dan keputusan tanpa didukung oleh data. Orang bilang ”Speak with data”, berbicaralah dengan data agar objektif dan lebih akurat. Sebenarnya apa itu data?

PENGERTIAN DATA DAN PENGGOLONGANNYA

Dari uraian di atas, sebenarnya data adalah kumpulan keterangan atau informasi yang diperoleh dari suatu pengamatan, dapat berupa angka, lambang atau sifat. Jika kita mendapatkan data yang tidak baik, sebaik apa pun cara pengolahan data yang kita lakukan, hasilnya atau kesimpulan yang didapat dari data tersebut tetap tidak baik. Semisal, ungkapan ”garbage in, garbage out”, yang artinya jika yang masuk sampah, yang keluar pun juga sampah. Jadi, syarat utama agar analisa data secara statistik menghasilkan informasi atau kesimpulan yang baik adalah data yang diolah haruslah juga baik.

Apa itu data yang baik? Data yang baik adalah data yang sifatnya representatif (mewakili), objektif (sesuai dengan apa yang ada atau yang terjadi), relevan (ada hubungannya dengan persoalan yang sedang dihadapi dan akan dipecahkan), mempunyai tingkat ketelitian yang tinggi atau standard error (kesalahan baku) yang kecil.

Dari mana data diperoleh? Data dapat diperoleh dari sumber internal (internal data) dan sumber eksternal (external data). Data internal adalah data yang didapat oleh organisasi itu sendiri untuk keperluan operasi sehari-hari. Organisasi dimaksud dapat berupa instansi pemerintah maupun swasta, misalnya departemen-departemen, Biro Pusat Statistik, BAPPENAS, BUMN, perusahaan-perusahaan swasta dan sebagainya. Sedangkan, data eksternal adalah data yang didapat dari luar organisasi yang bersangkutan, biasanya menggambarkan keadaan di luar organisasi tersebut. Contoh data jenis ini misalnya data pendapatan nasional, penduduk, harga-harga bahan pokok yang dukumpulkan oleh Biro Pusat Statistik, data keuangan negara yang dikumpulkan oleh departemen keuangan, data perbankan dari Bank Indonesia dan sebagainya, termasuk data yang dikumpulkan oleh badan-badan internasional, seperti UNESCO, IMF, FAO dan lain-lain.

1. DATA KUANTITATIF DAN DATA KUALITATIF

v DATA KUANTITATIF
Banyak data yang berbentuk angka atau bilangan, misalnya luas tanah, jumlah penduduk dan sebagainya. Untuk jenis data ini dapat dilakukan perhitungan-perhitungan atau operasi matematika, seperti penambahan, pengurangan, perkalian, pembagian dan sebagainya. Data kuantitatif nilainya bisa berubah-ubah sehingga disebut variabel.
Data kuantitatif dapat dibagi atas:
• Data Interval
Ukuran data mempunyai interval atau jarak, misalnya berat badan antara 50-60 kg.
• Data Rasio
Data berupa angka dalam arti yang sebenarnya, sehingga mempunyai nilai nol.
Data jenis ini diperoleh melalui pengukuran dan memiliki tingkat pengukuran paling tinggi diantara jenis data lainnya.

v DATA KUALITATIF
Data kualitatif adalah data yang bukan berbentuk angka atau bilangan, misalnya kepuasan pelanggan (sangat puas, puas, kurang puas dan sebagainya), sehingga kita tidak dapat melakukan operasi matematika terhadapnya. Jenis data ini disebut atribut.
Data kualitatif dapat dibagi atas:
• Data nominal
Ukuran data nominal adalah kategori, misalnya jenis kelamin, laki-laki atau wanita, tempat tinggal dan sebagainya. Dilihat dari tingkat pengukuran data, data nominal mempunyai tingkatan yang paling rendah dari jenis data lainnya. Hal tersebut karena walaupun dalam prakteknya data ini bisa diangkakan, tetapi terhadapnya tidak bisa dilakukan operasi matematika. Contoh pemberian angka tersebut di atas misalnya, angka ’1’ untuk yang tinggal di Jakarta, ’2’ untuk yang tinggal di Bandung, ’3’ untuk Surabaya dan sebagainya.
• Data Ordinal
Data ordinal hampir sama dengan data nominal, hanya saja data orrdinal mempunyai tingkatan data atau urutan kelas, ada yang lebih tinggi ada yang lebih rendah. Contoh data ini adalah data tentang kepuasan pelanggan, yang dibagi menjadi sangat puas, tidak puas, antara puas dan tidak puas, tidak puas dan sangat tidak puas. Data ordinal mempunyai tingkatan yang lebih tinggi dari data nominal. Walaupun mempunyai tingkatan, terhadap jenis data ini kita tetap tidak dapat melakukan operasi matematika.

Dilihat dari tingkat data, urutan dari yang paling tinggi adalah data rasio, data interval, data ordinal dan paling rendah data nominal.Untuk mengolah data kualitatif (data nominal dan ordinal), biasanya digunakan statistik non parametrik, sedangkan untuk data kuantitatif digunakan statistik parametrik.

2. DATA INTERNAL DAN DATA EKSTERNAL

• DATA INTERNAL
Data yang berasal dari dalam organisasi atau perusahaan sendiri. Data jenis ini biasanya berkaitan langsung dengan organisasi sendiri, misalnya data keuangan (neraca, laporan laba-rugi dan sebagainya), data kepegawaian, data produksi dan lain-lain.
• DATA EKSTERNAL
Data yang berasal bukan dari dalam organisasi perusahaan sendiri. Data ini sering tidak berkaitan langsung dengan organisasi sendiri, misalnya data tentang jumlah kendaraan di Jakarta, jumlah penduduk di suatu desa dan lain-lain.

3. DATA PRIMER DAN DATA SEKUNDER

• DATA PRIMER
Data yang dukumpulkan, diolah serta diterbitkan sendiri oleh organisasi yang menggunakannya. Contoh jenis data ini adalah data kependudukan yang dibuat oleh Biro Pusat Statistik, data tentang pertanian yang dibuat oleh Departemen Pertanian dan sebagainya.
• DATA SEKUNDER
Data yang tidak dibuat atau diterbitkan oleh penggunanya, misalnya data tentang jumlah kendaraan dari Departemen Perhubungan merupakan data primer bagi Departemen tersebut karena dibuat dan diterbitkannya, tapi merupakan data sekunder bagi PT X sebagai pengguna, yang mendapatkannya dari sumber lain (misalnya media massa) yang mengutipnya. Jadi, orang bisa mendapatkan data sekunder dari harian, majalah, buletin dan media massa lainnya yang mengutip data dari sumber-sumber lain yang menerbitkannya (misalnya data dikutip dari departemen, Biro Pusat Statistik, Bank Indonesia dan lain-lain). Dengan demikian, data eksternal bisa berupa data primer, bisa juga berupa data sekunder.

4. DATA DISKRIT DAN DATA KONTINYU

Seperti telah dikatakan di muka, data kuantitatif disebut variabel, karena nilainya atau besarnya bisa berubah-ubah, data ini dapat mempunyai variabel diskrit sehingga disebut data diskrit, dapat juga mempunyai variabel kontinyu atau indiskrit dan disebut dengan data kontinyu.

Data diskrit adalah data yang sifatnya terputus-putus, nilainya bukan merupakan pecahan (angka utuh). Sedangkan data kontinyu adalah data yang sifatnya sinambung atau kontinyu, nilainya bisa berupa pecahan. Contoh data diskrit adalah data tentang jumlah penduduk, kendaraan dan sebagainya, sedangkan contoh data kontinyu adalah data tentang hasil panen padi, panjang jalan, berat sapi dan sebagainya.

Gambar I. Jenis Data

sumber: Kuncoro, 2001:24

Statistik atau statistika adalah ilmu yang berhubungan dengan cara pengumpulan, pengolahan atau analisis, penyajian data dan cara pengambilan kesimpulannya. Fungsi utamanya adalah membantu dalam pengambilan keputusan dan keputusan tentang parameter populasi dengan menggunakan data sampel yang diambil dari populasi tersebut.

PENGGOLONGAN STATISTIK

Statistik dapat digolongkan dengan berbagai cara.

STATISTIK DESKRIPTIF DAN INDUKTIF (INFERENSI)
• STATISTIK DESKRIPTIF
Statistik Deskriptif berusaha menjelaskan atau menggambarkan berbagai karakteristik data, seperti berapa rata-ratanya, seberapa jauh data bervariasi dan sebagainya, tanpa membuat interpretasi apa-apa terhadap data tersebut.
• STATISTIK INDUKTIF (INFERENSI)
Statistik Induktif berusaha membuat berbagai inferensi terhadap sekumpulan data yang berasal dari suatu sampel. Tindakan inferensi tersebut misalnya melakukan perkiraan, peramalan, pengambilan keputusan dan sebagainya.

STATISTIK PARAMETRIK DAN NON PARAMETRIK

• STATISTIK PARAMETRIK
Statistik Parametrik adalah statistik induktif untuk populasi yang parameternya telah memenuhi persyaratan-persyaratan tertentu (misalnya, sebaran data mengikuti distribusi normal)
• SATISTIK NON PARAMETRIK
Statistik non parametrik adalah statistik induktif yang berusaha mengambil kesimpulan tentang keseluruhan populasi yang parameternya tidak memenuhi persyaratan, yaitu tidak mengikuti suatu distribusi tertentu. Jadi, statistik non parametrik digunakan untuk populasi yang tidak menetapkan persyaratan-persyaratan parameter populasinya.

PENGERTIAN DALAM STATISTIK PENTING YANG PERLU DIPAHAMI: POPULASI, ELEMEN, SAMPLING DAN SAMPEL

Populasi adalah kumpulan semua elemen yang ada yang akan diobservasi atau diteliti, sedangkan sampling adalah pengambilan sebagian kecil dari seluruh elemen populasi tersebut yang dijadikan sebagai contoh atau sampel yang dianggap dapat mewakili seluruh elemen dalam populasi. Sedangkan sampling adalah cara pengumpulan data dengan mengambil sampel atau contoh dari seluruh anggota populasi.

Misalkan, ada 100 orang murid kelas 3 di SMU Garuda. Pimpinan Sekolah ingin melihat prestasi ujian matematika mereka pada tahun 2001 yang lalu dan untuk itu diadakan pencatatan nilai ujian dari setiap murid yang berjumlah 100 murid tersebut satu per satu tanpa kecuali. Setiap murid tersebut disebut elemen. Kumpulan dari 100 orang murid tersebut (seluruh elemen) disebut populasi dan pekerjaan untuk meneliti seluruh elemen yang terdapat dalam populasi disebut sensus. Jika untuk maksud tersebut, hanya diambil 20 murid saja sebagai contoh, hal tersebut disebut sampling, dan contoh yang diambil dinamakan sampel.

Jika data yang didapat dari sensus dinamakan data sebenarnya (true value), data yang terdapat dari sampling merupakan data dugaan sehingga nilainya dinamakan nilai perkiraan (estimate value). Nilai perkiraan tentunya tidak akan sama betul dengan nilai sebenarnya, tentu ada selisih. Selisih ini disebut kesalahan perkiraan (error estimate) atau kesalahan sampling (sampling error) dan jika nilainya kecil, cara pengumpulan data dengan sampling masih dapat dipertanggung-jawabkan.

Agar data yang diperoleh dari sampling mempunyai nilai kepercayaan yang tinggi (valid) atau nilai kesalahan perkiraannya sekecil mungkin, dalam pengambilan sampel kita harus mengikuti metode pengambilan sampel yang baik (termasuk jumlah sampel yang harus diambil), sesuai dengan keadaan populasinya. Ada berbagai macam teknik sampling namun tidak akan dibahas di sini.(Silakan lihat Modul Metode Penelitian)

Alasan-alasan mengapa kita menggunakan sampling:
• Menghemat waktu, tenaga dan biaya.
• Secara teknis, tidak mungkin mengamati seluruh anggota populasi. Misalnya, meneliti seluruh jumlah ikan yang terdapat di suatu sungai, meneliti seluruh jumlah kelelawar di suatu hutan, jumlah seluruh kendaraan di suatu negara dan sebagainya.
• Pengamatan terhadap seluruh anggota populasi dapat bersifat merusak. Misalnya, pengaruh pemakaian narkoba terhadap kerusakan otak.
• Contoh lain-lain yang bergantung pada pertimbangan peneliti atau pengguna data.

Secara teoritis atau logika, hasil analisa atau pengolahan data yang dihasilkan oleh sensus (harusnya) memberikan data yang sebenarnya (true value). Sebaliknya, karena sampling hanya mengambil sebagian elemen saja yang ada dalam populasi, hasil analisa datanya hanya merupakan perkiraan (estimate value). Mengingat alasan-alasan dan pertimbangan-pertimbangan tersebut, khususnya oleh karena sensus biasanya memerlukan biaya, tenaga dan waktu yang lebih banyak dibandingkan dengan sampling, maka pada umumnya penelitian dilakukan hanya dengan cara sampling saja, dengan catatan pelaksanaan sampling tersebut dilakukan dengan baik. Baik dalam hal ini artinya, baik metode sampling maupun pelaksanaan pengumpulan datanya dilakukan dengan benar dan cermat, sehingga perkiraan yang diperoleh tidak banyak berbeda dari keadaan populasi yang sebenarnya.
Sampling yang baik pun tidak akan sempurna betul, selalu ada ketidaksempurnaan atau kesalahan (sampling error). Untuk dapat mewakili seluruh elemen dalam populasi harus diusahakan agar sampling dilaksanakan dengan sebaik-baiknya sehingga kesalahan yang terjadi dapat sekecil mungkin. Jadi, seperti halnya dalam sensus, dalam melakukan sampling pun, kesalahan selalu dapat terjadi. Jika nilai sampling ternyata sama betul dengan nilai yang sebenarnya seperti yang dilakukan pada sensus, hal tersebut hanya bersifat kebetulan.

Berapa besarnya sampel agar didapat data yang baik sehingga dapat mewakili suatu populasi? Untuk mengetahui berapa jumlah sampel, biasanya digunakan rumus-rumus sebagai berikut :

E = Kesalahan atau error yang diizinkan menyangkut ketelitian pendugaan.
Z = Nilai Z yang sesuai dengan interval keyakinan yang digunakan, yaitu 1,96 untuk I.K = 95% dan 2,58 untuk I.K = 99%.
S = Deviasi standar dari pra-survey yang dilakukan dengan sampel yang kecil untuk menduga deviasi standar populasi.

Untuk proporsi

P = Estimasi atau perkiraan proporsi populasi
Z = Nilai Z yang sesuai dengan interval keyakinan yang ditentukan
E = Kesalahan (error) maksimum yang diizinkan

Kesalahan (error) yang diizinkan misalnya sebesar 5%, berarti ketelitian yang diinginkan dalam pendugaan parameter populasi (interval keyakinan) adalah sebesar 95% (100%-5%), dan jika error yang diizinkan sebesar 1%, berarti tingkat ketelitian (interval keyakinan) yang ingin dicapai sebesar 99% (100%-1%). Dengan demikian, besarnya sampel bergantung pada interval keyakinan yang digunakan (error maksimum yang diizinkan) dan deviasi standar atau estimasi proporsi populasi (ukuran sampel untuk proporsi). Jika deviasi standar atau proporsi populasi belum diketahui, kita perlu mengadakan survey pendahuluan dengan ukuran sampel yang kecil untuk menduga deviasi standar populasi. Deviasi standar populasi dapat juga dilakukan berdasarkan pengetahuan tentang populasi.

Perhitungan deviasi standar distribusi sampling harus dikoreksi dengan faktor koreksi sebesar

Jika ukuran sampel (n) dibagi ukuran populasi (N) relatif cukup besar, akan tetapi jika ukuran populasi besar sekali apalagi tak terhingga atau ukuran populasi terbatas tapi relatif kecil, faktor koreksi tidak diperlukan.

Dari rumus tersebut di atas, semakin tinggi interval keyakinan maka semakin besar ukuran sampel yang dibutuhkan. Untuk lebih jelasnya, jika kita ingin yakin 100% interval duga akan sama dengan parameter populasi jumlah sampel yang harus diambil adalah seluruh populasi, ini berarti sama dengan sensus.

PARAMETER DAN SAMPLING ERROR

Seperti telah diterangkan dimuka, baik dalam melaksanakan sensus maupun cara pengambilan sampel (sampling), kesalahan dapat saja terjadi (error sampling) baik disengaja maupun yang tidak disengaja. Jenis kesalahan yang mungkin terjadi dimaksud adalah:
• Kesalahan secara umum (baik sensus maupun sampling):
• Kesalahan mencatat (recording’s error),
• Kesalahan mengukur (measurement’s error),
• Kesalahan menjawab (response’s error),
• Kesalahan mengingat (recal’s error),
• Kesalahan mengamati (observation’s error) dan sebagainya.
• Kesalahan lainnya khusus dalam sampling :
• Kesalahan penentuan responden (misspecification of sample subject).
• Kesalahan variasi acak (random variation error).
• Kesalahan penarikan sampel (sampling error).
• Kesalahan spesifikasi (specification error).
• Kesalahan karena tidak lengkapnya respon (non response error).
• Kesalahan karena tidak lengkapnya cakupan elemen populasi (coverage error) dan sebagainya.

1. Penyajian Data dalam Bentuk Tabel

Misalkan, hasil ulangan Bahasa Indonesia 37 siswa kelas XI SMA 3 disajikan dalam tabel di bawah. Penyajian data pada Tabel 1.1 dinamakan penyajian data sederhana. Dari tabel 1.1, Anda dapat menentukan banyak siswa yang mendapat nilai 9, yaitu sebanyak 7 orang. Berapa orang siswa yang mendapat nilai 5? Nilai berapakah yang paling banyak diperoleh siswa?

Jika data hasil ulangan bahasa Indonesia itu disajikan dengan cara mengelompokkan data nilai siswa, diperoleh tabel frekuensi berkelompok seperti pada Tabel 2.. Tabel 2. dinamakan Tabel Distribusi Frekuensi.

Tabel 1. Penyajian data sederhana

Nilai	Frekuensi
2	7
4	3
5	5
6	4
7	10
9	7
10	1

Tabel 2. Tabel Distribusi Frekuensi

Interval Kelas	Turus	Frekuensi
1–2	EB	7
3–4	C	3
5–6	EC	8
7–8	EE	10
9–10	EC	8
	Jumlah	37

2. Penyajian Data dalam Bentuk Diagram

Kerapkali data yang disajikan dalam bentuk tabel sulit untuk dipahami. Lain halnya jika data tersebut disajikan dalam bentuk diagram maka Anda akan dapat lebih cepat memahami data itu. Diagram adalah gambar yang menyajikan data secara visual yang biasanya berasal dari tabel yang telah dibuat. Meskipun demikian, diagram masih memiliki kelemahan, yaitu pada umumnya diagram tidak dapat memberikan gambaran yang lebih detail.

2.1. Diagram Batang

Diagram batang biasanya digunakan untuk menggambarkan data diskrit (data cacahan). Diagram batang adalah bentuk penyajian data statistik dalam bentuk batang yang dicatat dalam interval tertentu pada bidang cartesius.

Ada dua jenis diagram batang, yaitu :

diagram batang vertikal, dan
diagram batang horizontal.

Contoh Soal 1

Selama 1 tahun, toko "Anggo" mencatat keuntungan setiap bulan sebagai berikut.

Tabel 3. Keuntungan Toko "Anggo" per Bulan (dalam jutaan rupiah)

Bulan ke	2,5	1,8	2,6	4,2	3,5	3,3	4,0	5,0	2,0	4,2	6,2	6,2
Keuntungan	1	2	3	4	5	6	7	8	9	10	11	12

a. Buatlah diagram batang vertikal dari data tersebut.

b. Berapakah keuntungan terbesar yang diperoleh Toko "Anggo" selama 1 tahun?

c. Kapan Toko "Anggo" memperoleh keuntungan yang sama selama dua bulan berturut-turut?

Penyelesaian 1

a. Diagram batang vertikal dari data tersebut, tampak pada gambar berikut.

Gambar 1. Diagram batang vertikal Keuntungan Toko "Anggo" per Bulan (dalam jura rupiah)

b. Dari diagram tersebut tampak bahwa keuntungan terbesar yang diperoleh Toko "Anggo" selama 1 tahun adalah sebesar Rp 6.200.000,00.

c. Toko "Anggo" memperoleh keuntungan yang sama selama dua bulan beturut-turut pada bulan ke-11 dan ke-12.

2.2. Diagram Garis

Pernahkah Anda melihat grafik nilai tukar dolar terhadap rupiah atau pergerakan saham di TV? Grafik yang seperti itu disebut diagram garis. Diagram garis biasanya digunakan untuk menggambarkan data tentang m keadaan yang berkesinambungan (sekumpulan data kontinu). Misalnya, jumlah penduduk setiap tahun, perkembangan berat badan bayi setiap bulan, dan suhu badan pasien setiap jam.

Seperti halnya diagram batang, diagram garis pun memerlukan sistem sumbu datar (horizontal) dan sumbu tegak (vertikal) yang saling berpotongan tegak lurus. Sumbu mendatar biasanya menyatakan jenis data, misalnya waktu dan berat. Adapun sumbu tegaknya menyatakan frekuensi data. Langkah-langkah yang dilakukan untuk membuat diagram garis adalah sebagai berikut.

Buatlah suatu koordinat (berbentuk bilangan) dengan sumbu mendatar menunjukkan waktu dan sumbu tegak menunjukkan data pengamatan.
Gambarlah titik koordinat yang menunjukkan data pengamatan pada waktu t.
Secara berurutan sesuai dengan waktu, hubungkan titiktitik koordinat tersebut dengan garis lurus.

Contoh Soal 2

Berikut ini adalah tabel berat badan seorang bayi yang dipantau sejak lahir sampai berusia 9 bulan.

Usia (bulan)	3,5	4	5,2	6,4	6,8	7,5	7,5	8	8,8	8,6
Berat Badan (kg)	0	1	2	3	4	5	6	7	8	9

a. Buatlah diagram garisnya.

b. Pada usia berapa bulan berat badannya menurun?

c. Pada usia berapa bulan berat badannya tetap?

Pembahasan 2

a. Langkah ke-1

Buatlah sumbu mendatar yang menunjukkan usia anak (dalam bulan) dan sumbu tegak yang menunjukkan berat badan anak (dalam kg).

Langkah ke-2

Gambarlah titik koordinat yang menunjukkan data pengamatan pada waktu t bulan.

Langkah ke-3

Secara berurutan sesuai dengan waktu, hubungkan titik-titik koordinat tersebut dengan garis lurus.

Dari ketiga langkah tersebut, diperoleh diagram garis dari data tersebut tampak pada Gambar 2.

Gambar 2. Diagram garis berat badan bayi sejak usia 0 bulan–9 bulan

b. Dari diagram tersebut dapat dilihat bahwa berat badan bayi menurun pada usai 8 sampai 9 bulan.

c. Berat badan bayi tetap pada usia 5 sampai 6 bulan. Darimana Anda memperoleh hasil ini? Jelaskan.

Observasi: Interpolasi dan Ekstrapolasi Data

Anda dapat melakukan observasi terhadap kecenderungan data yang disajikan pada suatu diagram garis. Dari observasi ini, Anda dapat membuat perkiraan-perkiraan dengan cara interpolasi dan ekstrapolasi. Hal ini ditempuh dengan mengganti garis patah pada diagram garis menjadi garis lurus. Interpolasi data adalah menaksir data atau memperkirakan data di antara dua keadaan (misalnya waktu) yang berurutan. Misalkan, dari gambar grafik Contoh soal 2. dapat diperkirakan berat badan bayi pada usia 5,5 bulan. Coba Anda amati grafik tersebut, kemudian tentukan berat badan bayi pada usia 5,5 bulan.

Ekstrapolasi data adalah menaksir atau memperkirakan data untuk keadaan (waktu) mendatang. Cara yang dapat dilakukan untuk ekstrapolasi adalah dengan memperpanjang ruas garis terujung ke arah kanan. Misalkan, dari gambar grafik soal 2. dapat diperkirakan berat badan bayi pada usia 10 bulan. Jika garis lurus sudah ditentukan, Anda dapat menentukan interpolasi data. Untuk ekstrapolasi data, Anda harus berhati-hati. Menurut diagram garis, berapa kira-kira berat badan bayi pada usia 10 bulan? Berikan alasan Anda.

2.3. Diagram Lingkaran

Untuk mengetahui perbandingan suatu data terhadap keseluruhan, suatu data lebih tepat disajikan dalam bentuk diagram lingkaran. Diagram lingkaran adalah bentuk penyajian data statistika dalam bentuk lingkaran yang dibagi menjadi beberapa juring lingkaran.

Langkah-langkah untuk membuat diagram lingkaran adalah sebagai berikut.

Buatlah sebuah lingkaran pada kertas.
Bagilah lingkaran tersebut menjadi beberapa juring lingkaran untuk menggambarkan kategori yang datanya
telah diubah ke dalam derajat.

Agar lebih jelasnya, pelajarilah contoh berikut.

Contoh Soal 3

Tabel berikut menunjukkan banyaknya siswa di suatu kabupaten menurut tingkat sekolah pada tahun 2007.

Tingkat Pendidikan	Banyaknya Siswa
SD SMP SMA	175 600 225

a. Buatlah diagram lingkaran untuk data tersebut.

b. Berapa persen siswa yang menyelesaikan sekolah sampai pada tingkat SMP?

c. Berapa persen siswa yang menyelesaikan sekolah sampai pada tingkat SMA?

Pembahasan 3

a. Jumlah seluruh siswa adalah 1.000 orang. Seluruh siswa diklasifikasikan menjadi 5 katagori: SD = 175 orang, SMP = 600 orang, dan SMA = 225 orang.

• Siswa SD = (175/1.000) x 100% = 17,5%

Besar sudut sektor lingkaran = 17,5% × 360° = 63°

• Siswa SMP = (600/1.000) x 100% = 60%

Besar sudut sektor lingkaran = 60% × 360° = 216°

• Siswa SMA= (225/1.000) 100% = 22,5%

Besar sudut sektor lingkaran = 22,5% × 360° = 81°

Diagram lingkaran ditunjukkan pada Gambar 3.

Gambar 3. Diagram lingkaran banyaknya siswa di suatu kabupaten menurut tingkat sekolah pada tahun 2007

b. Persentase siswa yang menyelesaikan sekolah sampai pada tingkat SMP adalah 60%.

c. Persentase siswa yang menyelesaikan sekolah sampai pada tingkat SMAadalah 22,5%.

3. Tabel Distribusi Frekuensi, Frekuensi Relatif dan Kumulatif, Histogram, Poligon Frekuensi, dan Ogive

3.1. Tabel Distribusi Frekuensi

Data yang berukuran besar (n > 30) lebih tepat disajikan dalam tabel distribusi frekuensi, yaitu cara penyajian data yang datanya disusun dalam kelas-kelas tertentu.

Langkah-langkah penyusunan tabel distribusi frekuensi adalah sebagai berikut.

• Langkah ke-2 menentukan banyak interval (K) dengan rumus "Sturgess" yaitu: K= 1 + 3,3 log n dengan n adalah banyak data. Banyak kelas harus merupakan bilangan bulat positif hasil pembulatan.

• Langkah ke-3 menentukan panjang interval kelas (I) dengan menggunakan rumus:

I = J/K

• Langkah ke-4 menentukan batas-batas kelas. Data terkecil harus merupakan batas bawah interval kelas pertama atau data terbesar adalah batas atas interval kelas terakhir.

• Langkah ke-5 memasukkan data ke dalam kelas-kelas yang sesuai dan menentukan nilai frekuensi setiap kelas dengan sistem turus.

• Menuliskan turus-turus dalambilangan yang bersesuaian dengan banyak turus.

Ingatlah :

Menentukan banyak kelas interval dengan aturan Sturges dimaksudkan agar interval tidak terlalu besar sebab hasilnya akan menyimpang dari keadaan sesungguhnya. Sebaiknya, jika interval terlalu kecil, hasilnya tidak menggambarkan keadaan yang diharapkan.

Contoh Soal 4

Seorang peneliti mengadakan penelitian tentang berat badan dari 35 orang.

Data hasil penelitian itu (dalam kg) diberikan berikut ini:

48 32 46 27 43 46 25 41 40 58 16 36

21 42 47 55 60 58 46 44 63 66 28 56

50 21 56 55 25 74 43 37 51 53 39

Sajikan data tersebut ke dalam tabel distribusi frekuensi.

Jawaban 4

1. Jangkauan (J) = Xm- Xn = 74 – 16 = 58.

2. Banyak kelas (K) = 1 + 3,3 log n = 1 + 3,3 log 35 = 6,095. Banyak kelas dibulatkan menjadi "6".

3. Panjang interval kelas (I) adalah I = J/K = 58/6 = 9,67. Panjang interval kelas dibulatkan menjadi "10".

Dengan panjang interval kelas = 10 dan banyak kelas = 6, diperoleh tabel distribusi frekuensi seperti pada Tabel 4. atau Tabel 5

Cara I: Batas bawah kelas pertama diambil datum terkecil. Amati Tabel 4. Dari tabel tersebut tampak bahwa frekuensi paling banyak dalam interval 46–55. Artinya, berat badan kebanyakan berkisar antara 46 kg dan 55 kg.

Tabel 4. Tabel distribusi frekuensi

Interval Kelas	Turus	Frekuensi
16–25	E	5
26–35	C	3
36–45	ED	9
46–55	EE	10
56–65	EA	6
66–75	B	2
	Jumlah	35

Cara II: Batas atas kelas terakhir diambil datum terbesar. Amati Tabel 5.

Tabel 5. Tabel distribusi frekuensi

Interval Kelas	Turus	Frekuensi
15–24	C	3
25–34	E	5
35–44	ED	9
45–54	EC	8
55–64	EC	8
65–74	B	2
	Jumlah	35

Dari tabel tampak frekuensi paling sedikit dalam interval 65–74. Artinya, berat badan antara 65 kg dan 74 kg ada 2 orang. Perhatikan interval kelas yang pertama, yaitu 15–24. 15 disebut batas bawah dan 24 disebut batas atas. Ukuran 15–24 adalah hasil pembulatan, ukuran yang sebenarnya terletak pada 14,5–24,5. 14,5 disebut tepi bawah kelas (batas bawah nyata) dan 24,5 disebut tepi atas kelas (batas atas nyata) pada interval kelas 15–24.

Dalam menentukan tepi bawah kelas dan tepi atas kelas pada setiap interval kelas, harus diketahui satuan yang dipakai. Dengan demikian, untuk tepi bawah kelas adalah batas bawah kelas dikurangi 1/2 satuan ukuran. Jadi, tepi kelas dari interval kelas 15–24 menjadi 14,5–24,5.

3.2. Frekuensi Relatif dan Kumulatif

Frekuensi yang dimiliki setiap kelas pada tabel distribusi frekuensi bersifat mutlak. Adapun frekuensi relatif dari suatu data adalah dengan membandingkan frekuensi pada interval kelas itu dengan banyak data dinyatakan dalam persen. Contoh: interval frekuensi kelas adalah 20. Total data seluruh interval kelas = 80 maka frekuensi relatif kelas ini adalah 20/8 = ¼, sedangkan frekuensi relatifnya adalah ¼ × 100% = 25%.

Dari uraian tersebut, dapatkah Anda menyatakan rumus frekuensi relatif? Cobalah nyatakan rumus frekuensi relatif dengan kata-kata Anda sendiri.

Frekuensi relatif dirumuskan sebagai berikut.

Frekuensi relatif kelas ke-k = frekuensi kelas ke-k / banyak data

Frekuensi kumulatif kelas ke-k adalah jumlah frekuensi pada kelas yang dimaksud dengan frekuensi kelas-kelas sebelumnya.

Ada dua macam frekuensi kumulatif, yaitu

frekuensi kumulatif "kurang dari" ("kurang dari" diambil terhadap tepi atas kelas);
frekuensi kumulatif "lebih dari" ("lebih dari" diambil terhadap tepi bawah kelas).

Tepi atas = batas atas + ½ satuan pengukuran

Tepi bawah = batas bawah - ½ satuan pengukuran

Contoh Soal 5

Dari Tabel 4. untuk interval kelas 46 – 55 (kelas 4), hitunglah

a. frekuensi relatif;

b. frekuensi kumulatif "kurang dari";

c. frekuensi kumulatif "lebih dari".

Penyelesaian 5

a. Frekuensi relatif kelas ke-4 = (frekuensi kelas ke-4 / banyak datum) x 100 % = 10/35 x 100% = 28,57%

b. Frekuensi kumulatif "kurang dari" untuk interval kelas 46 – 55

= 5 + 3 + 9 + 10 = 27 (kurang dari tepi atas kelas 55,5)

c. Frekuensi kumulatif "lebih dari" untuk interval kelas 46 – 55

= 10 + 6 + 2 = 18 (lebih dari tepi bawah kelas 45,5).

3.3. Histogram dan Poligon Frekuensi

Histogram merupakan diagram frekuensi bertangga yang bentuknya seperti diagram batang. Batang yang berdekatan harus berimpit. Untuk pembuatan histogram, pada setiap interval kelas diperlukan tepi-tepi kelas. Tepi-tepi kelas ini digunakan unntuk menentukan titik tengah kelas yang dapat ditulis sebagai berikut.

Titik tengah kelas = ½ (tepi atas kelas + tepi bawah kelas)

Poligon frekuensi dapat dibuat dengan menghubungkan titik-titik tengah setiap puncak persegipanjang dari histogram secara berurutan. Agar poligon "tertutup" maka sebelum kelas paling bawah dan setelah kelas paling atas, masing-masing ditambah satu kelas.

Contoh Soal 6

Tabel distribusi frekuensi hasil ujian matematika Kelas XI SMA Cendekia di Kalimantan Barat diberikan pada Tabel 6. Buatlah histogram dan poligon frekuensinya.

Tabel 6. Tabel distribusi frekuensi hasil ujian matematika Kelas XI SMA Cendekia di Kalimantan Barat

Kelas Interval	Frekuensi
21–30	2
31–40	3
41–50	11
51–60	20
61–70	33
71–80	24
81–90	7
	100

Jawaban 6

Gambar 4. Histogram hasil ujian matematika Kelas XI SMA Cendekia di Kalimantan Barat.

Dari histogram tersebut tampak bahwa kebanyakan siswa memperoleh nilai antara 60,5 dan 70,5. Coba Anda ceritakan hal lain dari histogram tersebut.

3.4. Ogive (Ogif)

Grafik yang menunjukkan frekuensi kumulatif kurang dari atau frekuensi kumulatif lebih dari dinamakan poligon kumulatif.

Untuk populasi yang besar, poligon mempunyai banyak ruas garis patah yang menyerupai kurva sehingga poligon frekuensi kumulatif dibuat mulus, yang hasilnya disebut ogif.

Ada dua macam ogif, yaitu sebagai berikut.

a. Ogif dari frekuensi kumulatif kurang dari disebut ogif positif.

b. Ogif dari frekuensi kumulatif lebih dari disebut ogif negatif.

Contoh Soal 7

Tabel 7. dan 8. berturut-turut adalah tabel distribusi frekuensi kumulatif "kurang dari" dan "lebih dari" tentang nilai ulangan Biologi Kelas XI SMA 3.

Tabel 7. Tabel distribusi frekuensi kumulatif "kurang dari" tentang nilai ulangan Biologi Kelas XI SMA 3.

Nilai	Frekuensi
< 20,5	0
< 30,5	2
< 40,5	5
< 50,5	16
< 60,5	36
< 70,5	69
< 80,5	93
< 90,5	100

Tabel 8. Tabel distribusi frekuensi kumulatif "lebih dari" tentang nilai ulangan Biologi Kelas XI SMA 3.

Nilai	Frekuensi
> 20,5	100
> 30,5	98
> 40,5	95
> 50,5	84
> 60,5	64
> 70,5	31
> 80,5	7
> 90,5	0

a. Buatlah ogif positif dan ogif negatif dari tabel tersebut.

b. Berapakah jumlah siswa yang mempunyai nilai Biologi kurang dari 85?

c. Berapakah jumlah siswa yang mempunyai berat badan lebih dari 40?

Pembahasan 8

a. Ogif positif dan ogif negatif dari tabel tersebut tampak pada gambar 5.

Gambar 5. Kurva ogif positif dan negatif nilai ulangan Biologi Kelas XI SMA 3.

b. Dari kurva ogif positif, tampak siswa yang mempunyai nilai kurang dari 85 adalah sebanyak 93 orang.

c. Dari kurva ogif negatif, tampak siswa yang mempunyai nilai lebih dari 40 adalah sebanyak 96 orang.

Human realities in the light of sociology , anthropology, and psychology

Aku rapopo

Selasa, 29 September 2015

Pengertian data dan cara menghimpun data